*Gustavo Leite
Se procurarmos no dicionário sinônimos para perecer, encontraremos expressões como morrer, sucumbir, extinguir, apodrecer ou rott, no inglês. Da ideia de perecer, estragar um dado é que nasceu o conceito de ROT, acrônimo usado para definir algo igualmente ruim no gerenciamento de dados corporativos: dados redundantes, obsoletos e triviais.
Assim como alimentos estragam por falta de consumo (uso) com o tempo, os dados ROT são o resultado do mal uso das boas práticas de gerenciamento de dados. E você sabia que até um terço dos dados corporativos podem ser considerados ROT (e outros 52% são dados com valor desconhecido, onde ao menos uma parte deles pode entrar nesse conceito).
Vamos explorar brevemente cada categoria de dados ROT:
• Dados redundantes: a redundância de dados é uma coisa boa. Na verdade, é uma parte fundamental da regra 3-2-1-1 de backup e recuperação de dados:
- Mantenha pelo menos três cópias de seus dados em locais diferentes.
- Use pelo menos dois meios de armazenamento distintos.
- Armazene pelo menos uma cópia de seus dados externamente.
- Mantenha pelo menos uma cópia de seus dados em armazenamento imutável.
Mas os dados redundantes de que estamos falando aqui são diferentes – são dados duplicados desnecessários que, portanto, não têm valor. Por exemplo, várias cópias idênticas da planilha de um funcionário que ele salvou na rede corporativa, todas as quais também são copiadas desnecessariamente em cada um dos três backups fundamentais descritos na regra 3-2-1-1.
- Dados obsoletos: há motivos para salvar dados que podem não estar mais em uso. O mais óbvio deles são as regras e regulamentos de conformidade de dados que estipulam que certos tipos de dados devem ser armazenados por determinados períodos, mesmo que não sejam mais necessários para as operações diárias. Mas nem todos os dados se encaixam nessa categoria. Na verdade, a maioria não. Esses dados — dados que não são mais necessários porque foram substituídos por informações atualizadas e não têm valor legal — são dados obsoletos.
- Dados triviais: como o nome indica, dados triviais são informações que simplesmente não são importantes. Não tem nenhum valor quanto ao conhecimento corporativo, visão de negócios ou manutenção de registros. Muitas mensagens instantâneas, vídeos de gatinhos em todos os lugares, por exemplo.
Os dados ROT são ruins por vários motivos, incluindo:
- Aumento dos riscos de segurança de dados: quanto mais dados desnecessários você tiver, mais difícil será proteger o que realmente importa contra ameaças como ransomware e outras violações de dados.
- Maior conformidade de dados e riscos de governança: os dados ROT geralmente não estão em conformidade com as regras e regulamentos que determinam que certos tipos de dados devem ser excluídos após determinados períodos de tempo.
- Maior risco de responsabilidade: os dados mantidos além do período de retenção exigido podem ser usados contra sua organização em processos legais e financeiros.
- Produtividade reduzida: os dados ROT dificultam que os funcionários encontrem as informações de que precisam para realizar seus trabalhos com eficiência e eficácia.
Mas a razão pela qual eu realmente gostaria de focar aqui é a sua linha de fundo. Os dados ROT são uma fonte significativa de custos excessivos de armazenamento. Tradicionalmente, esse era um problema que as empresas enfrentavam em seus próprios datacenters, pois precisavam adicionar mais infraestrutura física. Mas, à medida que os dados baseados em nuvem — especialmente os dados nos complexos ambientes multinuvem encontrados na maioria das empresas atuais — ultrapassam a quantidade de dados que as empresas estão armazenando no local, também está se tornando cada vez mais problemático na nuvem.
Na verdade, uma pesquisa recente sugere que 94% das organizações não estão conseguindo cumprir seus orçamentos de nuvem, gastando em média 43%. E no que eles estão gastando demais na nuvem? Você adivinhou: o armazenamento, incluindo backup e recuperação, é o número um na lista.
Uma grande parte disso é que as ferramentas fornecidas pelos provedores de serviços em nuvem (CSPs) para ajudar a reduzir os dados ROT simplesmente não estão à altura da tarefa – isso simplesmente não é a principal prioridade de um CSP. A principal prioridade deles é vender mais armazenamento em nuvem, não menos. Não estou sugerindo que eles estejam ignorando nefastamente o fato de que você está colocando muitos dados ROT em seus servidores, pelos quais eles podem cobrar, mas eles certamente não têm o incentivo mais forte para colocar a pesquisa e o desenvolvimento para criar as ferramentas robustas de gerenciamento de dados que você precisa para reduzir seus dados ROT.
A primeira etapa é criar uma taxonomia de dados ou sistema de classificação – um conjunto de definições, rótulos e grupos para organizar seus dados baseados em nuvem. Isso ajudará você a identificar seus dados ROT.
Como parte disso, estabeleça um local de fonte única de verdade (SSOT) para cada categoria de seus dados na nuvem, onde a versão “certa” de cada ativo de dados é salva, reduzindo a chance de existirem versões ROT em outro lugar na nuvem.
Em seguida, defina políticas para gerenciar os dados ROT que você identificou – regras e procedimentos para removê-los da nuvem.
Por fim, lembre-se de que este é um processo iterativo – atualize continuamente sua taxonomia de dados, gerencie sua localização SSOT continuamente para garantir que esteja sendo usado adequadamente e execute regularmente suas políticas de dados ROT com os procedimentos que você estabeleceu para se livrar isto.
Se tudo isso parece complexo e tedioso, é porque é. Na verdade, a maneira mais fácil de fazer tudo é estender sua plataforma de gerenciamento de dados corporativos existente para seus ambientes de nuvem para classificar autonomamente seus dados baseados em nuvem, desduplicar seus dados redundantes desnecessários na nuvem e arquivar ou excluir seus dados de nuvem obsoletos e triviais.
Em conclusão, os dados ROT são ruins. E os mesmos problemas que isso pode causar em seu datacenter também existem na nuvem. Alguns deles podem até ser piores na nuvem, onde o controle de custos pode ser muito mais difícil. Se a redução de dados ROT onde quer que estejam – no local e na nuvem – fosse um processo manual fácil, você provavelmente não teria nenhum, mas posso garantir que tem. As ferramentas adequadas ajudarão você a reduzir os custos de nuvem associados aos dados ROT, além de simplificar o gerenciamento geral de dados e aumentar a proteção de dados na nuvem.
*Gustavo Leite é vice-presidente para América Latina da Veritas Technologies