O que é dark data? Dark data são aqueles dados que a empresa nem sabe que existem. São informações comerciais, judiciais, por exemplo, coletadas, processadas e armazenadas durante atividades regulares, mas que geralmente não são usadas para outros fins (por exemplo, análises, relações comerciais e monetização direta) e muitas vezes compreendem a maioria dos ativos de informações das organizações. Armazenar e proteger esses dados significa mais despesa (e às vezes maior risco) do que valor.

Na verdade, segundo uma pesquisa da Access, mesmo entre arquivos puramente digitais, de 70% a 80% das informações são na verdade arquivos ROT (redundantes, obsoletos ou triviais). Portanto, apenas 20 a 30% de suas informações são um registro ativo – algo que você precisará manter como referência ou como um arquivo de trabalho.

Assim, grande parte – se não a maioria – das informações que sua organização armazena pode ser chamada de dark data. Isso ocorre porque, por mais úteis que sejam os dados, a maioria das informações que costumamos ter é simplesmente uma garantia, pois sentimos a necessidade de armazená-las caso seja necessário provar que algo ocorreu no passado, mas são quase totalmente obsoletas para qualquer outro uso.

Sem classificação adequada, indexada a partir de um eficiente sistema de gestão documental, é impossível armazenar dados com segurança, porque você nem mesmo definiu o que é e quem tem – ou deveria ter – acesso a eles. Ao classificar os dados, você pode começar a criar e aplicar processos para manipulá-los, incluindo a capacidade de criptografá-los e armazená-los com segurança de uma maneira que atenda às suas necessidades.

Os riscos do dark data

Existem três maneiras principais pelas quais os dark data representam riscos para os negócios:

Maior superfície de ataque – Quanto mais dados você armazenar, mais deverá proteger – localmente e na nuvem – e maior será o risco potencial de ocorrer uma violação. Esse é especialmente o caso dos dark data não categorizados ou, pior ainda, completamente inexplicáveis e talvez nem protegidos. Você pode não achar que exista algo “importante” contido nesses arquivos digitais antigos e empoeirados, mas um hacker bisbilhotando os cantos esquecidos da sua rede pode descobrir informações de identificação pessoal importantes, informações de pagamento de clientes ou informações comerciais confidenciais.

Potenciais violações de conformidade – Se seus dark data contiverem, por exemplo, um documento do Word com informações médicas dos funcionários ou um arquivo do Excel com informações de pagamento do cliente, sua organização poderá estar violando regulamentos como a futura LGPD. Infelizmente, muitas empresas não sabem que esses dados estão em suas redes e falham em protegê-los. No caso de uma violação, os invasores se concentram nesse conteúdo e os reguladores exigem respostas. Independentemente do setor em que você esteja, auditores ou equipe de conformidade inevitavelmente aparecerão para garantir que você esteja tomando as medidas de segurança apropriadas. Não espere até que esse dia chegue para tomar uma ação. Em vez disso, converse com as pessoas certas e conte com as ferramentas certas para eliminar pontos cegos e criar uma postura que defenda adequadamente todos os seus dados.

Perda de inteligência de mercado – Sua organização também pode estar perdendo algumas grandes oportunidades, permitindo que dark data se acumule constantemente em seu banco de dados. Juntamente com informações extremamente confidenciais que podem ser potencialmente prejudiciais no caso de uma violação, provavelmente haverá muito potencial inexplorado dentro dessa massa de informações. Assim como acontece com o acumulador e sua superabundância de coisas inúteis, é difícil para sua empresa encontrar informações que possam ser realmente valiosas em meio a uma enorme massa de dados legados não estruturados.

O custo do dark data

Atualmente, estamos vivendo um cenário em que a privacidade e a segurança dos dados são questões realmente críticas para qualquer organização, seja uma empresa, uma organização sem fins lucrativos ou uma agência governamental; mas todos esses problemas começam com uma perda de controle e conjuntos de dark data.

O que há em um conjunto de dark data? Esse é o problema: você não sabe – e é mais do que provável que seja totalmente composto por ROT. Isso deve ser uma preocupação para todas as organizações, porque há problemas de regulamentação, conformidade e privacidade esperando para acontecer – isso se ainda não tiverem ocorrido. Além disso, ter todas essas informações disponíveis significa que, se você estiver no processo de descoberta legal, poderá ser forçado a produzir esses dados. Produzi-lo é metade do problema: a outra metade está realmente em o encontrar, e os custos da descoberta eletrônica continuam a crescer. O ROT ofusca informações úteis, e as principais organizações podem gastar cerca de US$ 2.000 por gigabyte apenas procurando informações.

Esse problema pode ser resolvido com a implantação de um sistema de gestão documental, que vai identificar e indexar todas as informações existentes na sua empresa, as categorizando por prioridade para os negócios, confidencialidade e avaliando o seu ciclo de vida. Assim, a empresa passa a ter conhecimento das informações e pode as utilizar para gerar valor.