Recentemente, fui questionada sobre a conduta de uma determinada empresa que, antes da vigência do GDPR, disponibilizava toda a sua base de dados, de forma irrestrita, a quem fizesse apenas um simples cadastro em seu site. Os dados disponibilizados por esta empresa, eram dados fidedignos, pessoais, como nome, CPF, endereço, telefones, que continham os reais hábitos dos usuários, sendo, sem dúvidas, uma base de encher olhos daqueles que trabalham com marketing digital. Entretanto, após a vigência do GDPR, esta empresa passou a disponibilizar, de forma onerosa, apenas as preferências destes titulares, a região, o estado civil, o sexo e demais informações de interesse de diversos profissionais que utilizam essas bases para perfectibilização de seus serviços, mas sem nenhuma vinculação capaz de tornar aquele titular de dados identificado ou identificável. E a pergunta que me fizeram foi a seguinte: no âmbito da vigência da LGPD, eu tendo comprado estes dados desta empresa, sem haver a identificação do titular, isso infringiria a nossa legislação? A minha resposta foi negativa, pois esta é uma prática prevista na Lei Geral de Proteção de Dados, no art. 5°, XI. Através da anonimização, uma dado perde a possibilidade de associação direta ou indireta a um indivíduo. Além do mais, conforme dispõe o art.12 da LGPD, “Os dados anonimizados não serão considerados dados pessoais para os fins desta Lei”. Mas atenção, porque o mesmo dispositivo refere que se por meio de esforços razoáveis, puder haver a reversão desta anonimização, este dado passará a ser tratado como dado pessoal, sendo, então, alcançado pela legislação.
Muito se fala em anonimização de dados, mas na prática, pouco tem sido explicado aos usuários qual a sua finalidade e o benefício da anonimização.
A anonimização é uma técnica de processamento de dados capaz de modificar ou remover aquelas informações capazes de identificar um titular de dados. Por meio desta técnica, se obtém um dado anonimizado, que perde totalmente a sua vinculação à determinada pessoa, não podendo ser associada a nenhum indivíduo.
Por meio da anonimização de dados é viabilizada a criação de recursos seguros e muito valiosos, além de conferir uma proteção adequada à identidade dos usuários. Tais dados podem ser compartilhados com segurança, trazendo benefícios às empresas e/ou pessoas sem pôr em risco a privacidade do usuário.
Apenas a título exemplificativo, o Google utiliza duas técnicas para realizar a anonimização de dados, que abaixo transcrevo:
“Generalização dos dados
Alguns elementos de dados podem ser associados a certos indivíduos com mais facilidade. Para proteger essas pessoas, usamos a generalização para remover parte dos dados ou substituir alguma parte deles por um valor comum. Por exemplo, podemos usar a generalização para substituir segmentos de todos os códigos de área ou números de telefone pela mesma sequência de números.
A generalização nos permite alcançar o k-anonimato, um termo padrão do setor usado para descrever uma técnica que esconde a identidade dos indivíduos em um grupo de pessoas semelhantes. No k-anonimato, k é um número que representa o tamanho de um grupo. Se, para qualquer indivíduo do conjunto de dados, houver pelo menos k-1 indivíduos que tenham as mesmas propriedades, teremos alcançado o k-anonimato para esse conjunto de dados. Por exemplo, imagine um conjunto de dados específico em que k seja igual a 50 e a propriedade seja o CEP. Se observarmos qualquer pessoa desse conjunto de dados, sempre encontraremos 49 outras pessoas com o mesmo CEP. Portanto, não conseguiremos identificar nenhuma pessoa a partir do CEP dela.
Se todos os indivíduos de um conjunto de dados compartilham do mesmo valor de um atributo confidencial, informações confidenciais podem ser reveladas quando se sabe que essas pessoas fazem parte do conjunto de dados em questão. Para reduzir esse risco, podemos utilizar a l-diversidade, um termo padrão do setor usado para descrever algum nível de diversidade nos valores confidenciais. Por exemplo, imagine que um grupo de pessoas tenha pesquisado o mesmo tópico de saúde (por exemplo, sintomas da gripe), todas ao mesmo tempo. Se analisarmos esse conjunto de dados, não conseguiremos dizer quem pesquisou o tópico, graças ao k-anonimato. No entanto, ainda poderá haver alguma preocupação em relação à privacidade, uma vez que todos compartilham do mesmo atributo de confidencialidade (ou seja, o tópico da pesquisa). Com a l-diversidade, o conjunto de dados anonimizados não incluiria apenas pesquisas sobre a gripe, mas poderia incluir também outras pesquisas para proteger ainda mais a privacidade do usuário.
Adição de ruídos aos dados
A privacidade diferencial (outro termo padrão do setor) descreve uma técnica para adição de ruído matemático aos dados. Com a privacidade diferencial, é difícil determinar se um indivíduo faz parte de um conjunto de dados, porque o resultado de um algoritmo específico parecerá essencialmente o mesmo, independentemente de as informações dos indivíduos estarem incluídas ou omitidas. Por exemplo, imagine que estejamos medindo a tendência geral nas pesquisas sobre a gripe em uma região geográfica. Para alcançarmos a privacidade diferencial, adicionamos ruído ao conjunto de dados. Isso significa que podemos adicionar ou subtrair o número de pessoas que estão pesquisando sobre a gripe em uma área específica. Isso, no entanto, não afetaria nossa medição da tendência em uma região geográfica mais ampla. É importante notar também que a adição de ruído a um conjunto de dados pode torná-lo menos útil.
A anonimização é apenas um dos processos que usamos para manter nosso compromisso com a privacidade do usuário. Outros processos incluem controles rígidos do acesso a dados dos usuários, políticas para controlar e limitar a inclusão de conjuntos de dados que possam identificar usuários e a análise centralizada de estratégias de anonimização e governança de dados para garantir um nível consistente de proteção em todo o Google”. Fonte: https://policies.google.com/technologies/anonymization?hl=pt-BR