A pseudonimização de dados foi, durante anos, uma zona cinzenta regulatória explorada pela indústria para reduzir a fricção do RGPD no tratamento de dados para fins de inteligência artificial. Uma decisão recente da autoridade francesa de proteção de dados (CNIL) e a retirada de uma proposta-chave do pacote Digital Omnibus pelo Conselho da União Europeia fecharam essa porta. Carina Branco, sócia da Morais Leitão, esteve presente no IAPP AI Governance Global Europe 2026, em Dublin, e analisa o que mudou e o que está em aberto.
Ao cabo do primeiro dia de Congresso, sob o título Pseudonymity and AI — The New Frontier of Responsible Data, Graham Doyle da DPC irlandesa, Monisha Varadan da Google e Claude-Etienne Armingaud da Latournerie Wolfrom deram o ritmo a uma sala ansiosa por perceber se o chão regulatório estaria ou não prestes a mover-se debaixo dos nossos pés.
O Conselho da União Europeia eliminou do pacote Digital Omnibus a proposta de definição "relativa" de dados pessoais, que teria permitido que dados pseudonimizados transferidos a terceiros sem acesso às chaves, saíssem do perímetro do Regulamento Geral de Proteção de Dados (RGPD) para efeitos de treino de Inteligência Artificial (IA).
A indústria vinha alimentando a esperança nesta válvula de escape, mas a CNIL, uma semana antes desta conferência, já reforçara a retirada Omnibus ao sancionar1 a IQVIA OPERATIONS FRANCE, filial do grupo IQVIA, num processo em que se usara a pseudonimização como argumento de desvio ao RGPD2.
O comité restrito da CNIL refutou a tese da visada essencialmente por duas ordens de razão:
Em primeiro lugar, a CNIL rejeitou os argumentos de anonimidade relativa3 que assenta na lógica de que os dados pseudonimizados, transferidos a um destinatário sem acesso às chaves e sem meios realistas e legais de reverter a identidade, podem ser tratados como anónimos. A CNIL considerou que a IQVIA tinha recursos e meios para a reidentificação, pelo que a anonimidade se quebrou e os dados devem ser considerados pessoais ao longo da cadeia de tratamento.
O critério da mera inacessibilidade das “chaves” para a reidentificação, no sentido de que elas tinham que estar separadas e protegidas para que os dados continuassem a poder a ser manipulados como anónimos perdeu densidade.
Em segundo lugar, verificou-se que os identificadores únicos permitiam seguir percursos longitudinais de saúde e que, o cruzamento dos dados clínicos com tabelas públicas tornava a reidentificação possível com recurso a modelos e sistemas de Inteligência Artificial facilmente acessíveis à IQVIA.
A decisão da CNIL não é apenas mais uma, é uma decisão de referência e vale a pena perceber porquê em quatro pontos concretos.
Primeiro: rejeitou expressamente a tentativa de instrumentalização do acórdão SRB do TJUE como “escudo de proteção” ao RGPD. A IQVIA tentou usar jurisprudência europeia para sair do perímetro regulatório, mas o comité restrito fechou-lhe essa porta com precisão cirúrgica.
Segundo: aplicou o teste de reidentificabilidade de forma rigorosa e contextual, avaliando os meios concretos disponíveis, os dados efetivamente recolhidos e as fontes externas acessíveis.
Terceiro: confirmou a responsabilidade pela falta de prestação de informação ao longo de toda a cadeia de tratamento de dados, independentemente de existir ou não subcontratação ou co-responsabilidade no tratamento. Neste caso, as farmácias não informavam os clientes e a IQVIA foi considerada responsável por isso.
Quarto: sancionou a ausência de privacy by design a nível do software, designadamente, a falta de autenticação multifator no armazém EMR, que deveria ter sido endereçada desde a conceção e por defeito.
Desta decisão, impõe-se a calibragem de um conjunto de elementos-chave em todos os sistemas de privacidade:
- Políticas de privacidade. Todas as potenciais categorias de destinatários, incluindo para dados pseudonimizados, têm de ser claramente identificadas.
- Acordos de tratamento de dados. Todos os ATD devem reflectir correctamente o tratamento dos dados pseudonimizados como dados pessoais.
- Retenção de responsabilidade na subcontratação independentemente de pseudonimização. Mesmo que o destinatário não consiga reidentificar os titulares, o responsável pelo tratamento mantém a obrigação de os informar sobre a partilha de dados porque, para si (Responsável), os dados continuam a ser pessoais.
- Transferências em cascata. Se um subcontratante ou subcontratante ulterior tiver/em meios razoáveis para a reidentificação, os dados tornam-se pessoais também para si, expondo o responsável pelo tratamento que os colocou em circulação.
Aqui chegados.
A pseudonimização foi, durante anos, o escudo técnico que permitia invocar uma zona cinzenta que permitia tratar dados com menos fricção regulatória. O Conselho da UE retirou essa saída legislativa, a CNIL sancionou e o painel das 16h do dia 3 de junho em Dublin, deixou os novos ângulos de abordagem para o problema da reidentificação.
O raciocínio da CNIL não visou uma particular fragilidade técnica da IQVIA e isso é tanto mais preocupante quanto o facto de que só em França, o portal esante.gouv.fr contabilizava, em setembro de 2025, 125 armazéns de dados de saúde autorizados4, geridos por 102 operadores distintos, editores farmacêuticos, organismos de investigação pública, plataformas de seguros e estruturas hospitalares, todos eles assentes em processos e técnicas muito semelhantes às usadas pela IQVIA (incluindo a pseudonimização dos dados).
O regulador francês força agora a todo um reposicionamento da técnica da pseudonimização, que se manterá imperativa, como medida técnica de segurança, até porque continua a reduzir superfície de ataque, mas deixará de poder constituir por si só um argumento bastante para que os operadores económicos possam sair do perímetro do RGPD. Numa era de IA em que o custo da reidentificação baixou consideravelmente e a tecnologia permite-a, com razoável facilidade, o foco do regulador transita para outros mecanismos de potenciação de privacidade, como os PET— Privacy Enhancing Technologies, que tornam (por ora) a reidentificação “razoavelmente improvável".
Os PETs parecem ser a resposta técnica para garantir o desejado escudo jurídico ao RGPD porque, ao invés de “mascararem” a identidade por substituição de um identificador, atacam o problema pela raiz, garantindo que a identidade não pode ser reconstruída, mesmo por quem tem capacidade computacional e acesso a fontes externas. O painel em Dublin foi preciso sobre os critérios que definem se um PET será ou não suficiente para servir de barómetro de anonimato, sendo a resposta positiva se (i) estivermos diante de uma despesa computacional proibitiva para reidentificar, (ii) se existir impossibilidade prática de reidentificação e (iii) existir robustez contra ataques de inferência futura.
Ora, este último critério é onde a tensão se torna estrutural porque, não só a robustez é técnica e objetivamente impossível de garantir ao longo do tempo, sem vicissitudes, como o “futuro” tecnológico nunca foi tão difícil de antever. Os modelos de amanhã serão mais capazes do que os de hoje e ninguém sabe exatamente para onde irão, sendo que, a breve história da IA já nos mostrou que nesta matéria nunca existiram (e nem existem) soluções sem desafio. Por exemplo, durante algum tempo acreditou-se que treinar modelos sem ver os dados, ou adicionar ruído que tornasse a extração individual impossível era suficiente e estes mecanismos foram sendo apresentados como resposta ao problema da reidentificação em contextos de IA.
Hoje sabemos que esses processos não entregaram o que prometeram.
Os modelos de linguagem de grande escala treinados com differential privacy revelaram uma tensão irresolvida entre a garantia da privacidade pelo ruído introduzido e a utilidade do modelo. O parâmetro epsilon (que mede o grau de proteção) não tem ainda um valor de referência aceite regulatoriamente mas sabemos que um epsilon baixo protege bem, mas degrada o modelo, ao passo que um epsilon alto preserva a utilidade, mas oferece proteção marginal. A federated learning, por sua vez, revelou-se vulnerável a ataques que conseguem reconstruir dados de treino a partir dos gradientes partilhados durante o processo de aprendizagem. O modelo nunca viu os dados diretamente, mas os gradientes que produziu contêm informação suficiente para ele os reconstruir. Por último, a geração de dados sintéticos (synthetic data) enfrenta o problema da reidentificação provável por inferência; ou seja, é possível determinar, com graus significativos de confiança, se um determinado indivíduo estava ou não incluído no conjunto (substrato) de dados original dos dados sintéticos.
Portanto, os PETs podem ser uma direção certa agora para responder à rigidez do critério regulatório de "robustez contra ataques de inferência futura", tal como a pseudonimização permitiu durante algum tempo que os dados pudessem transitar sem reidentificação acessível e fácil, mas a questão que fica em aberto é saber se a resposta aos desafios da reidentificação pode ser apenas técnica.
O Comité Europeu para a Proteção de Dados (CEPD) está neste momento a finalizar orientações atualizadas sobre dados pseudonimizados, mas a velocidade da tecnologia não respeita calendários regulatórios. O que hoje é computacionalmente robusto, amanhã pode ser trivialmente reversível e o que hoje é considerado "razoavelmente improvável", amanhã pode ser considerado rotineiro.
A promessa dos PETs assenta, em parte, na mesma lógica que enfraqueceu a pseudonimização; i.e. a dificuldade técnica do momento, equivale a uma garantia jurídica duradoura; sendo que, ao criarem uma falsa sensação de segurança, os PETs podem vir a incentivar uma maior recolha e partilha de dados, acabando por minar os próprios princípios de minimização que o RGPD propõe, por um lado, e contribuindo para um agravamento do risco comportamental no ambiente digital, por outro.
Se os operadores económicos adotarem os PETs com a mesma lógica com que instrumentalizaram a pseudonimização, o ciclo repetir-se-á, apenas com um vocabulário mais sofisticado e uma fase de graça regulatória mais curta.
Colocando tudo em perspetiva, o que Dublin tornou inequívoco é que o regulador europeu já não aceita que a conformidade seja uma questão de perímetro desenhado à volta das chaves de desencriptação, nem à volta dos gradientes partilhados, nem à volta dos conjuntos de dados sintéticos. O perímetro segue os dados e seguirá os dados qualquer que seja a técnica que os mascare. A posição conjunta do Comité Europeu para a Proteção de Dados e do Supervisor Europeu de Proteção de Dados no contexto do Digital Omnibus é de que a definição de dados pessoais deve dizer o que os dados pessoais são e não o que deixam de ser em resultado de uma técnica ou de uma arquitetura de tratamento. O ecossistema regulatório parece exigir uma mudança de postura, em que a privacidade não é um obstáculo a contornar, mas um atributo a construir desde a conceção e por defeito. A pergunta relevante deixa de ser "como posso sair do RGPD?" para passar a ser "como posso garantir que a identidade das pessoas não pode ser reconstruída nos processos de negócio que uso?"
A frase “a sua privacidade é muito importante para nós” (presente em tantas políticas de privacidade de operadores económicos em todos os segmentos do mercado) poderá ter ganho agora outra materialidade e significância.
NOTA FINAL.:
Este artigo foi escrito em colaboração com dois sistemas de inteligência artificial — Legora e Claude (Anthropic, Sonnet 4.6)
A ironia não escapou a nenhum de nós: um artigo sobre os limites da pseudonimização e os riscos dos modelos de IA foi produzido com dois modelos de IA, num processo que gerou dados de interação que algures serão, provavelmente, pseudonimizados.
_________________________________________________________________
1 Em 5 (cinco) milhões de euros.
2 A IQVIA OPERATIONS FRANCE operava dois armazéns de dados autorizados pela própria CNIL; (i) o LRX, alimentado por cerca de 14.000 farmácias, e (ii) o EMR, alimentado por vários milhares de médicos. Os dados que consistiam em largos volumes de diagnósticos, sintomas, alergias, prescrições e baixas médicas estavam associados a um identificador único por paciente, que permitia seguir o percurso de cuidados de saúde cada indivíduo. A IQVIA, que anteriormente se posicionara como entidade responsável pelo tratamento e até tinha obtido autorização da CNIL para os tratar, instada na era RGPD sobre o cumprimento dos seus deveres de informação aos titulares (entre outros), apresentou a tese de que os dados eram agora anónimos (por força da pseudonimização) e portanto, o RGPD não se lhes aplicava.
3 Cfr. Linha argumentativa presente no acórdão SRB do TJUE (C-413/23, setembro de 2025) que, embora diga respeito ao Regulamento 2018/1725 aplicável às instituições da UE, o TJUE afirmou expressamente ter equivalência interpretativa. Vale, por analogia, para responsáveis pelo tratamento e subcontratantes no sector privado, designadamente para efeitos do Art. 13.º, n.º 1, alínea e) do RGPD relativa à obrigação de informação sobre destinatários dos dados.
4 Pela própria CNIL