Conteúdo·Regulação·20 Jan 2026·9 min

LGPD e LLMs: o que muda quando o modelo "vê" o dado

Self-hosting, redaction, anonimização semântica. Mapa prático para sair da incerteza jurídica e ter um sistema rodando dentro da lei.

Quando o modelo é o seu, a LGPD se aplica como sempre se aplicou. Quando o modelo é de terceiros e processa dado pessoal do seu cliente, a coisa muda. Listamos as três decisões que valem dinheiro de verdade.

Decisão 1 — Onde o modelo roda

Modelo via API pública não é proibido por si. É proibido sem o contrato e o controle certos. Self-hosting de open weights elimina parte do problema, mas adiciona custo operacional. Hibrido — sensível em casa, geral na nuvem — costuma ser o caminho.

Decisão 2 — O que o modelo vê

Redaction antes da chamada cobre 80% dos casos. Para os 20% restantes, anonimização semântica via embeddings ou substituição por tokens preserva utilidade sem expor dados. Vale o investimento.

Decisão 3 — O que fica registrado

Logging de prompt e resposta vira novo banco de dado pessoal. Precisa de retenção, controle de acesso e direito ao esquecimento iguais aos do banco original. Quase nenhum projeto trata isso direito no início.

LGPD para LLM não é diferente da LGPD para qualquer sistema. É só novo, então parece diferente.

LGPD e LLMs: o que muda quando o modelo "vê" o dado

Decisão 1 — Onde o modelo roda

Decisão 2 — O que o modelo vê

Decisão 3 — O que fica registrado

Pronto para tirar a sua IA do laboratório e colocar em produção?