LGPD e LLMs: o que muda quando o modelo "vê" o dado
Self-hosting, redaction, anonimização semântica. Mapa prático para sair da incerteza jurídica e ter um sistema rodando dentro da lei.
Quando o modelo é o seu, a LGPD se aplica como sempre se aplicou. Quando o modelo é de terceiros e processa dado pessoal do seu cliente, a coisa muda. Listamos as três decisões que valem dinheiro de verdade.
Decisão 1 — Onde o modelo roda
Modelo via API pública não é proibido por si. É proibido sem o contrato e o controle certos. Self-hosting de open weights elimina parte do problema, mas adiciona custo operacional. Hibrido — sensível em casa, geral na nuvem — costuma ser o caminho.
Decisão 2 — O que o modelo vê
Redaction antes da chamada cobre 80% dos casos. Para os 20% restantes, anonimização semântica via embeddings ou substituição por tokens preserva utilidade sem expor dados. Vale o investimento.
Decisão 3 — O que fica registrado
Logging de prompt e resposta vira novo banco de dado pessoal. Precisa de retenção, controle de acesso e direito ao esquecimento iguais aos do banco original. Quase nenhum projeto trata isso direito no início.