Microsoft Presidio: anonimizzazione PII nei pipeline LLM
In una frase Microsoft Presidio raggiunge la disponibilità generale: framework open source per rilevare e anonimizzare dati personali nei testi elaborati da LLM, con NER e regex per 50+ tipi di entità.
Quando un'azienda usa un LLM per analizzare email, contratti o ticket di supporto, rischia di inviare dati personali dei clienti (nomi, codici fiscali, numeri di carta) a servizi cloud esterni. Questo è un problema serio per GDPR e normative sulla privacy.
Presidio è lo strumento di Microsoft per risolvere questo prima che i dati escano dal perimetro aziendale: intercetta il testo, identifica tutte le informazioni personali, le sostituisce con placeholder o dati sintetici, poi invia il testo "pulito" all'LLM.
Supporta oltre 50 tipi di entità sensibili, funziona in più lingue, ed è integrabile come middleware in qualsiasi pipeline che usa OpenAI, Azure OpenAI o altri modelli.
Aziende
Microsoft
Tool
Presidio, Azure, spaCy
Tag
Fonti