Salta al contenuto
AImpact
IT EN
Medio Sicurezza AI · 1 min lettura

Microsoft Presidio: anonimizzazione PII nei pipeline LLM

In una frase Microsoft Presidio raggiunge la disponibilità generale: framework open source per rilevare e anonimizzare dati personali nei testi elaborati da LLM, con NER e regex per 50+ tipi di entità.

Verificato Fonte ufficiale
CondividiLinkedInX
Livello di lettura

Quando un'azienda usa un LLM per analizzare email, contratti o ticket di supporto, rischia di inviare dati personali dei clienti (nomi, codici fiscali, numeri di carta) a servizi cloud esterni. Questo è un problema serio per GDPR e normative sulla privacy.

Presidio è lo strumento di Microsoft per risolvere questo prima che i dati escano dal perimetro aziendale: intercetta il testo, identifica tutte le informazioni personali, le sostituisce con placeholder o dati sintetici, poi invia il testo "pulito" all'LLM.

Supporta oltre 50 tipi di entità sensibili, funziona in più lingue, ed è integrabile come middleware in qualsiasi pipeline che usa OpenAI, Azure OpenAI o altri modelli.

Aziende

Microsoft

Tool

Presidio, Azure, spaCy

Tag

MicrosoftPresidioPIIAnonymizationData PrivacyNER

Fonti