Sicurezza Intermedio Anche noto come: Avvelenamento dei dati

Data poisoning

Attacco in cui un avversario inserisce esempi malevoli nel dataset di addestramento per alterare il comportamento del modello finale.

CondividiLinkedIn X

In pratica

Anche pochi documenti corrotti nel web crawl possono creare backdoor o bias persistenti. Particolarmente rischioso per modelli che si addestrano in continuo su contenuti pubblici o per fine-tuning su dataset di terzi non verificati.

Termini collegati

Backdoor attack Fine-tuning Red teaming

Visto in azione

2 voci che lo citano

6 agosto 2024

NIST AI 600-1: profilo di rischio specifico per l'AI generativa

Medio
6 febbraio 2024

Indirect Prompt Injection: il vettore di attacco nei sistemi RAG e agenti AI

Alto

← Tutti i termini