In pratica
Anche pochi documenti corrotti nel web crawl possono creare backdoor o bias persistenti. Particolarmente rischioso per modelli che si addestrano in continuo su contenuti pubblici o per fine-tuning su dataset di terzi non verificati.
Anche pochi documenti corrotti nel web crawl possono creare backdoor o bias persistenti. Particolarmente rischioso per modelli che si addestrano in continuo su contenuti pubblici o per fine-tuning su dataset di terzi non verificati.