mT5: T5 multilingue su 101 lingue
In una frase Google Research pubblica mT5, una versione di T5 pre-addestrata su mC4 (Common Crawl multilingue) su 101 lingue, che diventa baseline standard per molti task NLP cross-lingual.
T5 era un modello di Google noto per trasformare qualsiasi compito NLP in un problema "testo in entrata → testo in uscita". Ma era solo in inglese. Per chiunque lavori con altre lingue — italiano incluso — non era utilizzabile.
mT5 è la versione multilingue: lo stesso modello, ma addestrato su 101 lingue diverse, dall'arabo al vietnamita. Sa tradurre, riassumere, rispondere a domande in tutte queste lingue, e impara compiti specifici molto più velocemente di un modello monolingue.
Per chi sviluppa applicazioni che devono funzionare in più paesi senza riaddestrare un modello per ciascuno, è una svolta pratica.
Aziende
Tool
mT5
Tag
Fonti