Salta al contenuto
AImpact
IT EN
Medio Modelli foundation · 1 min lettura

mT5: T5 multilingue su 101 lingue

In una frase Google Research pubblica mT5, una versione di T5 pre-addestrata su mC4 (Common Crawl multilingue) su 101 lingue, che diventa baseline standard per molti task NLP cross-lingual.

Verificato Fonte ufficiale
CondividiLinkedInX
Livello di lettura

T5 era un modello di Google noto per trasformare qualsiasi compito NLP in un problema "testo in entrata → testo in uscita". Ma era solo in inglese. Per chiunque lavori con altre lingue — italiano incluso — non era utilizzabile.

mT5 è la versione multilingue: lo stesso modello, ma addestrato su 101 lingue diverse, dall'arabo al vietnamita. Sa tradurre, riassumere, rispondere a domande in tutte queste lingue, e impara compiti specifici molto più velocemente di un modello monolingue.

Per chi sviluppa applicazioni che devono funzionare in più paesi senza riaddestrare un modello per ciascuno, è una svolta pratica.

Aziende

Google

Tool

mT5

Tag

GoogleT5mT5MultilingualText-to-Text

Fonti