Yi-34B: modello bilingue EN/ZH nella top-3 open weight di novembre 2023
In una frase 01.ai di Kai-Fu Lee pubblica Yi-34B: 34B parametri addestrati su 3.1T token, architettura Llama-2 modificata, bilingue EN/ZH, top-3 open weight a novembre 2023.
Yi-34B è un modello linguistico creato dalla startup 01.ai fondata da Kai-Fu Lee, una delle figure più note dell'AI in Cina. Il modello supporta sia inglese che cinese a livello elevato, cosa che pochi modelli open weight riuscivano a fare nel 2023.
È stato addestrato su 3.1 trilioni di token, molto più di LLaMA-2, e quando è uscito si è posizionato tra i tre migliori modelli open weight esistenti.
Yi ha segnato un momento importante: la dimostrazione che le startup cinesi potevano competere con i laboratori occidentali nella ricerca sui foundation model.
Aziende
01.ai
Tool
Yi-34B
Tag
Fonti