Salta al contenuto
AImpact
IT EN
Alto Modelli foundation · 1 min lettura

Falcon-180B: il modello open-source più grande al mondo nel 2023

In una frase Il Technology Innovation Institute rilascia Falcon-180B, il modello open-source più grande disponibile con 180 miliardi di parametri e 3,5 trilioni di token di training, che supera Llama 2 su tutta la linea.

Da rivedere Fonte ufficiale
CondividiLinkedInX
Livello di lettura

Per capire cosa rappresenta Falcon-180B, pensa a questo: GPT-3 — il modello che nel 2020 sembrava fantascienza — ha 175 miliardi di parametri. Falcon-180B ne ha 180 miliardi, ma a differenza di GPT-3, è completamente scaricabile e utilizzabile da chiunque.

Il modello è stato creato dal Technology Innovation Institute, un centro di ricerca degli Emirati Arabi Uniti, e si è posizionato al vertice della classifica pubblica dei modelli open-source su Hugging Face al momento del rilascio.

Per chi lavora con l'AI, avere accesso a un modello di questa dimensione senza dover pagare API esterne era impensabile fino a pochi mesi prima. Il prezzo da pagare: servono circa 400 GB di memoria GPU per farlo girare, quindi non è per tutti — ma apre comunque porte enormi per ricercatori e grandi aziende.

Aziende

TII

Tool

Tag

Falcon-180BTIIopen sourcelarge modelleaderboard

Fonti