Falcon-180B: il modello open-source più grande al mondo nel 2023
In una frase Il Technology Innovation Institute rilascia Falcon-180B, il modello open-source più grande disponibile con 180 miliardi di parametri e 3,5 trilioni di token di training, che supera Llama 2 su tutta la linea.
Per capire cosa rappresenta Falcon-180B, pensa a questo: GPT-3 — il modello che nel 2020 sembrava fantascienza — ha 175 miliardi di parametri. Falcon-180B ne ha 180 miliardi, ma a differenza di GPT-3, è completamente scaricabile e utilizzabile da chiunque.
Il modello è stato creato dal Technology Innovation Institute, un centro di ricerca degli Emirati Arabi Uniti, e si è posizionato al vertice della classifica pubblica dei modelli open-source su Hugging Face al momento del rilascio.
Per chi lavora con l'AI, avere accesso a un modello di questa dimensione senza dover pagare API esterne era impensabile fino a pochi mesi prima. Il prezzo da pagare: servono circa 400 GB di memoria GPU per farlo girare, quindi non è per tutti — ma apre comunque porte enormi per ricercatori e grandi aziende.
Aziende
TII
Tool
—
Tag
Fonti