Alto AI multimodale · 1 min lettura
IDEFICS: la prima replica open source di Flamingo
In una frase HuggingFace rilascia IDEFICS, replica open weight di Flamingo in versione 9B e 80B, addestrata su LAION-5B e WikiMedia con few-shot visual in-context learning.
Livello di lettura
Prima del 2023, i modelli capaci di ragionare su immagini e testo erano tutti chiusi e accessibili solo tramite API a pagamento. HuggingFace ha cambiato le regole pubblicando IDEFICS, il primo modello vision-language open weight di grandi dimensioni. IDEFICS imita Flamingo di DeepMind ma con dati pubblici: puoi mostrargli esempi di domande su immagini e lui capisce il pattern senza essere ri-addestrato. Chiunque può scaricarlo, modificarlo e costruirci sopra applicazioni proprie.
Aziende
HuggingFace
Tool
IDEFICS, IDEFICS-9B, IDEFICS-80B
Tag
VLMOpen SourceFew-Shot LearningVision-Language
Fonti