Livello di lettura
Flamingo è un modello creato da DeepMind che capisce sia testo che immagini insieme. La cosa straordinaria è che riesce a rispondere a domande su immagini o descriverle mostrando solo pochi esempi, senza dover essere ri-addestrato da capo. È stato il primo modello a raggiungere risultati all'avanguardia su benchmark visivi usando pochissimi esempi dimostrativi. Ha aperto la strada ai moderni assistenti multimodali.
Aziende
DeepMind
Tool
Flamingo
Tag
Visual Language ModelFew-Shot LearningVQAImage CaptioningDeepMind
Fonti