Alto AI multimodale · 1 min lettura
IDEFICS2: 8B multimodal open con OCR nativo su documenti PDF
In una frase HuggingFace lancia IDEFICS2, 8B parametri Apache 2.0, training nativo su PDF e OCR, gestione superiore del testo nelle immagini rispetto ai predecessori.
Livello di lettura
IDEFICS2 è il modello multimodal open source di HuggingFace, capace di capire testo e immagini insieme con soli 8 miliardi di parametri. La novità principale è l'addestramento nativo su documenti PDF e OCR — significa che legge il testo nelle immagini molto meglio dei modelli precedenti. È rilasciato con licenza Apache 2.0, quindi chiunque può usarlo anche per applicazioni commerciali senza restrizioni.
Aziende
HuggingFace
Tool
IDEFICS2, SigLIP, Mistral
Tag
IDEFICS2HuggingFaceOCRDocument UnderstandingOpen SourceApache 2.0
Fonti