Salta al contenuto
AImpact
IT EN
Alto AI multimodale · 1 min lettura

IDEFICS2: 8B multimodal open con OCR nativo su documenti PDF

In una frase HuggingFace lancia IDEFICS2, 8B parametri Apache 2.0, training nativo su PDF e OCR, gestione superiore del testo nelle immagini rispetto ai predecessori.

Verificato Fonte ufficiale
CondividiLinkedInX
Livello di lettura

IDEFICS2 è il modello multimodal open source di HuggingFace, capace di capire testo e immagini insieme con soli 8 miliardi di parametri. La novità principale è l'addestramento nativo su documenti PDF e OCR — significa che legge il testo nelle immagini molto meglio dei modelli precedenti. È rilasciato con licenza Apache 2.0, quindi chiunque può usarlo anche per applicazioni commerciali senza restrizioni.

Aziende

HuggingFace

Tool

IDEFICS2, SigLIP, Mistral

Tag

IDEFICS2HuggingFaceOCRDocument UnderstandingOpen SourceApache 2.0

Fonti