Salta al contenuto
AImpact
IT EN
Alto AI multimodale · 1 min lettura

Qwen2.5-VL: document understanding SOTA che supera GPT-4o su DocVQA

In una frase Alibaba rilascia Qwen2.5-VL in versione 72B e 7B, con analisi avanzata di PDF, tabelle e grafici, superando GPT-4o su DocVQA e stabilendo nuovi SOTA nella comprensione documentale.

Verificato Fonte ufficiale
CondividiLinkedInX
Livello di lettura

Qwen2.5-VL è un modello specializzato nel leggere e capire documenti complessi: contratti, fatture, tabelle finanziarie, grafici scientifici. Non si limita a descriverli, ma risponde a domande specifiche sul loro contenuto con precisione superiore a GPT-4o. Disponibile in versione da 7 e 72 miliardi di parametri, è ottimizzato per aziende che devono automatizzare l'elaborazione di documenti. La versione 7B gira su hardware accessibile mantenendo qualità enterprise.

Aziende

Alibaba

Tool

Qwen2.5-VL, Qwen2.5-VL-72B, Qwen2.5-VL-7B

Tag

VLMDocument UnderstandingPDFTable ParsingSOTAAlibaba

Fonti