Alto AI multimodale · 1 min lettura
Qwen2.5-VL: document understanding SOTA che supera GPT-4o su DocVQA
In una frase Alibaba rilascia Qwen2.5-VL in versione 72B e 7B, con analisi avanzata di PDF, tabelle e grafici, superando GPT-4o su DocVQA e stabilendo nuovi SOTA nella comprensione documentale.
Livello di lettura
Qwen2.5-VL è un modello specializzato nel leggere e capire documenti complessi: contratti, fatture, tabelle finanziarie, grafici scientifici. Non si limita a descriverli, ma risponde a domande specifiche sul loro contenuto con precisione superiore a GPT-4o. Disponibile in versione da 7 e 72 miliardi di parametri, è ottimizzato per aziende che devono automatizzare l'elaborazione di documenti. La versione 7B gira su hardware accessibile mantenendo qualità enterprise.
Aziende
Alibaba
Tool
Qwen2.5-VL, Qwen2.5-VL-72B, Qwen2.5-VL-7B
Tag
VLMDocument UnderstandingPDFTable ParsingSOTAAlibaba
Fonti