Salta al contenuto
AImpact
IT EN
Alto AI multimodale · 1 min lettura

InternVL 2.5: 78B open source che batte GPT-4V su OCR e matematica

In una frase Shanghai AI Lab rilascia InternVL 2.5 da 78B parametri con Apache 2.0, SOTA su MathVista, OCRBench e ChartQA, superando GPT-4V su numerosi benchmark multimodali.

Verificato Fonte ufficiale
CondividiLinkedInX
Livello di lettura

InternVL 2.5 è il VLM open source più capace al suo rilascio: 78 miliardi di parametri con licenza Apache 2.0, che significa libero per uso commerciale. Batte GPT-4V su test di matematica visiva, lettura di testi in immagini e comprensione di grafici e tabelle. Per la prima volta un modello open weight supera i migliori modelli proprietari su più benchmark contemporaneamente, dimostrando che l'open source può competere al massimo livello nell'AI multimodale.

Aziende

Shanghai AI Lab

Tool

InternVL 2.5, InternVL2.5-78B

Tag

VLMSOTAMathOCRChart UnderstandingOpen Source

Fonti