Salta al contenuto
AImpact
IT EN
Medio AI multimodale · 1 min lettura

SmolVLM: la famiglia VLM 256M-2B per dispositivi edge

In una frase HuggingFace rilascia SmolVLM, famiglia di VLM da 256M a 2B parametri con supporto multi-immagine, video e OCR, Apache 2.0, ottimizzata per deployment edge.

Verificato Fonte ufficiale
CondividiLinkedInX
Livello di lettura

HuggingFace ha costruito una famiglia di modelli visivi talmente piccoli da girare sul tuo telefono o laptop senza internet. SmolVLM esiste in tre taglie: 256 milioni di parametri, 500 milioni, e 2 miliardi. Nonostante le dimensioni ridotte, riesce a guardare più immagini contemporaneamente, capire video, fare OCR su documenti, e rispondere a domande. La licenza Apache 2.0 significa che chiunque può usarli in prodotti commerciali gratuitamente, accelerando l'adozione nell'IoT e nelle applicazioni mobile.

Aziende

HuggingFace

Tool

SmolVLM, SmolVLM-256M, SmolVLM-500M, SmolVLM-2B

Tag

Edge AIVLMSmall ModelOpen SourceMulti-Image

Fonti