SmolVLM: la famiglia VLM 256M-2B per dispositivi edge
In una frase HuggingFace rilascia SmolVLM, famiglia di VLM da 256M a 2B parametri con supporto multi-immagine, video e OCR, Apache 2.0, ottimizzata per deployment edge.
HuggingFace ha costruito una famiglia di modelli visivi talmente piccoli da girare sul tuo telefono o laptop senza internet. SmolVLM esiste in tre taglie: 256 milioni di parametri, 500 milioni, e 2 miliardi. Nonostante le dimensioni ridotte, riesce a guardare più immagini contemporaneamente, capire video, fare OCR su documenti, e rispondere a domande. La licenza Apache 2.0 significa che chiunque può usarli in prodotti commerciali gratuitamente, accelerando l'adozione nell'IoT e nelle applicazioni mobile.
Aziende
HuggingFace
Tool
SmolVLM, SmolVLM-256M, SmolVLM-500M, SmolVLM-2B
Tag
Fonti