Salta al contenuto
AImpact
IT EN
Medio AI multimodale · 1 min lettura

Moondream 1: il VLM da 1.6B che gira su Raspberry Pi

In una frase Moondream è un VLM da soli 1.6B parametri capace di captioning, VQA e object detection su hardware edge come Raspberry Pi e smartphone Android.

Verificato Fonte ufficiale
CondividiLinkedInX
Livello di lettura

Fino al 2024 i modelli capaci di vedere e descrivere immagini richiedevano GPU potenti e cloud. Moondream ha dimostrato che non è necessariamente così: con soli 1.6 miliardi di parametri, questo modello gira su un Raspberry Pi, su un telefono Android e su laptop senza GPU dedicata. Riesce a descrivere immagini, rispondere a domande su di esse e individuare oggetti, tutto in locale, senza inviare dati a nessun server. Apre le porte all'intelligenza visiva nei dispositivi di tutti i giorni.

Aziende

vikhyatk (independent)

Tool

Moondream 1, Moondream 2

Tag

Edge AIVLMTiny ModelOn-DeviceVQA

Fonti