Livello di lettura
Fino al 2024 i modelli capaci di vedere e descrivere immagini richiedevano GPU potenti e cloud. Moondream ha dimostrato che non è necessariamente così: con soli 1.6 miliardi di parametri, questo modello gira su un Raspberry Pi, su un telefono Android e su laptop senza GPU dedicata. Riesce a descrivere immagini, rispondere a domande su di esse e individuare oggetti, tutto in locale, senza inviare dati a nessun server. Apre le porte all'intelligenza visiva nei dispositivi di tutti i giorni.
Aziende
vikhyatk (independent)
Tool
Moondream 1, Moondream 2
Tag
Edge AIVLMTiny ModelOn-DeviceVQA
Fonti