Moshi: il primo voice assistant full-duplex open source di Kyutai
In una frase Il laboratorio non-profit francese Kyutai presenta Moshi, voice assistant full-duplex con latenza ~200ms basato su un singolo modello multimodale che gestisce simultaneamente audio in ingresso e uscita.
Kyutai, un laboratorio AI francese non-profit appena fondato, presenta in una demo dal vivo un assistente vocale che parla davvero in tempo reale. Si chiama Moshi.
Differenza chiave rispetto a Siri/Alexa: di solito tu parli, fai una pausa, l'assistente risponde. Moshi invece può ascoltarti e parlarti contemporaneamente, come una persona vera che ti interrompe o conferma mentre stai ancora parlando.
Demo dal vivo davanti alla stampa, ed è tutto open source: il modello, il codice, i pesi. È la prima volta che qualcosa di simile è disponibile pubblicamente.
Aziende
Kyutai
Tool
Moshi
Tag
Fonti