Salta al contenuto
AImpact
IT EN
Alto Voce & audio · 1 min lettura

Moshi: il primo voice assistant full-duplex open source di Kyutai

In una frase Il laboratorio non-profit francese Kyutai presenta Moshi, voice assistant full-duplex con latenza ~200ms basato su un singolo modello multimodale che gestisce simultaneamente audio in ingresso e uscita.

Verificato Fonte ufficiale
CondividiLinkedInX
Livello di lettura

Kyutai, un laboratorio AI francese non-profit appena fondato, presenta in una demo dal vivo un assistente vocale che parla davvero in tempo reale. Si chiama Moshi.

Differenza chiave rispetto a Siri/Alexa: di solito tu parli, fai una pausa, l'assistente risponde. Moshi invece può ascoltarti e parlarti contemporaneamente, come una persona vera che ti interrompe o conferma mentre stai ancora parlando.

Demo dal vivo davanti alla stampa, ed è tutto open source: il modello, il codice, i pesi. È la prima volta che qualcosa di simile è disponibile pubblicamente.

Aziende

Kyutai

Tool

Moshi

Tag

KyutaiMoshiVoiceReal-timeOpen SourceStreaming

Fonti