Salta al contenuto
AImpact
IT EN
Medio Voce & audio · 1 min lettura

Kokoro TTS v0.19: qualità TTS professionale con soli 82 milioni di parametri

In una frase Kokoro TTS raggiunge qualità comparabile a sistemi 10x più grandi con soli 82M parametri, inference sotto 1 secondo su CPU, Apache 2.0, ideale per dispositivi edge.

Verificato Fonte ufficiale
CondividiLinkedInX
Livello di lettura

Kokoro è un modello TTS che sfida l'idea che servano miliardi di parametri per una buona sintesi vocale: con soli 82 milioni di parametri — meno di molti modelli di classificazione immagini — produce voci di qualità paragonabile a sistemi dieci volte più grandi. Su un laptop normale genera un secondo di audio in meno di un secondo, il che lo rende perfetto per applicazioni che devono girare direttamente sul dispositivo dell'utente senza connessione internet. È rilasciato con licenza Apache 2.0 su HuggingFace, quindi completamente libero per uso commerciale. Ha guadagnato popolarità rapidamente tra gli sviluppatori che cercano un TTS leggero da integrare in applicazioni desktop, app mobile e dispositivi IoT.

Aziende

hexgrad

Tool

Kokoro TTS

Tag

Kokoro TTSEdge TTSOpen SourceApache 2.0Lightweight ModelCPU Inference

Fonti