Salta al contenuto
AImpact
IT EN
Medio Voce & audio · 1 min lettura

Fish Speech 1.4: TTS open source con voice cloning da 10 secondi e 8 lingue

In una frase Fish Speech 1.4 clona voci da 10s di audio, supporta 8 lingue, gira in tempo reale su CPU e offre una seria alternativa gratuita a ElevenLabs per i developer.

Verificato Fonte ufficiale
CondividiLinkedInX
Livello di lettura

Fish Speech è un sistema TTS open source che permette di clonare qualsiasi voce partendo da soli 10 secondi di audio di esempio, senza bisogno di GPU costose o connessione internet. Supporta 8 lingue tra cui inglese, cinese, giapponese, coreano, francese, tedesco, arabo e spagnolo, con qualità vocale naturale in tutte. La cosa più interessante per chi sviluppa applicazioni è che gira in velocità real-time anche su CPU normale, rendendolo pratico per dispositivi edge e app desktop offline. È di fatto un'alternativa gratuita a ElevenLabs per chi ha esigenze tecniche e non vuole dipendere da API a pagamento.

Aziende

Fish Audio

Tool

Fish Speech

Tag

Fish SpeechTTSVoice CloningOpen SourceMultilingualEdge Inference

Fonti