Bark: TTS open source con risate, sospiri e musica dal testo
In una frase Suno AI rilascia Bark su HuggingFace: modello TTS open source capace di generare paralinguistica — risate, sospiri, effetti sonori, musica — direttamente da prompt testuali.
I modelli TTS tradizionali generano voce ma non espressione: parlano in modo piatto, senza risate, pause nervose o cambi di tono emotivo. Bark rompe questo schema portando la paralinguistica nel TTS open source.
Passando un testo con tag speciali come "[laughs]" o "[sighs]", Bark genera audio che include davvero quelle espressioni sonore. Ma non si ferma lì: può generare anche frammenti musicali e effetti sonori ambientali mescolati al parlato.
Il modello viene rilasciato su HuggingFace con pesi open source, rendendolo immediatamente disponibile per la community e aprendo nuove possibilità per audiolibri, videogiochi e contenuti multimediali.
Aziende
Suno AI
Tool
Bark
Tag
Fonti