12 giugno 2023 Medio Voce & audio · 1 min lettura

Bark: TTS open source con risate, sospiri e musica dal testo

In una frase Suno AI rilascia Bark su HuggingFace: modello TTS open source capace di generare paralinguistica — risate, sospiri, effetti sonori, musica — direttamente da prompt testuali.

Verificato Fonte ufficiale

CondividiLinkedIn X

Livello di lettura

I modelli TTS tradizionali generano voce ma non espressione: parlano in modo piatto, senza risate, pause nervose o cambi di tono emotivo. Bark rompe questo schema portando la paralinguistica nel TTS open source.

Passando un testo con tag speciali come "[laughs]" o "[sighs]", Bark genera audio che include davvero quelle espressioni sonore. Ma non si ferma lì: può generare anche frammenti musicali e effetti sonori ambientali mescolati al parlato.

Il modello viene rilasciato su HuggingFace con pesi open source, rendendolo immediatamente disponibile per la community e aprendo nuove possibilità per audiolibri, videogiochi e contenuti multimediali.

Aziende

Suno AI

Tool

Bark

Tag

BarkSuno AITTSParalinguisticsOpen SourceHuggingFaceAudio Generation

Fonti

https://github.com/suno-ai/bark