Livello di lettura
EnCodec è un codec audio che usa reti neurali invece degli algoritmi classici: prende un suono, lo comprime in codici molto piccoli, e lo ricostruisce con alta fedeltà. Funziona a bitrate molto bassi — anche 1.5 kbps per audio mono, meno di un SMS — pur mantenendo qualità percettiva superiore ai codec tradizionali come Opus o EVS. La parte più importante per l'AI è la struttura RVQ (Residual Vector Quantization): l'audio viene rappresentato come sequenze di token discreti, perfetti per essere usati da modelli linguistici. Per questo EnCodec è diventato il vocoder di fatto per sistemi come AudioLM, SoundStorm, VALL-E e Voicebox.
Aziende
Meta AI
Tool
EnCodec, RVQ
Tag
EnCodecNeural CodecAudio CompressionMeta AIRVQVocoder
Fonti