21 settembre 2022 Alto Voce & audio · 1 min lettura

Whisper open source: la trascrizione audio diventa commodity

In una frase OpenAI rilascia Whisper sotto licenza MIT: modello speech-to-text addestrato su 680.000 ore di audio multilingue, qualità vicina allo stato dell'arte commerciale, gira in locale.

Verificato Fonte ufficiale

CondividiLinkedIn X

Livello di lettura

OpenAI mette su GitHub un modello che trascrive audio in testo. Gratis, open source, e funziona in più di 90 lingue.

Lo si scarica come un comando: pip install openai-whisper, gli si dà un file mp3, esce un .txt. La qualità è paragonabile ai servizi commerciali a pagamento, in molte lingue migliore.

Cambia tutto per podcaster, giornalisti, archivi audio, sottotitolaggio, accessibilità. E gli sysadmin smettono di pagare API per sbobinare riunioni.

Aziende

OpenAI

Tool

Whisper

Tag

OpenAIWhisperASRSpeech-to-TextOpen SourceMultilingual

Fonti

https://openai.com/index/whisper/
https://github.com/openai/whisper