Alto Voce & audio · 1 min lettura
Whisper open source: la trascrizione audio diventa commodity
In una frase OpenAI rilascia Whisper sotto licenza MIT: modello speech-to-text addestrato su 680.000 ore di audio multilingue, qualità vicina allo stato dell'arte commerciale, gira in locale.
Livello di lettura
OpenAI mette su GitHub un modello che trascrive audio in testo. Gratis, open source, e funziona in più di 90 lingue.
Lo si scarica come un comando: pip install openai-whisper, gli si dà un file mp3, esce un .txt. La qualità è paragonabile ai servizi commerciali a pagamento, in molte lingue migliore.
Cambia tutto per podcaster, giornalisti, archivi audio, sottotitolaggio, accessibilità. E gli sysadmin smettono di pagare API per sbobinare riunioni.
Aziende
OpenAI
Tool
Whisper
Tag
OpenAIWhisperASRSpeech-to-TextOpen SourceMultilingual
Fonti