whisper.cpp: trascrizione vocale offline su CPU con C++ puro
In una frase Georgi Gerganov porta il modello Whisper di OpenAI su CPU tramite un'implementazione C++ minimale: trascrizione in tempo reale senza GPU e senza cloud.
OpenAI aveva già pubblicato Whisper, un modello potente per trascrivere audio in testo. Il problema? Per usarlo serviva Python, CUDA e una GPU decente. Non era certo roba per tutti.
Georgi Gerganov — lo stesso sviluppatore che poco dopo avrebbe fatto la stessa cosa con i modelli LLM — ha riscritto Whisper da zero in C++ puro. Il risultato è un programma leggero che gira su qualsiasi CPU, anche quella di un vecchio laptop, senza connessione internet.
In pratica: puoi trascrivere riunioni, note vocali, interviste o podcast direttamente sul tuo computer, con qualità molto alta, senza mandare niente a nessun server.
Aziende
Georgi Gerganov (indipendente)
Tool
whisper.cpp
Tag
Fonti