Qwen2.5-Coder-32B: il modello open source che batte GPT-4o sul codice

In una frase Alibaba rilascia Qwen2.5-Coder-32B-Instruct: 92.7% su HumanEval, primo open weight a superare GPT-4o su code generation, 128k contesto, testa anche LiveCodeBench. Rende self-hostabile la qualita enterprise sul coding.

Da rivedere Fonte ufficiale

CondividiLinkedIn X

Per anni il divario tra i migliori modelli AI a pagamento e quelli gratuiti scaricabili era grande, soprattutto nel coding. Qwen2.5-Coder-32B ha chiuso questo divario in modo definitivo: e il primo modello open source che supera GPT-4o — il modello principale di OpenAI — nei benchmark di generazione del codice.

Il modello e stato rilasciato da Alibaba con 32 miliardi di parametri e una finestra di contesto di 128.000 token — abbastanza da contenere codebase di grandi dimensioni in un unico prompt. Su HumanEval, il benchmark standard per la generazione di codice, raggiunge il 92.7%, superando GPT-4o che si fermava all'88%.

Cosa significa in pratica? Significa che un'azienda puo installare questo modello sui propri server, senza pagare chiamate API a OpenAI, e avere una qualita di generazione del codice superiore a quella che avrebbe pagando. Per i sysadmin e i team IT che devono automatizzare task di coding senza mandare codice proprietario a server esterni, questo e un cambiamento importante. Il modello gira in modo ragionevole su hardware consumer di fascia alta.