Qwen2.5-Coder-32B: il modello open source che batte GPT-4o sul codice
In una frase Alibaba rilascia Qwen2.5-Coder-32B-Instruct: 92.7% su HumanEval, primo open weight a superare GPT-4o su code generation, 128k contesto, testa anche LiveCodeBench. Rende self-hostabile la qualita enterprise sul coding.
Per anni il divario tra i migliori modelli AI a pagamento e quelli gratuiti scaricabili era grande, soprattutto nel coding. Qwen2.5-Coder-32B ha chiuso questo divario in modo definitivo: e il primo modello open source che supera GPT-4o — il modello principale di OpenAI — nei benchmark di generazione del codice.
Il modello e stato rilasciato da Alibaba con 32 miliardi di parametri e una finestra di contesto di 128.000 token — abbastanza da contenere codebase di grandi dimensioni in un unico prompt. Su HumanEval, il benchmark standard per la generazione di codice, raggiunge il 92.7%, superando GPT-4o che si fermava all'88%.
Cosa significa in pratica? Significa che un'azienda puo installare questo modello sui propri server, senza pagare chiamate API a OpenAI, e avere una qualita di generazione del codice superiore a quella che avrebbe pagando. Per i sysadmin e i team IT che devono automatizzare task di coding senza mandare codice proprietario a server esterni, questo e un cambiamento importante. Il modello gira in modo ragionevole su hardware consumer di fascia alta.
Aziende
Alibaba, Qwen Team
Tool
—
Tag
Fonti