Phi-3: Microsoft rilancia gli SLM con qualità da modello 10x più grande
In una frase Microsoft rilascia Phi-3-mini 3.8B, small 7B, medium 14B. Mini gira su iPhone e supera Mixtral 8x7B su molti benchmark. Conferma la tesi 'dati curati > scale'.
Mentre tutti corrono a fare modelli più grandi, Microsoft Research va dall'altra parte: modelli piccoli, ma addestrati su dati curati come un libro di testo. Phi-3-mini ha 3.8 miliardi di parametri (otto volte meno di Llama 3 8B... no, simile in realtà, ma molto meno di Mixtral 8x7B) eppure rivaleggia con modelli molto più grandi.
La cosa pratica: il modello gira su un iPhone 14, offline, senza internet. Microsoft mostra un demo dove un iPhone risponde a domande complesse senza nessuna connessione.
Per i developer significa che si può mettere AI utile dentro un'app mobile, un router, un PLC industriale, senza dover chiamare API a pagamento o gestire GPU. Per la privacy è un punto enorme: i dati non escono dal dispositivo.
Aziende
Microsoft
Tool
Phi-3-mini, Phi-3-small, Phi-3-medium
Tag
Fonti