Quantizzazione 2-bit usabile: i modelli reasoning frontier scendono sotto i 32GB RAM
Nuove tecniche di quantizzazione (estensioni 2-bit / 3-bit di qualità) permettono di girare modelli reasoning dimensione frontier su workstation con 32-64GB di RAM unificata.