Modelli Base Anche noto come: Large Language Model · Modello linguistico di grandi dimensioni

LLM

/el-el-em/

Modello di intelligenza artificiale addestrato su enormi quantità di testo per prevedere la parola successiva e generare risposte in linguaggio naturale.

CondividiLinkedIn X

In pratica

È il motore dietro ChatGPT, Claude, Gemini. Quando integri un LLM nel tuo prodotto paghi a token e ottieni un servizio che capisce e produce testo. La qualità dipende molto dal modello scelto e dal prompt che gli fornisci.

Termini collegati

Transformer Foundation model Token Context window

Visto in azione

62 voci che lo citano

13 maggio 2026

Mistral lancia Devstral Small: modello di coding da 7B che gira su GPU consumer

Medio
20 aprile 2026

Figure AI: Figure 02 raggiunge l'autonomia completa nel magazzino senza supervisione umana

Alto
5 marzo 2026

Ollama 0.9: modelli multipli, GPU distribuite e API v2 per il runtime AI locale

Medio
14 agosto 2025

Local AI 2025: Ollama, MLX LM, Apple Foundation Models triplicano la velocità

Medio
8 luglio 2025

Private LLM: modelli fino a 7B direttamente su iPhone e Mac, completamente offline

Medio
2 luglio 2025

vLLM v0.7: chunked prefill default e v1 engine ridisegnato

Medio
1 maggio 2025

NVIDIA NIM 1.0: inferenza LLM containerizzata con API OpenAI-compatibile

Alto
14 aprile 2025

WebLLM e LLM in WASM: inferenza LLM nel browser tramite WebGPU senza server

Medio
8 aprile 2025

Continuous Batching per LLM Serving: survey e stato dell'arte di Orca, vLLM, SGLang, TGI

Medio
20 marzo 2025

DeepMind: 60+ casi di Specification Gaming nei LLM documentati

Alto
22 gennaio 2025

FlashInfer 0.2: libreria attention per LLM serving con paged KV cache e RoPE fusion

Medio
8 gennaio 2025

Disaggregazione prefill/decode: GPU separate per TTFT basso e alto throughput

Alto
10 settembre 2024

KV Cache Quantization FP8/INT8: doppia la densità di utenti per GPU

Alto
1 settembre 2024

AnythingLLM 1.0: lo stack RAG locale completo per uso enterprise

Alto
5 agosto 2024

LLM Compressor: toolkit unificato per quantizzazione e sparsità con integrazione vLLM nativa

Medio
18 luglio 2024

CyberSecEval 2: benchmark Meta per la sicurezza degli LLM

Medio
15 luglio 2024

Dify 0.7: workflow agentici visivi con RAG integrato e 10+ LLM

Medio
15 luglio 2024

DrEureka: LLM automatizza il trasferimento simulazione-reale senza tuning manuale

Medio
1 luglio 2024

NeMo Guardrails 0.8: il framework NVIDIA per aggiungere safety rails a qualsiasi LLM

Medio
14 maggio 2024

Microsoft RoboGen: generare task, skill e ambienti robotici dal testo

Medio

← Tutti i termini