Salta al contenuto
AImpact
IT EN
Inferenza Base Anche noto come: Retrieval-Augmented Generation · Generazione aumentata da recupero

RAG

/rag/

Tecnica che recupera testo rilevante da una base dati esterna e lo inserisce nel prompt del modello prima della risposta.

CondividiLinkedInX

In pratica

Permette a un LLM di rispondere usando documenti aziendali, knowledge base interne o articoli aggiornati senza addestrarlo. Riduce le hallucination su dati specifici e aggiorna la conoscenza senza re-training. È la prima architettura da considerare per un chatbot aziendale.

Termini collegati

Visto in azione

20 voci che lo citano
  1. Cohere Command A: il foundation model che gira on-prem su 2 GPU
    Medio
  2. KoboldCpp v1.84: RAG nativo con ChromaDB embedded, zero server separati
    Medio
  3. Oracle OCI Generative AI: Llama 3.1, dedicated clusters e RAG con Oracle Database 23ai
    Medio
  4. AnythingLLM 1.0: lo stack RAG locale completo per uso enterprise
    Alto
  5. Dify 0.7: workflow agentici visivi con RAG integrato e 10+ LLM
    Medio
  6. TabbyML: GitHub Copilot open source con codebase RAG self-hosted
    Medio
  7. KoboldCpp aggiunge RAG integrato: LLM offline all-in-one con documenti e character AI
    Medio
  8. Copilot+ PC e Recall: Microsoft prova la 'memoria infinita' del PC, scoppia il caso privacy
    Alto
  9. Notion AI Q&A: risponde su tutto il workspace aziendale con citazione fonte
    Medio
  10. Cohere Command R+: il modello enterprise pensato per RAG e tool use
    Medio
  11. Automatic Prefix Caching in vLLM: KV cache condiviso tra richieste per TTFT quasi zero
    Alto
  12. Box AI: domande e riassunti sui documenti aziendali con citazione pagina
    Medio
  13. Indirect Prompt Injection: il vettore di attacco nei sistemi RAG e agenti AI
    Alto
  14. Open WebUI: interfaccia web tipo ChatGPT per Ollama con multiutente e cronologia
    Alto
  15. LlamaIndex 0.10 stable: il framework RAG standard per LLM locali
    Medio
  16. AnythingLLM: RAG completo in locale con UI web e vector DB embedded
    Medio
  17. SuperAGI: la prima piattaforma open source per agenti con interfaccia grafica
    Medio
  18. privateGPT: chat con i tuoi documenti, completamente offline
    Alto
  19. RETRO: DeepMind anticipa il RAG con il retrieval da 2 trilioni di token
    Alto
  20. RAG: Retrieval-Augmented Generation entra nella letteratura
    Pietra miliare
← Tutti i termini