In pratica
Permette a un LLM di rispondere usando documenti aziendali, knowledge base interne o articoli aggiornati senza addestrarlo. Riduce le hallucination su dati specifici e aggiorna la conoscenza senza re-training. È la prima architettura da considerare per un chatbot aziendale.
Termini collegati
Visto in azione
20 voci che lo citano- MedioCohere Command A: il foundation model che gira on-prem su 2 GPU
- MedioKoboldCpp v1.84: RAG nativo con ChromaDB embedded, zero server separati
- MedioOracle OCI Generative AI: Llama 3.1, dedicated clusters e RAG con Oracle Database 23ai
- AltoAnythingLLM 1.0: lo stack RAG locale completo per uso enterprise
- MedioDify 0.7: workflow agentici visivi con RAG integrato e 10+ LLM
- MedioTabbyML: GitHub Copilot open source con codebase RAG self-hosted
- MedioKoboldCpp aggiunge RAG integrato: LLM offline all-in-one con documenti e character AI
- AltoCopilot+ PC e Recall: Microsoft prova la 'memoria infinita' del PC, scoppia il caso privacy
- MedioNotion AI Q&A: risponde su tutto il workspace aziendale con citazione fonte
- MedioCohere Command R+: il modello enterprise pensato per RAG e tool use
- AltoAutomatic Prefix Caching in vLLM: KV cache condiviso tra richieste per TTFT quasi zero
- MedioBox AI: domande e riassunti sui documenti aziendali con citazione pagina
- AltoIndirect Prompt Injection: il vettore di attacco nei sistemi RAG e agenti AI
- AltoOpen WebUI: interfaccia web tipo ChatGPT per Ollama con multiutente e cronologia
- MedioLlamaIndex 0.10 stable: il framework RAG standard per LLM locali
- MedioAnythingLLM: RAG completo in locale con UI web e vector DB embedded
- MedioSuperAGI: la prima piattaforma open source per agenti con interfaccia grafica
- AltoprivateGPT: chat con i tuoi documenti, completamente offline
- AltoRETRO: DeepMind anticipa il RAG con il retrieval da 2 trilioni di token
- Pietra miliareRAG: Retrieval-Augmented Generation entra nella letteratura