RAG (Retrieval-Augmented Generation)

Verfahren, bei dem ein LLM Antworten aus einer durchsuchbaren Wissensbasis erzeugt — statt nur aus Trainingsdaten.

Retrieval-Augmented Generation kombiniert klassische Suche (Vektor-Datenbank, Embeddings) mit einem Sprachmodell. Bei einer Anfrage werden zunächst relevante Dokument-Chunks aus dem eigenen Wissensbestand abgerufen und dem LLM als Kontext mitgegeben. Das Modell antwortet dann ausschließlich auf Basis dieser Quellen — mit Zitierbarkeit und ohne Halluzinationen aus dem Pretraining. RAG ist der De-facto-Standard für Enterprise-Chatbots, interne Wissens-Suche und Compliance-relevante Auskunftssysteme. Typischer Stack: OpenAI/Anthropic für Generation, pgvector/Qdrant/Weaviate für Retrieval, LangChain oder LlamaIndex als Orchestrierung.

RAG (Retrieval-Augmented Generation) im eigenen Unternehmen einsetzen?

Wir matchen Sie mit einem Senior-Berater, der genau das schon produktiv gebaut hat.

Projekt starten

RAG (Retrieval-Augmented Generation)

Passende Use-Cases

Verwandte Begriffe

RAG (Retrieval-Augmented Generation) im eigenen Unternehmen einsetzen?