Daten & RAG
RAG (Retrieval-Augmented Generation)
Verfahren, bei dem ein LLM Antworten aus einer durchsuchbaren Wissensbasis erzeugt — statt nur aus Trainingsdaten.
Retrieval-Augmented Generation kombiniert klassische Suche (Vektor-Datenbank, Embeddings) mit einem Sprachmodell. Bei einer Anfrage werden zunächst relevante Dokument-Chunks aus dem eigenen Wissensbestand abgerufen und dem LLM als Kontext mitgegeben. Das Modell antwortet dann ausschließlich auf Basis dieser Quellen — mit Zitierbarkeit und ohne Halluzinationen aus dem Pretraining. RAG ist der De-facto-Standard für Enterprise-Chatbots, interne Wissens-Suche und Compliance-relevante Auskunftssysteme. Typischer Stack: OpenAI/Anthropic für Generation, pgvector/Qdrant/Weaviate für Retrieval, LangChain oder LlamaIndex als Orchestrierung.
Passende Use-Cases
Verwandte Begriffe
RAG (Retrieval-Augmented Generation) im eigenen Unternehmen einsetzen?
Wir matchen Sie mit einem Senior-Berater, der genau das schon produktiv gebaut hat.
Projekt starten