Zurück zum Glossar

Daten & RAG

OCR (Optical Character Recognition)

Texterkennung aus Bildern und PDFs — heute kombiniert mit LLMs für strukturierte Extraktion.

Klassisches OCR (Tesseract, ABBYY) liest Zeichen aus Pixeldaten. Moderne Stacks kombinieren OCR mit Vision-LLMs (GPT-5 Vision, Claude, Gemini) oder spezialisierten Layout-Modellen (LayoutLM, Donut), um aus Rechnungen, Verträgen, Lieferscheinen direkt strukturierte JSON-Daten zu extrahieren — inklusive Buchungsvorschlag oder DATEV-Export. Genauigkeit liegt heute bei 95–99% bei sauberen Dokumenten.

Passende Use-Cases

Verwandte Begriffe

OCR (Optical Character Recognition) im eigenen Unternehmen einsetzen?

Wir matchen Sie mit einem Senior-Berater, der genau das schon produktiv gebaut hat.

Projekt starten