<script type="application/ld+json">
{
 "@context": "https://schema.org",
 "@type": "FAQPage",
 "mainEntity": [
   {
     "@type": "Question",
     "name": "Was ist MCP und wie funktioniert es mit OCR?",
     "acceptedAnswer": {
       "@type": "Answer",
       "text": "Das Model Context Protocol (MCP) ist ein offener Standard, der es KI-Agenten ermöglicht, mit externen Tools wie OCR-Systemen zu kommunizieren. Es definiert Funktionen wie Datei-Upload, Statusabfrage und Datenabruf, die der KI-Agent automatisch ohne Programmierung orchestrieren kann."
     }
   },
   {
     "@type": "Question",
     "name": "Was ist der Unterschied zwischen einer OCR API und einem MCP Server?",
     "acceptedAnswer": {
       "@type": "Answer",
       "text": "Bei einer klassischen OCR API müssen Entwickler die gesamte Orchestrierung übernehmen, einschließlich Upload, Statusabfragen und Datenverarbeitung. Mit einem MCP Server übernimmt der KI-Agent diese Schritte automatisch basierend auf den Tool-Definitionen."
     }
   },
   {
     "@type": "Question",
     "name": "Welche Daten können mit Koncile MCP OCR extrahiert werden?",
     "acceptedAnswer": {
       "@type": "Answer",
       "text": "Koncile extrahiert strukturierte Geschäftsdaten wie Schlüsselfelder (Lieferant, Datum, Betrag), Rechnungspositionen (Mengen, Preise, Beschreibungen) sowie weitere dokumentenspezifische Informationen."
     }
   },
   {
     "@type": "Question",
     "name": "Welche Dokumentformate werden unterstützt?",
     "acceptedAnswer": {
       "@type": "Answer",
       "text": "Koncile MCP OCR unterstützt Formate wie PDF, PNG und JPEG. Diese Formate sind vollständig OCR-kompatibel für eine präzise Extraktion. Weitere Informationen zu unterstützten Formaten und zum Upload-Prozess finden Sie in der Dokumentation: https://docs.koncile.ai/"
     }
   },
   {
     "@type": "Question",
     "name": "Wie lange dauert die Integration von Koncile über MCP?",
     "acceptedAnswer": {
       "@type": "Answer",
       "text": "Die Integration über MCP dauert in der Regel weniger als 15 Minuten. Sie müssen lediglich den MCP Server über einen Befehl oder eine Konfigurationsdatei verbinden, ohne komplexen Integrationscode zu schreiben."
     }
   },
   {
     "@type": "Question",
     "name": "Kann der MCP OCR Server selbst gehostet werden?",
     "acceptedAnswer": {
       "@type": "Answer",
       "text": "Ja, Koncile bietet eine Self-Hosted-Option über Docker oder pip install. Dadurch können Unternehmen Dokumente innerhalb ihrer eigenen Infrastruktur verarbeiten und Datenschutzanforderungen erfüllen."
     }
   },
   {
     "@type": "Question",
     "name": "Ersetzt MCP traditionelle APIs?",
     "acceptedAnswer": {
       "@type": "Answer",
       "text": "MCP ersetzt APIs nicht vollständig, vereinfacht jedoch deren Nutzung erheblich. KI-Agenten können direkt mit Funktionen interagieren, ohne dass individuelle Integrationen erforderlich sind, was die Implementierungszeit stark reduziert."
     }
   }
 ]
}
</script>

MCP OCR: Wie Koncile KI-Agenten die native Dokumentenextraktion ermöglicht

Letzte Aktualisierung:

March 25, 2026

5 Minuten

Bis vor Kurzem bedeutete die Anbindung einer OCR-Engine an einen KI-Assistenten, spezifischen Code zu schreiben, API-Aufrufe manuell zu verwalten und die gesamte Zwischenschicht zwischen dem Sprachmodell und der Dokumentenverarbeitungspipeline aufzubauen. Mit dem Model Context Protocol (MCP) entfällt diese gesamte Schicht. Bei Koncile haben wir einen MCP OCR Server entwickelt, der es Claude, Cursor oder jedem anderen kompatiblen KI-Agenten ermöglicht, Dokumente zu extrahieren, zu lesen und zu verwalten, ohne eine einzige Zeile Integrationscode zu schreiben.

Der MCP OCR Server von Koncile verbindet KI-Agenten mit intelligenter Dokumentenextraktion. 24 Tools, strukturierte Daten, Setup in 15 Minuten. Kostenlos testen oder selbst hosten.

image premium montrant une illustration simplifiant le concept de MCP

Was ist MCP und warum ist es wichtig für OCR?

MCP (Model Context Protocol) ist ein offener Standard, der von Anthropic eingeführt wurde und definiert, wie KI-Assistenten mit externen Tools kommunizieren. Man kann es sich wie einen universellen Anschluss vorstellen: Anstatt dass jedes Tool einen eigenen spezifischen Connector benötigt, stellt MCP ein einheitliches Protokoll bereit, das jeder KI-Client verwenden kann.

Für OCR ist das ein großer Fortschritt. Die Dokumentenextraktion befand sich lange in einer Grauzone. Sie ist zu komplex für einen einfachen API-Call (Datei hochladen, warten, Status abfragen, strukturierte Daten verarbeiten), aber gleichzeitig zu häufig, um jedes Mal eine vollständige Integration zu rechtfertigen.

MCP macht daraus etwas, das der KI-Assistent bereits nativ versteht.

Der echte Unterschied zwischen einer API und einem MCP-Server

Mit einer API orchestrierst du alles selbst

Wenn du eine OCR-API auf klassische Weise integrierst, bist du der Orchestrator. Du schreibst den Code zum Hochladen der Datei. Du implementierst das Polling zur Statusabfrage. Du verarbeitest die JSON-Antwort und passt sie an dein Datenmodell an, was komplexe Dokumentenlogik erfordert. Du kümmerst dich um Fehler, Retries und Authentifizierung.

Jede Integration ist individuell, und jede individuelle Integration bedeutet zusätzlichen Wartungsaufwand.

Bei Koncile kennen wir das gut, weil wir diese API selbst gebaut haben. Wir haben gesehen, dass Teams Tage oder sogar Wochen benötigen, um einen eigentlich einfachen Dokumenten-Workflow umzusetzen.

Mit MCP übernimmt der KI-Agent die Orchestrierung

Wenn dieselben OCR-Funktionen über MCP bereitgestellt werden, übernimmt der KI-Assistent die gesamte Orchestrierung. Er weiß, wie man upload_file aufruft. Er weiß, wie man get_task_status überprüft. Er weiß, wie man mit get_document_data strukturierte Daten abruft.

All das ist in den MCP-Tool-Definitionen beschrieben, und der Assistent führt den gesamten mehrstufigen Workflow automatisch aus.

Aus Entwicklersicht gibt es nichts mehr zu implementieren. Du konfigurierst den MCP-Server einmal, und der KI-Agent erledigt den Rest.

Vergleich zwischen komplexer OCR API Integration und vereinfachter MCP Lösung mit automatischer Orchestrierung durch einen KI-Agenten

So funktioniert ein MCP OCR Workflow in der Praxis

Workflow eines KI-Agenten mit MCP zur Extraktion von Rechnungsdaten inklusive Upload, Verarbeitung und strukturiertem JSON Output

Was der MCP OCR Server von Koncile tatsächlich bietet

24 Tools, nicht nur OCR

Die meisten MCP OCR Server, die du auf GitHub findest, sind einfache Wrapper um Open-Source-OCR-Modelle. Sie machen nur eine Sache: ein Bild nehmen und Text zurückgeben. Das reicht für einfache Texterkennung, aber nicht für produktive Dokumentenverarbeitung.

Der MCP-Server von Koncile stellt 24 Tools bereit, die den gesamten Dokumenten-Lifecycle abdecken. Du kannst Dateien hochladen und Extraktionen starten. Du kannst den Status abfragen und strukturierte Daten abrufen, sowohl Header-Felder als auch Positionen. Du kannst Ordner, Templates, Felder und Extraktionsregeln verwalten. Du kannst Originaldokumente herunterladen und verarbeitete löschen.

Das ist kein einfacher OCR-Wrapper. Es ist eine vollständige Plattform für intelligente Dokumentenverarbeitung, zugänglich über natürliche Sprache.

Workflow eines KI-Agenten mit MCP zur Extraktion von Rechnungsdaten inklusive Upload, Verarbeitung und strukturiertem JSON Output

Hosted oder Self-Hosted – deine Wahl

Von Anfang an war uns Flexibilität wichtig. Du kannst unseren gehosteten MCP-Server unter mcp.koncile.ai mit einem einzigen Befehl verbinden und innerhalb von weniger als einer Minute Dokumente extrahieren. Alternativ kannst du den Server per pip install oder Docker selbst hosten.

Viele Open-Source-Lösungen bieten das nicht. Sie erfordern lokale Modelle, GPU-Setup und komplexe Konfiguration. Bei Koncile übernehmen wir diese Komplexität für dich (oder du selbst, wenn du möchtest), während MCP leichtgewichtig und schnell bleibt.

Für wen ist das gedacht?

Übersicht der Funktionen des Koncile MCP Servers mit OCR, Datenextraktion, Templates und Dokumentenmanagement

Entwickler, die KI-Workflows bauen

Wenn du einen Agenten entwickelst, der Rechnungen, Belege, Verträge oder andere strukturierte Dokumente verarbeiten muss, kannst du mit MCP diese Funktionalität in Minuten statt Tagen integrieren. Kein SDK, kein Boilerplate. Du beschreibst dein Ziel in natürlicher Sprache, und der Agent nutzt die Koncile-Tools.

Bei Koncile haben wir den Unterschied gemessen: Eine klassische API-Integration dauerte 3 bis 5 Tage. Mit MCP dauert sie etwa 15 Minuten. Konfiguration ersetzt Code.

Finance- und Accounting-Teams

Hier wird es besonders spannend. Mit MCP können auch Nicht-Entwickler Dokumente verarbeiten. Ein Finance-Mitarbeiter kann einfach sagen: „Extrahiere alle Positionen aus dieser Rechnung“ und erhält strukturierte Daten, ohne APIs oder JSON zu kennen.

MCP Ökosystem Diagramm mit einem zentralen KI-Agenten, der OCR, Dokumentenklassifikation, Datenextraktion und ERP Systeme verbindet

Unternehmen mit hohen Datenschutzanforderungen

Da der MCP-Server self-hosted betrieben werden kann, bleiben alle Dokumente in deiner eigenen Infrastruktur. MCP bringt kein zusätzliches Risiko im Vergleich zu einer API.

Wie man startet

Verbindung in einem einzigen Befehl

claude mcp add --transport http koncile https://mcp.koncile.ai/mcp --header "Authorization: Bearer YOUR_API_KEY"

Claude hat sofort Zugriff auf alle 24 Tools.

Konfiguration für andere Clients

Für Claude Desktop, Cursor oder Windsurf reicht ein JSON-Block mit Server-URL und API-Key.

GitHub: https://github.com/Koncile/koncile-mcp

Warum wir das gebaut haben (und nicht nur eine API)

APIs sind für Maschinen. MCP ist für KI-Agenten.

Eine API wird von Entwicklern genutzt. Ein MCP-Server wird von einem Agenten autonom genutzt. Das verändert grundlegend, wer Dokumentenverarbeitung nutzen kann.

MCP OCR vs Open Source Alternativen

Open-Source MCP OCR Lösungen wie RapidOCR oder PaddleOCR liefern Rohtext. Koncile liefert strukturierte Geschäftsdaten: Lieferanten, Beträge, Positionen, Steuern.

Wenn du Text lesen willst → Open Source reicht
Wenn du Daten extrahieren willst → Koncile

Funktion Open Source OCR MCP Koncile MCP OCR
Textextraktion Einfacher OCR-Textoutput Fortschrittliche OCR mit strukturierten Daten
Strukturierte Datenextraktion Nicht verfügbar Extraktion von Schlüsselfeldern (Lieferant, Datum, Betrag…)
Positionsdaten (Line Items) Nicht verfügbar Vollständige Extraktion mit Mengen und Preisen
Template-Management Nicht verfügbar Individuelle Templates und Extraktionsregeln
Multi-Dokument-Trennung Nicht verfügbar Automatische Klassifikation und Trennung
Deployment Lokale Einrichtung (Modelle, GPU, Abhängigkeiten) Cloud oder Self-Hosted (Docker, API, MCP)
Tool-Ökosystem Einfaches OCR-Tool 24 Tools für den gesamten Dokumentenprozess

Was kommt als Nächstes?

MCP steht noch am Anfang, wächst aber schnell. Dokumentenverarbeitung wird einer der wichtigsten Use Cases.

Bei Koncile arbeiten wir bereits an:

  • Batch-Verarbeitung
  • Webhooks in Echtzeit
  • Integration mit Buchhaltungssystemen

Unsere Vision ist einfach:
Jeder KI-Agent, jedes Dokument, strukturierte Daten in Sekunden. Ohne Code.

Teste es auf https://koncile.ai
GitHub: https://github.com/Koncile/koncile-mcp

Wechseln Sie zur Dokumentenautomatisierung

Automatisieren Sie mit Koncile Ihre Extraktionen, reduzieren Sie Fehler und optimieren Sie Ihre Produktivität dank KI OCR mit wenigen Klicks.

Author and Co-Founder at Koncile
Jules Ratier

Mitbegründer von Koncile - Verwandeln Sie jedes Dokument mit LLM in strukturierte Daten - jules@koncile.ai

Jules leitet die Produktentwicklung bei Koncile und konzentriert sich darauf, wie unstrukturierte Dokumente in Geschäftswert umgewandelt werden können.

Ressourcen von Koncile