PDF zu JSON: So machen Sie Ihre Dokumente datenfähig

Letzte Aktualisierung:

January 4, 2026

5 Minuten

Mit der Koncile API und ihrer Swagger-Schnittstelle finden Sie diese PDF-Datei in einer strukturierten JSON-Datenumgebung, der Software in Buchhaltungssoftware, CRM- oder ERP-Software. Hier finden Sie eine schrittweise Anleitung, wie Sie diese Konvertierung einfach durchführen können, ohne programmieren zu müssen.

Konvertieren Sie PDFs mit der Koncile-API in strukturiertes JSON – einfach, automatisch und ohne Programmierung.

Koncile-API wandelt PDFs in JSON-Daten um – Automatisierung von Datenflüssen ohne Code.

4 Schritte, um eine PDF-Datei über die API in JSON umzuwandeln

Koncile bietet eine schlüsselfertige Lösung, um Ihre PDFs in strukturiertes JSON zu konvertieren – selbst bei komplexen oder handschriftlichen Dokumenten dank seiner OCR-Software der neuen Generation.

1. Ihre API-Zugriffsschlüssel aus Ihrem Koncile-Konto generieren

Um eine sichere Verbindung zur Koncile-API herzustellen, gehen Sie in die Kontoeinstellungen (nur für Administratoren).

Wechseln Sie zum Reiter API und klicken Sie auf „Generate an API key“, um Ihren persönlichen Zugangsschlüssel zu erhalten.

2. Verbindung mit der API über Swagger herstellen

Gehen Sie zur Swagger-Dokumentation von Koncile: https://api.koncile.ai/documentation

Wählen Sie dann den Endpunkt POST /v1/upload_file/ — Upload file

Hier können Sie ein Dokument senden, sobald die Verbindung hergestellt ist.

Authentifizierung aktivieren

  1. Klicken Sie auf das Symbol 🔒, um die Authentifizierung zu aktivieren.
  2. Fügen Sie in das Feld Value Ihren API-Schlüssel ein.
  3. Klicken Sie anschließend auf „Authorize“ und dann auf „Close“.

3. Senden des Dokuments konfigurieren

Nach der Authentifizierung können Sie Ihr Dokument zur Konvertierung vorbereiten:

Optionale Parameter hinzufügen

  • Eine Document ID
  • Eine Folder ID
  • Ein vordefiniertes Template (wenn Sie ein bestimmtes Extraktionsmodell anwenden möchten)

Datei in den Request Body hochladen

Scrollen Sie nach unten zum Abschnitt “Request Body” und laden Sie die PDF-Datei hoch, die Sie in JSON umwandeln möchten.

Senden starten

Klicken Sie auf „Execute“, um die Anfrage zu starten.

Im Abschnitt “Responses” wird Ihnen eine task_id zurückgegeben: Mit dieser können Sie im nächsten Schritt die konvertierte JSON-Datei abrufen.

4. Ihre PDF-Daten im JSON-Format abrufen

Nachdem das Dokument gesendet wurde, können Sie die extrahierten Daten im JSON-Format abrufen:

  1. Gehen Sie in der Swagger-Dokumentation zum Endpunkt GET /v1/fetch_tasks_results/ — Fetch Tasks Result
  2. Fügen Sie in das vorgesehene Feld die zuvor erhaltene task_id ein.
  3. Klicken Sie auf „Execute“, um die Anfrage zu starten.

Die API liefert Ihnen eine strukturierte JSON-Datei mit allen automatisch extrahierten Informationen, die Sie direkt kopieren oder herunterladen können.

Fokus auf Koncile: vollständige API und intelligentes OCR

Koncile bietet eine komplette Lösung, um Ihre PDFs in strukturiertes JSON zu transformieren – selbst bei komplexen oder schwer lesbaren Dokumenten (Scans, Fotos, Handschriften).

Was Koncile ermöglicht

  • Präzise OCR-Analyse selbst bei schwierigen Dokumenten (Scans, Handschriften ...)
  • Lesen von schwierigen Dokumenten: dunkle Bilder, geringe Auflösung, handschriftliche Notizen – alles wird korrekt erkannt.
  • Erkennung komplexer Tabellen: automatische Identifikation von Zeilen, Spalten und Summen, Umwandlung in eine hierarchische JSON-Struktur.
  • Extraktion von Schlüsseldaten (Beträge, Daten, Lieferanten, Positionen)
  • Ergebnisrückgabe im JSON-Format
  • Anbindung an interne Systeme wie CRM, ERP oder Fachsoftware, um Datenflüsse zu automatisieren.

Diese Daten können genutzt werden, um:

  • automatisch ein Lieferantenformular auszufüllen
  • Zeilen in eine Excel-Tabelle einzufügen
  • eine Freigabe oder Zahlung auszulösen

Für Entwickler

  • eine vollständige technische Dokumentation
  • eine einsatzbereite API
  • eine Python-Bibliothek zur einfachen Integration
  • ein automatisiertes Benachrichtigungssystem (Webhook)

Wenn Sie nicht programmieren können: No-Code-Lösungen

Gute Nachrichten: Sie müssen kein Entwickler sein, um JSON zu nutzen. Dank No-Code- und Low-Code-Tools können Unternehmen ihre Dokumentenverarbeitung heute ohne Programmierung automatisieren.

Sie können Ihre täglichen Tools wie Slack, Google Drive, Dropbox direkt integrieren.

Beispiele für einfache No-Code-Integrationen mit Plattformen wie:

PlattformTypAnwendungsfallZapier / MakeVisuelle No-Code-KonnektorenAutomatisieren: PDF an Koncile senden, JSON abrufen und Daten an Tools weiterleiten (Tabellen, CRM, E-Mails usw.).BubbleNo-Code-App-BuilderKoncile-Plugin integrieren, um Dokumente zu analysieren und Ergebnisse anzuzeigen.n8nOpen-Source-WorkflowsSzenario erstellen: Auslöser in Google Drive, API-Aufruf an Koncile, Daten an Slack, Notion oder CRM senden.

Warum die Umwandlung von PDF in JSON entscheidend ist

Das PDF ist weltweit der Standard für rechtliche, kaufmännische und administrative Dokumente. Doch während es ideal für Menschen ist, ist es für Maschinen schwer lesbar. JSON dagegen ist ein strukturiertes Format, das speziell für maschinelles Verständnis entwickelt wurde.

Die Umwandlung von PDF in JSON macht den Inhalt automatisch nutzbar – etwa durch Ihre Geschäftsanwendungen über eine API. So steigern Sie Effizienz, reduzieren menschliche Fehler und automatisieren Ihre Prozesse.

Grenzen des PDF-Formats

Selbst digital erstellte PDFs bleiben schwer automatisch auswertbar. Probleme entstehen z. B. durch:

  • abweichende Schriftarten und Größen
  • verschachtelte Tabellen
  • Unterschriften, Stempel oder handschriftliche Notizen

Diese semi- oder unstrukturierten Dokumente erfordern manuelle Arbeit – es sei denn, sie werden per OCR in JSON konvertiert.

JSON: der Schlüssel zur maschinenlesbaren Dokumentenverarbeitung

Damit Software ein Dokument versteht, müssen Daten in strukturierter Form extrahiert werden – hier kommt JSON ins Spiel.

Dieses leichte, universelle Format stellt Informationen als Schlüssel/Wert-Paare dar und verwandelt statische PDFs in intelligente, maschinenlesbare Dateien, die über APIs direkt in Ihre Systeme integriert werden können.

Welche Tools eignen sich für die Umwandlung von PDF in JSON?

Die Wahl hängt von der Art des Dokuments (Text oder Bild) und dem gewünschten Automatisierungsgrad ab.

Text-PDF vs. Bild-PDF: der entscheidende Unterschied

  • Text-PDF: enthält digital lesbare Zeichen (z. B. ein aus Word exportiertes Angebot). Solche Dokumente lassen sich direkt mit Tools wie PymuPDF oder PDF.js verarbeiten.
  • Bild-PDF: ist ein Scan oder Foto. Hier ist optische Zeichenerkennung (OCR) erforderlich, etwa mit Tesseract, Adobe PDF Services oder Koncile.

PDF zu JSON — Zusammenfassung

SchrittZweckHauptvorteile1. ExtraktionPDF → JSON über OCR oder TextanalyseStrukturiert Daten (Beträge, Daten, Positionen) für Wiederverwendung.2. StrukturierungLeichtes, maschinenlesbares JSON-FormatSchnellere Analyse, verschachtelte Strukturen, einfache Integration.3. AutomatisierungIntegration über API oder Workflows (Zapier, Make …)Reduziert manuelle Aufgaben, beschleunigt Prozesse.4. ZuverlässigkeitIntelligente Extraktion (KI/OCR)Hohe Genauigkeit, auch bei schwierigen Scans.5. Speicherung & VerarbeitungJSON in Datenbanken oder per APIEinfache Abfragen, Analysen, Visualisierungen.6. Software-IntegrationAn ERP, CRM, Buchhaltung sendenWeniger Fehler, Zeitersparnis, flüssige Abläufe.

Die Umwandlung PDF → JSON ist ein Schlüsselprozess, um statische Dokumente in dynamische Daten zu verwandeln. Durch Strukturierung und Automatisierung via API gewinnen Sie an Zuverlässigkeit, Geschwindigkeit und Leistung bei der Dokumentenverarbeitung.

Wechseln Sie zur Dokumentenautomatisierung

Automatisieren Sie mit Koncile Ihre Extraktionen, reduzieren Sie Fehler und optimieren Sie Ihre Produktivität dank KI OCR mit wenigen Klicks.

Author and Co-Founder at Koncile
Jules Ratier

Mitbegründer von Koncile - Verwandeln Sie jedes Dokument mit LLM in strukturierte Daten - jules@koncile.ai

Jules leitet die Produktentwicklung bei Koncile und konzentriert sich darauf, wie unstrukturierte Dokumente in Geschäftswert umgewandelt werden können.

Ressourcen von Koncile