
Fehler und Betrug in Lieferantenrechnungen automatisch erkennen, POs und Preislisten abgleichen und versteckte Kosten senken.
Fallstudien
Letzte Aktualisierung:
November 5, 2025
5 Minuten
Viele PDF-Dateien enthalten mehrere separate Dokumente, die separat verarbeitet werden müssen. In diesem Artikel werden die besten Methoden zur Trennung Ihrer Dokumente im Jahr 2025 vorgestellt, wobei der Schwerpunkt auf KI-basierten Ansätzen liegt.
Wie kann ich problemlos mehrere Dokumente in derselben PDF-Datei trennen? In diesem Artikel werden die wichtigsten Methoden zur Steigerung der Effizienz anhand der Dateistruktur und des Inhalts vorgestellt.
Wenn dieselbe PDF-Datei mehrere Dokumente enthält; ob Rechnungen, Verträge, Anlagen oder Erklärungen, oft ist es notwendig, sie zu isolieren, um sie einzeln klassifizieren, archivieren oder verwenden zu können.
Dieser Trennschritt kann mühsam sein, wenn er manuell durchgeführt wird, insbesondere bei großen Mengen.
Zum Glück gibt es mehrere Ansätze, die es ermöglichen, erleichtern Sie diese Trennung, mit unterschiedlichem Grad an Komplexität und Präzision. Die Wahl der Methode hängt von der Art der Dokumente, ihrer Struktur und dem Grad der gewünschten Kontrolle ab.
Im Allgemeinen gibt es drei Hauptansätze, um diese Trennung zu erreichen:
Das ist die einfachste Methode. Das PDF wird in festen Intervallen geschnitten, zum Beispiel alle N Seiten. Diese Methode ist ideal, wenn ein Stapel von Rechnungen oder standardisierten Dokumenten als eine einzige Datei exportiert wird, wobei die regelmäßige Seitennummerierung im Voraus bekannt ist (z. B. 10 Verträge mit jeweils 2 Seiten in einer 20-seitigen PDF-Datei). Zahlreiche Lösungen machen es möglich Automatisches Aufteilen einer PDF-Datei in mehrere Dateien entsprechend einer definierten Anzahl von Seiten
Bei Längenunterschieden zwischen Dokumenten wird diese Methode jedoch schnell ungeeignet. Eine dreiseitige Rechnung kann gekürzt werden, oder zwei kurze Dokumente werden möglicherweise falsch zusammengeführt. Es wird daher nicht empfohlen, wenn die Dokumente heterogen oder unvorhersehbar sind.
Beispiele für Lösungen: PDF Sam, Ich liebe PDF oder Sejda.
Hier werden Trigger definiert, um den Beginn eines neuen Dokuments zu erkennen. Beispielsweise kann das Vorhandensein eines bestimmten Logos oder Schlüsselworts oben auf der Seite (wie „Rechnungsnummer“ oder „Vertrag“) auf einen neuen Abschnitt hinweisen. Technisch gesehen kann dies wie folgt geschehen reguläre Ausdrücke (Textsuche) oder andere Filter. Einige Plattformen bieten die Möglichkeit, eine zu konfigurieren benutzerdefinierte Regel (Regex) um ein Trennzeichen hinzuzufügen, sobald ein Muster erkannt wird.
Dies ermöglicht zum Beispiel automatisch getrennte Seiten, sobald eine neue Rechnungsnummer oder ein neuer Vertragstitel erscheint. Diese Methode ist flexibler als eine feste Trennung, da sie sich an den Inhalt des Dokuments anpasst, solange am Anfang jedes Dokuments ein identifizierbares wiederkehrendes Element steht.
Beispiele für Lösungen: ABBYY FineReader, Kofax Power PDF, Adobe Acrobat Pro
Dies ist die fortschrittlichste Methode. Ein an Dokumenten trainierter Algorithmus für künstliche Intelligenz analysiert jede Seite, um festzustellen, ob sie zu derselben Entität wie die vorherige Seite gehört oder ob sie den Anfang eines neuen Dokuments markiert. Konkret: Die KI „liest“ den Inhalt und kann identifizieren, wo jedes Dokument im PDF beginnt und endet. Bei diesem Ansatz können mehrere Hinweise (Layout, Titel, Nummerierung, Stil usw.) kombiniert werden, um den Grenzwert festzulegen, ohne dass für jeden Fall vordefinierte Regeln erforderlich sind. Die KI-Trennung ist ideal für heterogene Stapel von Dokumenten oder wenn die Abgrenzungen keinem festen Muster folgen. Es kann aus den vorgenommenen Korrekturen (Feedback) lernen, um seine Genauigkeit im Laufe der Zeit zu verbessern.
Beispiel für Lösungen: Koncile, Planet KI, Novacore.
Diese Trenntechniken gelten für zahlreiche konkrete Fälle:
Oft scannen Lieferanten oder Dienstleistungen mehrere Rechnungen gleichzeitig, wodurch eine einzige PDF-Datei entsteht, die beispielsweise 5 separate Rechnungen enthält. Eine intelligente Trennung ermöglicht es, jede neue Rechnung zu identifizieren und 5 separate Dateien (oder 5 Abschnitte) zu erstellen, die jeder Rechnung entsprechen, ohne das PDF manuell ausschneiden zu müssen.
Es ist nicht ungewöhnlich, dass auf einen unterzeichneten Vertrag seine Anlagen (allgemeine Bedingungen, Formulare usw.) in einem einzigen PDF folgen. Wenn Sie den Vertrag unabhängig von seinen Anhängen archivieren oder bearbeiten möchten, müssen Sie das Dokument an der richtigen Stelle aufteilen können. Beispielsweise kann eine Trennungsregel den Titel „Anhang“ erkennen oder einfach eine KI-Trennung anwenden, die erkennt, dass der Anhang ein anderes Layout hat als der Hauptvertrag.
In einigen Prozessen enthält eine PDF-Rechnung dann Belege wie Bestellung, ein Lieferschein, ein Zollformular oder ein Berechnungsdetail. Für die Buchhaltung muss nur die Rechnung selbst in einem System verarbeitet werden, während Anlagen an anderer Stelle gespeichert werden können. Bei der intelligenten Trennung wird das Ende der Rechnung identifiziert und die Anlagen werden automatisch in ein separates Dokument aufgeteilt. Wenn beispielsweise jeder Anhang mit einem bestimmten Titel beginnt (z. B. „Bestellung“ oder „Bestellung“), kann eine auf diesem Text basierende Regel als Trennzeichen verwendet werden. Andernfalls kann die KI dank der Struktur des Dokuments lernen, eine Rechnung von einem Anhang zu unterscheiden.
In vielen Branchen (Banken, Versicherungen, Personalwesen, Immobilien...) werden Dokumente, die sich auf denselben Kunden oder Mitarbeiter beziehen, häufig in großen Mengen gescannt: Ausweisdokument, Adressnachweis, Vertrag, Änderung, unterschriebenes Mandat usw. Jedes Stück muss jedoch isoliert und einzeln im Dokumentationssystem oder EDM klassifiziert werden. Eine intelligente Trennung ermöglicht es, diese Unterteilung zu automatisieren, indem die Art der einzelnen Dokumente erkannt und die Indexierung vorbereitet wird. Dadurch werden lange und fehleranfällige manuelle Behandlungen vermieden und gleichzeitig eine bessere Rückverfolgbarkeit der Teile gewährleistet.

Bei Koncile wird die intelligente Dokumententrennung als erweiterte Funktion angeboten, die auf Anfrage erhältlich ist und direkt in unsere Engine integriert ist OCR.
Es basiert auf einer Phase von parallele Vorverarbeitung wer analysiert alle Seiten eines PDFs, um das zu extrahieren diskriminierende Informationen : eindeutige Rechnungsnummer, wiederkehrender Header, spezifische Struktur usw.
Ziel ist es nicht einfach, nach Seitenzahlen oder Schlüsselwörtern zu suchen, sondern Verstehe den Inhalt dank Sprachmodellen (LLM), die in der Lage sind, die Logik von Links zwischen Seiten zu interpretieren.
Das System leitet dann ab kontinuierliche Bereiche entspricht jedem Dokument und führt die Trennung automatisch durch, auch in heterogenen oder nicht standardisierten Dateien.
Im Gegensatz zu einigen Lösungen, die nur auf der Paginierung basieren (unzuverlässig im Falle einer fehlenden Seite oder eines Fehlers), behandelt Koncile jeden Fall kontextuell und dynamisch. Die Verarbeitung ist schnell, da sie parallel verteilt ist, und ermöglicht eine Feintrennung, auch in großen Mengen.
Dieser Ansatz ist besonders nützlich, um Stapel von Rechnungen, Verträgen mit Anhängen oder Logistikdokumenten ohne manuelles Eingreifen zu verarbeiten. Sobald die Dokumente ordnungsgemäß getrennt sind, können sie automatisch extrahiert, kategorisiert oder über die anderen Module der Plattform in Ihre Geschäftstools integriert werden.
Dabei werden bestimmte Seiten aus einer Datei isoliert, die mehrere Dokumente enthält. Dies kann je nach Struktur des PDFs manuell oder automatisch erfolgen. Ziel ist es, jedes Dokument einzeln bearbeiten zu können.
Wählen Sie einfach die Seiten aus, die isoliert werden sollen, und speichern Sie sie in einer separaten Datei. Diese Manipulation ermöglicht eine bessere Organisation der Dokumente. Nützlich, wenn ein einzelnes PDF mehrere Teile enthält.
Sie können mehrere Dateien zu einer kombinieren, indem Sie sie in die richtige Reihenfolge ziehen. Das macht es einfach, große Mengen zu teilen oder zu archivieren. Ideal für die Erstellung eines einzelnen Dokuments aus mehreren Quellen.
Indem Sie überflüssige Seiten löschen oder die Größe der Datei reduzieren. Dadurch lässt sich das Dokument leichter versenden oder speichern. Es ist schnell erledigt und oft sehr nützlich.
Wechseln Sie zur Dokumentenautomatisierung
Automatisieren Sie mit Koncile Ihre Extraktionen, reduzieren Sie Fehler und optimieren Sie Ihre Produktivität dank KI OCR mit wenigen Klicks.
Ressourcen von Koncile

Fehler und Betrug in Lieferantenrechnungen automatisch erkennen, POs und Preislisten abgleichen und versteckte Kosten senken.
Fallstudien

OmniPage vs. KI-OCR 2025: Vergleich der intelligenten und automatisierten Texterkennungslösungen
Komparative

Entdecken Sie die 10 besten KI-Agenten, die 2025 einsatzbereit sind: Stellen Sie sie in weniger als einer Woche bereit und verbessern Sie Ihre Prozesse ohne Codierung.
Komparative