Grâce à l’API Koncile et son interface Swagger, vous pouvez transformer n’importe quel fichier PDF en fichier JSON structuré, prêt à être utilisé dans un logiciel de comptabilité, un CRM ou un ERP. Voici un guide pas à pas pour effectuer cette conversion simplement, sans avoir à coder.
Découvrez comment transformer ces documents en JSON structuré pour les exploiter automatiquement dans vos outils métiers (compta, CRM, ERP…). Grâce à l’API Koncile, convertissez vos PDF en données prêtes à l’emploi, sans coder. Ce guide complet vous explique pas à pas comment automatiser ce processus, que vous soyez développeur ou non.
4 étapes à suivre pour transformer un PDF en JSON via API
Koncile propose une solution clé-en-main pour transformer vos PDF en JSON structuré, même pour des documents complexes ou manuscrits grâce à son logiciel OCR de nouvelle génération.
1. Générez votre clé d’accès API depuis votre compte Koncile
Pour établir une connexion sécurisée avec l’API Koncile, commencez par vous rendre dans les paramètres de votre compte (réservé aux administrateurs).
Accédez à l’onglet API, puis cliquez sur “Générer une clé API” pour obtenir votre clé d’accès personnelle.
Puis sélectionnez l’endpoint : POST /v1/upload_file/ – Upload File
C’est ici que vous pourrez envoyer un document une fois la connexion établie.
C’est ici que vous pourrez envoyer un document une fois la connexion établie.
Activez l’authentification
Cliquez sur l’icône 🔒 cadenas pour activer l’authentification.
Dans la fenêtre qui s’ouvre, collez votre clé API dans le champ value.
Cliquez sur "Authorize" puis "Close" pour valider.
3 - Paramétrez l’envoi du document
Une fois authentifié, vous pouvez préparer l’envoi de votre fichier à convertir :
Renseignez les paramètres optionnels
Vous avez la possibilité d’ajouter dans les champs prévus :
Un ID de document
Un ID de dossier
Ou un template prédéfini (si vous souhaitez appliquer un modèle de traitement spécifique)
Ajoutez votre fichier dans le Request Body
Descendez dans la section "Request Body" et uploadez le fichier PDF que vous souhaitez convertir au format JSON.
Lancez l’envoi
Cliquez ensuite sur "Execute" pour lancer la requête.
Dans la section "Responses", un task_id vous sera retourné : il vous permettra de récupérer le fichier converti au format JSON à l’étape suivante.
4. Récupérez les données de votre PDF au format JSON
Une fois le document envoyé, vous pouvez récupérer les données extraites en JSON :
1. Rendez-vous dans l’endpoint suivant, situé juste en dessous dans la documentation Swagger : GET /v1/fetch_tasks_results/ – Fetch Tasks Result
2. Dans le champ prévu, collez le task_id obtenu lors de l’étape précédente.
3. Cliquez sur "Execute" pour lancer la requête.
L’API vous retourne alors un fichier JSON structuré contenant toutes les informations extraites automatiquement du document envoyé que vous pouvez ensuite copier ou download directement.
Zoom sur Koncile : API complète et OCR intelligent
Koncile propose une solution clé-en-main pour transformer vos PDF en en JSON structuré même lorsqu’il s’agit de documents complexes ou de qualité moyenne (scans, photos, manuscrits).
Ce que Koncile permet
Analyse OCR précise, même sur documents complexes (scans, manuscrits…)
Lire les documents difficiles : images sombres, basse résolution, documents annotés à la main… tout peut être interprété avec précision.
Gérer des tableaux complexes : la solution détecte automatiquement les lignes, colonnes, totaux, et les convertit en structure JSON hiérarchique.
Extraction des données clés (montants, dates, fournisseurs, lignes)
Renvoi des résultats au format JSON
Connexion à vos outils internes pour automatiser l’envoi des données : CRM, ERP, logiciels métiers…
ces données peuvent être utilisées pour :
Remplir automatiquement une fiche fournisseur
Ajouter des lignes dans un tableau Excel
Déclencher une validation ou un paiement
Pour les développeurs de votre équipe
Koncile fournit :
Un guide technique complet
Une API prête à l’emploi
Une bibliothèque Python pour connecter facilement vos outils internes
Un système d’alerte ou de notification automatisée (webhook)
Si vous ne savez pas coder ? Des solutions no-code existent
Bonne nouvelle : il n’est pas nécessaire d’être développeur pour exploiter la puissance du JSON. Grâce à l’émergence des outils no-code et low-code, de nombreuses entreprises peuvent aujourd’hui automatiser leur traitement documentaire sans écrire une ligne de code.
Intégrer directement vos outils du quotidien comme Slack, Google Drive, Drobox
Exemples d'intégration no-code simples avec des plateformes comme :
Plateforme
Type
Cas d’usage
Zapier / Make
Connecteurs no-code visuels
Automatiser des tâches : envoi de PDF à Koncile, récupération du JSON, transmission des données vers divers outils (tableaux, CRM, e-mails, etc.).
Bubble
Créateur d’applications no-code
Intégrer le plugin Koncile pour analyser des documents et afficher les résultats dans une interface personnalisée.
n8n
Workflows open source automatisés
Créer un scénario complet : déclencheur depuis Google Drive ou Dropbox, appel à l’API Koncile, puis envoi des données vers Slack, Notion, CRM, bases de données, etc.
Ce que vous pouvez faire sans coder :
Déclencher une analyse de document dès qu’un fichier arrive dans un dossier.
Extraire automatiquement des informations clés et les intégrer dans un tableau de suivi.
Envoyer les données extraites vers votre outil métier via une interface visuelle.
C’est l’assurance de gagner en productivité, sans dépendre systématiquement de l’équipe technique
Ainsi, Make par exemple, permet de créer un scénario automatisé : dès qu’un PDF est ajouté dans Google Drive, il est envoyé à l’API Koncile pour analyse. Une fois le fichier converti en JSON, les données peuvent être automatiquement récupérées et stockées ou utilisées dans un autre outil, sans écrire de code.
Pourquoi convertir un PDF en JSON est devenu indispensable pour automatiser vos documents
Le PDF est un format universel : il est utilisé partout dans le monde pour transmettre des documents commerciaux, juridiques, comptables, administratifs… Mais s’il est idéal pour la lecture humaine, il l’est beaucoup moins pour le traitement automatisé. À l’inverse, le JSON est un format structuré, conçu pour que les machines puissent comprendre et réutiliser facilement les données.
Transformer un PDF en JSON, c’est donc rendre son contenu exploitable automatiquement par vos logiciels métiers via une API. C’est une étape clé pour gagner en efficacité, réduire les erreurs humaines, et automatiser vos processus internes.
Les limites du PDF dans une logique d’automatisation
Même lorsqu’il est généré numériquement, un fichier PDF reste difficile à exploiter automatiquement. Certaines factures ou documents scannés présentent des variations qui compliquent l’extraction :
polices et tailles de texte différentes,
tableaux mal alignés ou imbriqués,
cases à cocher, signatures, tampons,
données manuscrites ou partiellement floues.
Résultat : ces documents, souvent semi-structurés voire non structurés, nécessitent encore une intervention humaine pour être compris… sauf si l’on passe par un traitement OCR avec export en JSON.
Le JSON : la clé pour rendre vos documents lisibles par les logiciels
Pour que vos outils métier puissent comprendre un document, il faut en extraire les données sous un format structuré. C’est là que le JSON entre en jeu.
Ce format léger et universel permet de représenter les données sous forme de paires clé/valeur. Concrètement, cela revient à transformer un PDF statique en un fichier “intelligent” : lisible par une machine, exploitable par une API, intégrable dans vos logiciels métiers.
Quels outils utiliser pour convertir un PDF en JSON ?
Il existe aujourd’hui plusieurs solutions pour transformer un PDF en JSON. Le choix dépend de la nature du document (texte ou image) et du niveau d’automatisation souhaité.
PDF texte vs PDF image : une différence clé
Un PDF texte contient des caractères numériques directement exploitables (ex : un devis exporté depuis Word ou un ERP). Ces documents peuvent être analysés sans OCR, via des outils d’extraction de texte comme PyMuPDF ou PDF.js.
Un PDF image est une capture visuelle (scan, photo, impression numérisée). Pour en extraire les informations, il faut utiliser une technologie de reconnaissance optique de caractères (OCR) comme Tesseract, Adobe PDF Services, ou une solution avancée comme Koncile.
PDF to JSON — À retenir
Étape
Pourquoi c’est important
Avantages clés
1. Extraction
PDF ➝ JSON via OCR ou parsing de texte
Structure les données (montants, dates, lignes…) pour une exploitation facile.
2. Structuration
Format JSON léger et machine‑readable
Analyse plus rapide, formats imbriqués, interopérabilité native avec bases de données modernes.
3. Automatisation
Intégration via API ou workflows (Zapier, Make…)
Réduction des tâches manuelles, automatisation des flux documentaires.
Gain de temps, diminution des erreurs, fluidité opérationnelle.
La conversion PDF → JSON représente un travail fondamental pour transformer des documents statiques en données dynamiques. Grâce à la structuration et l’automatisation via API, vous gagnez en fiabilité, rapidité et performance dans la gestion documentaire.
Intégrez ces données structurées directement dans vos systèmes métiers pour assurer un traitement fiable, rapide et parfaitement intégré à vos processus comptables, analytiques ou opérationnels.
Découvrez comment le parsing permet d’automatiser l’extraction de données depuis vos documents PDF, scannés ou numériques. Grâce à l’OCR, au NLP ou à des règles, il transforme les contenus bruts en données structurées. Un guide complet pour choisir la meilleure solution d’automatisation documentaire.
Un retour d’expérience concret sur l’usage de l’automatisation documentaire au service de la performance métier. Nona a automatisé le traitement de ses factures fournisseurs en intégrant l’OCR de Koncile dans son processus de gestion fournisseurs.