Bonjour Praveen,
La manière la plus puissante d'extraire la position d'un paragraphe et d'autres données d'un document PDF est l'add-on pdf2Data d'iText 7, qui dispose également d'une démo en ligne : https://pdf2data.online/
Peut-être que cette réponse sur Stack Overflow par Alexey Subach d'iText peut vous aider : https://stackoverflow.com/questions/55807256/how-can-i-get-the-position-of-the-specified-keyword-in-itext7
Bien que pdf2data soit l'approche optimale, vous pouvez effectuer des extractions basiques avec iText 7 Core en utilisant une expression régulière :
PdfDocument pdfDocument = new PdfDocument(new PdfReader(inputFile));
ILocationExtractionStrategy strategy = new RegexBasedLocationExtractionStrategy("expression régulière");
PdfCanvasProcessor canvasProcessor = new PdfCanvasProcessor(strategy);
canvasProcessor.processPageContent(pdfDocument.getPage(1));
pdfDocument.close();
strategy.getResultantLocations(); // contient maintenant tous les emplacements du texte correspondant
Si vous avez une licence commerciale, vous aurez également accès au support client d'iText via Jira.
Cordialement,
Kenneth Holvoet
iText Software
Les utilisateurs doivent être connectés pour écrire des commentaires
Se connecter
Répondre
Déjà iText by Apryse?
À propos de iText by Apryse
Auparavant connu sous le nom d'iText, nous faisons maintenant partie d'Apryse. Avec une technologie optimisée et une suite complète d'outils, Apryse simplifie même les projets les plus complexes, vous
À la recherche de informations sur les logiciels ?
Avec plus de 2,5 millions d'avis, nous pouvons fournir les détails spécifiques qui vous aident à prendre une décision d'achat de logiciel éclairée pour votre entreprise. Trouver le bon produit est important, laissez-nous vous aider.
ou continuer avec
LinkedIn
Google
Google (Entreprise)
Les adresses Gmail.com ne sont pas autorisées. Un domaine professionnel utilisant Google est autorisé.