How do I extract the paragraph position? the same way as we extract the positions in word documents.

Question

PV

Praveen kumar V.

--

How do I extract the paragraph position? the same way as we extract the positions in word documents.

Gefragt vor etwa 4 Jahre

Other Integrated Development Environments (IDE)

Kommentar

1 Kommentar

1

Sieht aus, als wären Sie nicht angemeldet.

Benutzer müssen angemeldet sein, um Fragen zu beantworten

Anmelden

Kenneth H. · Answer 1 · 2021-09-23T06:04:08-05:00

Hallo Praveen, Die leistungsstärkste Methode, um die Position eines Absatzes und andere Daten aus einem PDF-Dokument zu extrahieren, ist das iText 7 Add-on pdf2Data, das auch eine Online-Demo hat: https://pdf2data.online/ Vielleicht kann Ihnen diese Stack Overflow-Antwort von iText’s Alexey Subach helfen: https://stackoverflow.com/questions/55807256/how-can-i-get-the-position-of-the-specified-keyword-in-itext7 Während pdf2data der optimale Ansatz ist, können Sie grundlegende Extraktionen mit iText 7 Core unter Verwendung eines regulären Ausdrucks durchführen: PdfDocument pdfDocument = new PdfDocument(new PdfReader(inputFile)); ILocationExtractionStrategy strategy = new RegexBasedLocationExtractionStrategy("regulärer Ausdruck"); PdfCanvasProcessor canvasProcessor = new PdfCanvasProcessor(strategy); canvasProcessor.processPageContent(pdfDocument.getPage(1)); pdfDocument.close(); strategy.getResultantLocations(); // enthält jetzt alle Positionen des übereinstimmenden Textes Wenn Sie eine Antwort für Ihren spezifischen Fall möchten, ist es besser, eine detailliertere Frage auf Stack Overflow zu stellen, in der Sie angeben, was Sie versucht haben und wo Sie feststecken. Wenn Sie eine kommerzielle Lizenz haben, haben Sie auch Zugang zum iText-Kundensupport über Jira. Mit freundlichen Grüßen, Kenneth Holvoet iText Software

How do I extract the paragraph position? the same way as we extract the positions in word documents.

Über iText by Apryse