Best Software for 2025 is now live!
Matthew M.
MM
Freelance Translator Spanish to English at Self-Employed

What is the best way to get good quality conversions from PDFs to Word documents that have complicated pictures and text?

I have a translation or two to do that have a good amount of random marks on them and are PDFs. I was wondering if there's a good way to still convert these to Word documents while still preserving the formatting. I am not interested in the random marks, of course, but I am interested in the text.
2 Kommentare
Sieht aus, als wären Sie nicht angemeldet.
Benutzer müssen angemeldet sein, um Fragen zu beantworten
Anmelden
SF
CEO at SCS Computer Consultants, Inc.
0
Das OCR leistet phänomenale Arbeit beim Umgang mit Streumarken, Knicken im Papier usw. Diese werden in Grafiken umgewandelt, während der Text als separate Blöcke behandelt wird. Normalerweise kann das Dokument so bearbeitet werden, wie es ist – indem die überflüssigen Grafikblöcke gelöscht werden. Aber ich habe festgestellt, dass, wenn das OCR-Dokument zu überladen ist, man auf das Kopieren und Einfügen des Textes zurückgreifen muss. Es gab mehrere Scans, die ich gemacht hatte, bei denen Grafiken UNTER dem Text waren. Das letzte Mal, als dies geschah, war mit einem Bild eines Knickes auf der Seite. Ich musste auf das Kopieren und Einfügen zurückgreifen, weil sich die Grafik weigerte, entfernt zu werden, ohne dass der größte Teil des Textes mit entfernt wurde.
Sieht aus, als wären Sie nicht angemeldet.
Benutzer müssen angemeldet sein, um Kommentare zu schreiben
Anmelden
Antworten
Gary F.
GF
Independent Publishing Professional
0
Es ist unwahrscheinlich, dass Sie etwas finden, das perfekt zwischen legitimen Text und zufälligen Flecken/Markierungen unterscheiden kann. Ich habe dies auf meinem eigenen System ausprobiert, bevor ich das Obige geschrieben habe; es funktioniert einwandfrei.
Sieht aus, als wären Sie nicht angemeldet.
Benutzer müssen angemeldet sein, um Kommentare zu schreiben
Anmelden
Antworten