Best Software for 2025 is now live!
Matthew M.
MM
Freelance Translator Spanish to English at Self-Employed

What is the best way to get good quality conversions from PDFs to Word documents that have complicated pictures and text?

I have a translation or two to do that have a good amount of random marks on them and are PDFs. I was wondering if there's a good way to still convert these to Word documents while still preserving the formatting. I am not interested in the random marks, of course, but I am interested in the text.
2 commentaires
On dirait que vous n'êtes pas connecté.
Les utilisateurs doivent être connectés pour répondre aux questions
Se connecter
SF
CEO at SCS Computer Consultants, Inc.
0
L'OCR fait un travail phénoménal en gérant les marques errantes, les plis dans le papier, etc. Ils seront transformés en graphiques, tandis que le texte sera traité comme des blocs séparés. Normalement, le document peut être édité tel quel -- en supprimant les blocs graphiques superflus. Mais j'ai constaté que si le document OCRisé est trop encombré, il faudra recourir à copier et coller le texte. Il y avait plusieurs scans que j'avais faits qui avaient des graphiques SOUS le texte. La dernière fois que cela s'est produit, c'était avec une image d'un pli sur la page. J'ai dû recourir à copier et coller parce que le graphique refusait d'être supprimé sans enlever la plupart du texte avec lui.
On dirait que vous n'êtes pas connecté.
Les utilisateurs doivent être connectés pour écrire des commentaires
Se connecter
Répondre
Gary F.
GF
Independent Publishing Professional
0
Il est peu probable que vous trouviez quelque chose qui puisse parfaitement différencier entre le texte légitime et les imperfections / marques aléatoires. J'ai essayé cela sur mon propre système avant d'écrire ce qui précède ; cela fonctionne bien.
On dirait que vous n'êtes pas connecté.
Les utilisateurs doivent être connectés pour écrire des commentaires
Se connecter
Répondre