¿Necesitas traducir documentos escaneados pero con frecuencia enfrentas problemas de calidad al usar traductores en línea? Al traducir archivos PDF escaneados de un idioma a otro, primero es necesario que el traductor de archivos pueda leer correctamente el texto del documento.
En esta publicación, utilizaremos a Pairaphrase como ejemplo (el sistema de gestión de traducción basado en la web para empresas). Al igual que la mayoría de los traductores de PDF escaneados, Pairaphrase utiliza OCR (Reconocimiento Óptico de Caracteres) para leer el texto del archivo PDF. Sin OCR, el resultado de la traducción parecerá sin sentido.
En este artículo, nos centraremos en la importancia de la resolución y la claridad del texto para lograr la traducción más precisa posible de documentos escaneados. Continúa leyendo para aprender cómo obtener una traducción de PDF escaneado de la más alta calidad con estos consejos para solucionar problemas de OCR.
Uno de los primeros pasos para asegurar una traducción de alta calidad de un documento escaneado es eliminar cualquier obstrucción que interfiera con el texto en tu archivo. Mira el video arriba para ver ejemplos detallados y conocer por qué esto es importante.
Algunos ejemplos de obstrucciones de texto incluyen:
Si tienes acceso al archivo original, escanéalo nuevamente con una resolución más alta (300 DPI o más). De lo contrario, es posible que no sea lo suficientemente legible, aunque en pantalla parezca tener buena resolución.
Consejo: Para verificar si tu documento tiene alta resolución, revisa el tamaño del archivo en tu explorador o directorio. Cada página debería tener alrededor de 1MB o más si tiene buena resolución (no siempre es así, pero suele ser un buen indicador).
Si es posible, consigue el documento original en papel y vuelve a escanearlo con alta resolución.
Configura el escaneo con una resolución suficiente para que Pairaphrase lo pueda leer correctamente (apunta a 300 DPI o más). Esto se ajusta en la configuración de tu escáner.
Recomendación: Usa una resolución entre 300 y 600 DPI para obtener los mejores resultados.
El tamaño del archivo será considerablemente más grande, pero si eliges esta opción, obtendrás una traducción mucho más precisa.
El software del escáner en tu computadora tendrá configuraciones que puedes ajustar. Esto significa que puedes cambiar la configuración para escanear el documento como un archivo PDF y con alta resolución. Apunta a una resolución de 300 a 600 DPI para obtener los mejores resultados y guarda el archivo después de escanearlo.
Selecciona “Descargar original.” (Esto te mostrará cómo Pairaphrase ha leído tu PDF.)
Incluso con un archivo de alta resolución, es posible que veas algunas interpretaciones incorrectas de caracteres. Por ejemplo, puede que falten algunos espacios entre palabras o que una “v” se haya leído como una “r.”
Una mejor resolución mejoró la calidad de la traducción, pero aún quedan algunos problemas de espaciado. ¡Esto es fácil de corregir y volver a subir para traducir!
Sin embargo, si optimizas tu archivo según las recomendaciones que te dimos, la mayoría de los caracteres del archivo serán interpretados correctamente. Los usuarios pueden editar y corregir cualquier error del OCR y volver a traducir el archivo.
Pero esto solo demuestra lo delicados que pueden ser los documentos escaneados.
Lamentablemente, esta es actualmente la única manera de preparar un archivo escaneado para obtener la mejor calidad de traducción posible. Por eso, lo ideal es conseguir el archivo digital original que fue impreso como copia en papel (si es posible).
Esperamos que este tutorial te ayude a traducir archivos PDF escaneados de forma más exitosa y precisa en el futuro.
Con Pairaphrase, puedes usar IA para traducir un documento escaneado a más de 140 idiomas y 20,000+ combinaciones lingüísticas. Nuestro traductor de PDF escaneado admite inglés, español, francés, alemán, italiano, portugués, árabe, hindi, sueco, neerlandés, coreano, japonés, chino y más.
Además, traduce 24 tipos de archivos, lo que brinda flexibilidad más allá de la traducción de PDFs escaneados.
Programa una demostración o comparte éste artículo con un colega.