Guatemala Guatemala, jueves 09 de febrero de 2012 | 05:00:47 |
 
 

Cómo recuperar el texto de documentos escaneados


Libros, resoluciones judiciales, boletines, o cualquier otro tipo de documento de varias páginas que ha sido almacenado en un PDF puede convertirse en un archivo editable de Microsoft Word. Lo mismo ocurre con los PDF que han sido protegidos (no puede copiarse el contenido). Los periodistas pueden necesitar el texto de estos materiales para editarlo, resaltarlo, recoger algunas citas y mucho más.

En un anterior post recomendamos FineReader para obtener información de una sola imagen. Sin embargo, también hay una opción para ‘leer’ el texto de un archivo con varias páginas.

Después de instalarlo en la versión de prueba, aparecerá la ventana “Tareas”. Haz clic en la segunda opción llamada “Archivo a Microsoft Word”. Se abrirá una pestaña para que elijas el documento en PDF/imagen. El programa lo reconocerá:



Luego se abrirá una ventana de Word con el documento:


El reconocimiento por defecto detectará imágenes, tablas y texto. Si deseas editar estas opciones, solo debes revisar cada página. Encontrarás que algunas zonas del archivo aparecerán resaltadas en verde y otras en rojo.



El color verde representa Texto y el rojo, Imagen. También puedes encontrar Tablas (color azul).


Para actualizar la revisión de esa página solo haz clic en el botón “Leer” (mira la imagen anterior).

¿Qué les parece? Si quieren obtener este software. Clases de Periodismo y ABBYY van a sortear tres licencias de este programa. La primera será obsequiada a un lector del blog. Solo debes enviar un comentario  con tu opinión sobre la utilidad de FineReader. Si haz probado la versión de prueba, no dejes de agregar tus dudas sobre su funcionamiento. Anunciaremos al ganador mañana a las 10 a.m. (hora peruana).

Además, hay otras dos oportunidades para conseguir esta licencia. Hoy en la tarde haremos otro sorteo para los seguidores de @cdperiodismo en Twitter. Los tuiteros solo deben hacer RT de este post. Además, los fans del Facebook que quieran participar deberán compartir esta entrada en su perfil.

Los resultados en la red de microblogging se darán esta noche, mientras que los usuarios de Facebook tendrán hasta mañana para participar.

Leer más y comentar: Cómo recuperar el texto de documentos escaneados »

Artículos recientes de Clases de Periodismo

CNN suspende a presentador por tuits homofóbicos
La historia incompleta de la periodista mexicana asesinada por informar en las redes sociales
Periodistas venezolanos permanecen detenidos por la Milicia Bolivariana
TweetTrendings, una explicación de los trending topics en español
¿Te parece ofensiva esta foto en un perfil de Facebook?
30 libros en español para periodistas
‘Wikipedia cubana’ llama “cibermercenaria” a Yoani Sánchez
Periodista ecuatoriano pide asilo en Estados Unidos
Tres claves para que los periodistas se desarrollen en las redes sociales
BBC: ‘Las noticias de último minuto deben estar en el sistema antes que en Twitter’

Mas artículos de Clases de Periodismo