Digitalizar documentos es una tarea que nadie quiere hacer. El solo hecho de pensar en tomar un papel, llevarlo al escáner, generar un archivo y luego reconocer los caracteres para obtener un documento es algo terriblemente tedioso.
Si no hay demasiadas exigencias, la tarea se puede hacer con el software de reconocimiento de caracteres que trae Microsoft Office. Pero si buscamos agilizar el flujo de trabajo y obtener mejores resultados hay que acudir a una solución profesional.
ABBYY FineReader lleva bastante tiempo en el mercado y con el correr de los años se ha ido consolidando en este segmento que utiliza fundamentalmente el sector educativo, legal, financiero y gubernamental. Este es el análisis de sus principales funcionalidades de ABBY Fine Reader 11.
Comenzado a utilizar el programa
La puesta en marcha del programa es bastante sencilla. Luego de la instalación, el programa pide permiso para ejecutarse y accedemos a la pantalla principal con una lista de tareas posibles a realizar: digitalizar una imagen, digitalizar y convertir el documento a PDF. Una opción interesante es que podemos generar directamente un libro electrónico convirtiendo el documento a HTML o EPUB con lo cual ahorramos muchos pasos intermedios.
El punto verdaderamente fuerte del programa es la tecnología de reconocimiento de caracteres. Funciona realmente muy bien aun en imágenes que no tienen el texto demasiado nítido. Además, tiene un sistema inteligente que le permite reconocer encabezados, pies de páginas y otros elementos repetitivos de una página que no forman parte del documento central.
Por ejemplo, probé con algo no convencional como un libro de cocina y el programa fue capaz de reconocer correctamente los diferentes bloques de texto como título, descripción, lista de ingredientes, preparación y presentar de forma separada la fotografía del plato.
Novedades
La nueva versión del programa tiene como novedad la reorganización del flujo de trabajo lo que hace más intuitiva la utilización del programa. De hecho, se han enfocado en facilitar la tarea a los usuarios ocasionales y no especializados que de improviso se ven necesitados de acudir a un software de reconocimiento de caracteres.
En este sentido, hay que destacar que la interfaz es muy intuitiva y fácil de usar. Las funciones más habituales son rápidamente accesibles y el entorno de trabajo es muy amigable.
La otra novedad es una mayor velocidad de procesamiento. Por ejemplo, tiene un modo de procesamiento rápido que –aseguran- es un 70% más veloz que la versión anterior. En el modo convencional, la mejora en el reconocimiento de caracteres llega hasta el 25%.
Algunas otras pequeñas novedades que facilitan el trabajo de procesamiento tienen que ver con la posibilidad de corregir brillo, contraste y nivel de las imágenes obtenidas directamente desde el programa sin tener que acudir a un editor de imágenes. Algo bastante útil si trabajamos con fotocopias de baja calidad y hojas con manchas de tinta. La nueva versión también mejora la detección de tipografías y estilos en el texto para poder representar adecuadamente negritas, cursivas y subrayados, entre otros.
Una función que me pareció especialmente interesante es la posibilidad de generar ebooks a partir de documentos escaneados con muchas opciones de salida: ePub, FB2 e incluso transferirlo a Kindle mediante una cuenta de Amazon.
Evaluación
Estuve evaluando el software por un par de semanas. Tengo que aclarar que no soy un usuario asiduo de este tipo de programas porque intento prescindir del papel tanto como puedo. Sin embargo hay situaciones inevitables como cuando el archivo original no está disponible en formato digital.
Mi impresión general es que el sector de software de OCR ha evolucionado mucho y poco tiene ver con la época en que utiliza un escáner de forma habitual. La verdad, da más pereza conectar el scanner a mi notebook que utilizar el programa que guía todo el proceso en pasos muy sencillos.
Probé realizar reconocimiento en documentos de diferente tipo (libros, fotocopias, impresiones en chorro de tinta de diferente calidad) y la precisión del software es notable. Además, detecta números de página, encabezados y notas al pie con lo cual el archivo necesita muy pocas modificaciones.
Otro punto fuerte: es muy fácil generar eBooks con lo cual rápidamente puedo llevar un documento de papel a un dispositivo móvil. También permite guardar de forma nativa en formatos para Microsoft Office, Open Office y PDF.
En síntesis, ABBYY Fine Reader es la opción profesional para digitalizar documentos y es difícil encontrarle un punto débil. Completo, sencillo de utilizar e incluye una serie de software complementario como ABBYY Screenshot Reader para digitalizar capturas de pantalla y, en la versión corporativa, un ABBYY Business Card Reader que permite digitalizar tarjetas de presentación.
El único detalle a señalar es que la versión para Lationamérica tiene la interfaz de instalación en portugués, aunque una vez finalizado el proceso se puede cambiar a español. Ya está disponible la nueva versión con interfaz en español para lationamérica a un precio reducido que contiene solo los idiomas más habituales.
Quizás, en mundo ideal donde la utilización del papel se reduzca al mínimo imprescindible la utilización de este tipo de software sea cada vez menor hasta transformarse en un segmento marginal. Sin embargo, mientras los gobiernos, el sistema legal y las universidades sigan siendo grandes productores y consumidores de información fijada en celulosa seguiremos usando software de este tipo.
Ficha técnica
- Nombre: ABBYY FineReader® 11
- Fabricante: ABBYY
- Web del producto: http://latam.abbyy.com/finereader/
- Versiones y precios: Español para Latinoamérica: $USD 89 / Profesional: $USD 149 – Corporativa.
- Requerimientos: PC con procesador de 1 GHz or superior; sistema operative Microsoft Windows 7, Microsoft Windows Vista, Microsoft Windows Server 2003, Microsoft Windows Server 2008, Microsoft Windows Server 2008 R2 o Microsoft Windows XP; 1024 MB disponible de RAM y 700 MB de disco para la instalación con otros 700 MB libres para el funcionamiento del programa.