Del Papel a Digital con OCR Online - ZonaVertical.com
Tecnología

Del Papel a Digital con OCR Online

online ocr - zonavertical.com

De vez en cuando ocurre que encontramos un documento impreso — en papel — que no tiene un respaldo en archivo digital, pero nos gustaría mucho modificar solamente una parte del texto para volver a utilizarlo … y no es una opción viable invertir tiempo en digitar para transcribir todo el documento. En este caso viene bien escanear la impresión y convertirla en un archivo digital, con formato de documento portátil (PDF), para después usar un software de reconocimiento óptico de caracteres (OCR) y así obtener una versión de texto modificable.

Para mí, el desafío fue un poco mayor: Convertir un listado impreso proveniente de una hoja de cálculo, con datos de personas (nombres, teléfonos, correos), para obtener una planilla modificable, ya que no existía el archivo original y era necesario corregir algunos datos, como también estandarizar los números de teléfono (con el signo + y código de país) para poder exportarlos a un sistema de mensajería.

Si bien un documento que contiene texto solamente, es fácilmente modificable al encontrar un error de escaneado, no hay margen de error cuando se trata de direcciones de email o números de teléfono. Debe ser exacto, o simplemente no es.

Luego de intentar infructuosamente obtener un software gratuito (o de precio razonable, y no en idioma chino, literalmente) para realizar OCR directamente desde el escáner de mi impresora multifuncional, encontré una opción online que funcionó con la precisión requerida y para la cantidad de hojas o documentos deseada.

Se trata de OnlineOCR.net, un servicio “gratuito” de OCR en línea que admite 46 idiomas y permite extraer texto, desde archivos PDF o desde imágenes (JPG, BMP, TIFF, GIF) en 3 simples pasos, para convertirlo en documentos editables de Word, Excel y texto sin formato. Las comillas en la característica de gratuito las puse porque ya sabemos que en realidad nada es gratis en esta vida, y a medida que uses el servicio te darás cuenta de cómo se financia.

Una de las ventajas es que no requiere instalación en tu computadora para reconocer texto y caracteres, desde documentos escaneados y convertidos a PDF (incluidos archivos de varias páginas), fotografías e imágenes captadas por cámaras digitales. Los documentos convertidos con OCR se ven exactamente como el original, incluyendo tablas, columnas y gráficos.

El servicio de OnlineOCR.net ofrece un “modo de invitado” (sin registro) que te permite convertir 15 archivos por hora si son de una sola página, o la primera página de hasta 15 archivos de varias páginas. La única opción en este caso es el idioma del documento original.

Si te inscribes, desbloquearás la capacidad de convertir documentos PDF de hasta 15 páginas y otras características opcionales durante la conversión (uno de los 7 formatos de archivo de salida, páginas especificas de un documento multipágina, convertir a blanco y negro, combinar archivos en varias páginas, y el tipo de archivo PDF). En ambos casos tendrás un límite de 50 páginas (indicado en la parte superior izquierda de la pantalla) antes de recibir el aviso de que se te acabaron las páginas gratuitas, pero puedes pagar por las adicionales, entre 1 centavo de dólar y 10 centavos por página, dependiendo del volumen de documentos a procesar.

La otra forma en la que pagas (indirectamente) por usar el servicio, es a través de la publicidad que aparece en el sitio web cuando no te has registrado o no has ingresado a tu cuenta todavía. En este caso basta con no confundirse y evitar pinchar los pendones publicitarios en vez de los botones necesarios para convertir tus archivos.

Por otra parte, hay un programa de recompensas en el que puedes participar, para recibir hasta 2.000 páginas gratis, incluyendo la posibilidad de ayudar a mejorar la traducción al español del sitio web. Puedes encontrar esta opción fácilmente en el menú principal.

Si tu emergencia por realizar conversiones de papel a digital no implica grandes volúmenes de documentos, las 50 páginas incluidas con tu inscripción podrían ser más que suficientes para utilizar el servicio de OnlineOCR.net tal como está y sin pagar un costo adicional. Pero si la exigencia es mayor, bien vale la pena el costo por la rapidez y precisión para completar la tarea.