5 servicios en línea gratuitos de OCR probados y revisados
¿Tiene un documento PDF o una imagen que le gustaría convertir a texto? Recientemente, alguien me envió un documento en el correo que necesitaba editar y enviar con las correcciones. La persona no pudo localizar una copia digital, así que me encargaron que todo ese texto se pusiera en formato digital.
No había forma de que pasara horas escribiendo todo de nuevo, así que terminé tomando una buena imagen del documento y luego me abrí paso a través de un montón de servicios de OCR en línea para ver cuál me daría la mejor resultados.
En este artículo, revisaré un par de mis sitios favoritos para OCR que son gratuitos. Vale la pena señalar que la mayoría de estos sitios ofrecen un servicio básico gratuito y luego tienen opciones de pago si desea funciones adicionales como imágenes más grandes, documentos PDF de varias páginas, diferentes idiomas de entrada, etc..
También es bueno saber de antemano que la mayoría de estos servicios no podrán coincidir con el formato de su documento original. Estos son principalmente para extraer texto y eso es todo. Si necesita que todo esté en un diseño o formato específico, deberá hacerlo manualmente una vez que obtenga todo el texto del OCR..
Además, los mejores resultados para obtener el texto provendrán de documentos con una resolución de 200 a 400 ppp. Si tiene una imagen de baja DPI, los resultados no serán tan buenos.
Por último, hubo muchos sitios que probé que simplemente no funcionaron. Si busca en Google OCR en línea gratis, verá un montón de sitios, pero varios de los sitios en los 10 mejores resultados ni siquiera completaron la conversión. Algunos pasaban el tiempo de espera, otros cometían errores y otros se quedaban atascados en la página de "conversión", por lo que ni siquiera me molesté en mencionar esos sitios..
Para cada sitio, probé dos documentos para ver qué tan bien sería el resultado. Para mis pruebas, simplemente usé mi iPhone 5S para tomar una fotografía de ambos documentos y luego los subí directamente a los sitios web para su conversión..
En caso de que quiera ver cómo se veían las imágenes que usé para mi prueba, las adjunto aquí: Test1 y Test2. Tenga en cuenta que estas no son las versiones de resolución completa de las imágenes tomadas desde el teléfono. Utilicé la imagen de resolución completa al subir a los sitios.
OnlineOCR
OnlineOCR.net es un sitio limpio y simple que entregó muy buenos resultados en mi prueba. Lo principal que me gusta de esto es que no tiene toneladas de anuncios por todas partes, como suele ser el caso con este tipo de sitios de servicio de nicho..
Para comenzar, selecciona tu archivo y espera a que termine de cargarse. El tamaño máximo de carga para este sitio es de 100 MB. Si se registra para obtener una cuenta gratuita, obtiene algunas funciones adicionales, como el tamaño de carga más grande, los PDF de varias páginas, diferentes idiomas de entrada, más conversiones por hora, etc..
A continuación, elija su idioma de entrada y luego elija el formato de salida. Puede elegir entre Word, Excel o Texto sin formato. Haga clic en el Convertir botón y verá el texto que se muestra en la parte inferior de un cuadro junto con un enlace de descarga.
Si todo lo que desea es el texto, solo cópielo y péguelo desde el cuadro. Sin embargo, le sugiero que descargue el documento de Word porque hace un trabajo sorprendentemente excelente al mantener el diseño del documento original..
Por ejemplo, cuando abrí el documento de Word para mi segunda prueba, me sorprendió descubrir que el documento incluía una tabla con tres columnas, como en la imagen.
De todos los sitios, este fue el mejor con diferencia. Vale la pena registrarse si necesitas hacer muchas conversiones..
Para completar, también voy a vincular a los archivos de salida creados por cada servicio para que pueda ver los resultados por sí mismo. Aquí están los resultados de OnlineOCR: Test1 Doc y Test2 Doc.
Tenga en cuenta que al abrir estos documentos de Word en su computadora, recibirá un mensaje en Word que indica que se trata de Internet y que la edición ha sido deshabilitada. Eso está perfectamente bien porque Word no confía en los documentos de Internet y realmente no tiene que habilitar la edición si solo desea ver el documento.
i2OCR
Otro sitio que dio muy buenos resultados fue i2OCR. El proceso es muy similar: elija su idioma, archivo y luego presione Extraer texto.
Tendrá que esperar un minuto o dos aquí porque este sitio tarda un poco más. Además, en el Paso 2, asegúrate de que tu imagen se muestre del lado derecho hacia arriba en la vista previa, de lo contrario obtendrás un montón de galimatías como salida. Por alguna razón, las imágenes de mi iPhone se mostraban en modo vertical en mi computadora, pero de forma horizontal cuando las subí a este sitio.
Tuve que abrir manualmente la imagen en una aplicación de edición de fotos, rotarla 90 grados, luego girarla de nuevo a vertical y luego guardarla de nuevo. Una vez completado, desplácese hacia abajo y le mostrará una vista previa del texto junto con un botón de descarga.
A este sitio le fue bastante bien con el resultado de la primera prueba, pero no lo hizo tan bien con la segunda prueba que tenía el diseño de la columna. Aquí están los resultados de i2OCR: Test1 Doc y Test2 Doc.
FreeOCR
Free-OCR.com tomará sus imágenes y las convertirá en texto plano. No tiene una opción para exportar a formato Word. Elija su archivo, seleccione un idioma y luego haga clic en comienzo.
El sitio es rápido y obtendrás el resultado bastante rápido. Simplemente haga clic en el enlace para descargar el archivo de texto a su computadora.
Como se menciona a continuación en NewOCR, este sitio pone en mayúscula todas las T del documento. No tengo idea de por qué haría eso, pero por alguna extraña razón este sitio y NewOCR hicieron esto. No es un gran problema cambiarlo, pero es un proceso tedioso que realmente no deberías tener que hacer.
Aquí están los resultados de FreeOCR: Test1 Doc y Test2 Doc.
ABBYY FineReader en línea
Para utilizar FineReader Online, debe registrarse para obtener una cuenta, lo que le brinda una prueba gratuita de 15 días para OCR de hasta 10 páginas de forma gratuita. Si solo necesita hacer un OCR de una sola vez para un par de páginas, entonces puede usar este servicio. Asegúrese de hacer clic en el enlace de verificación en el correo electrónico de confirmación después de registrarse.
Haga clic en Reconocer en la parte superior y luego haga clic Subir para seleccionar su archivo. Elija su idioma, formato de salida y luego haga clic en Reconocer en el fondo. Este sitio tiene una interfaz limpia y no hay anuncios también.
En mis pruebas, este sitio pudo capturar el texto del primer documento de prueba, pero fue absolutamente enorme cuando abrí el documento de Word, así que terminé haciéndolo de nuevo y seleccionando Texto sin formato como formato de salida..
Para la segunda prueba con las columnas, el documento de Word estaba vacío y ni siquiera pude encontrar el texto. No estoy seguro de lo que sucedió allí, pero no parece ser capaz de manejar nada más que simples párrafos. Aquí están los resultados de FineReader: Test1 Doc y Test2 Doc.
NuevoOCR
El siguiente sitio, NewOCR.com, estaba bien, pero no tan bueno como el primer sitio. En primer lugar, tiene anuncios, pero afortunadamente no es una tonelada. Primero seleccione su archivo y luego haga clic en Avance botón.
Luego puede rotar la imagen y ajustar el área donde desea escanear el texto. Es bastante parecido a cómo funciona el proceso de escaneo en una computadora con un escáner conectado.
Si el documento tiene varias columnas, puede verificar la Análisis de diseño de página botón e intentará dividir el texto en columnas. Haga clic en el botón OCR, espere unos segundos para que se complete y luego desplácese hacia abajo hasta que la página se actualice..
En la primera prueba, obtuvo todo el texto correctamente, ¡pero por alguna razón puso mayúscula en todas las T del documento! No tengo idea de por qué haría eso, pero lo hizo. En la segunda prueba con el análisis de página habilitado, obtuvo la mayor parte del texto, pero el diseño estaba completamente apagado.
Aquí están los resultados de NewOCR: Test1 Doc y Test2 Doc.
Conclusión
Como puedes ver, el servicio gratuito no te da muy buenos resultados la mayoría de las veces, desafortunadamente. El primer sitio mencionado es el mejor con diferencia, ya que no solo hizo un gran trabajo de reconocimiento de todo el texto, sino que también logró conservar el formato del documento original..
Sin embargo, si solo necesita texto, la mayoría de los sitios web anteriores deberían poder hacerlo por usted. Si tiene alguna pregunta, no dude en comentar. Disfrutar!