Página principal » Caja de herramientas » Cómo extraer texto de imágenes usando la línea de comandos

    Cómo extraer texto de imágenes usando la línea de comandos

    Es bastante fácil leer una imagen y extraer el texto usted mismo. Pero tirando dinámicamente texto de una foto es un poco más difícil, y afortunadamente, imgclip ofrece una solución bastante simple.

    Esta herramienta de línea de comandos Se ejecuta en la terminal para Mac, Windows y Linux. Simplemente toma un argumento para el archivo de imagen junto con el idioma, luego devuelve el texto copiado a tu portapapeles.

    Puede instalar toda la biblioteca a través de npm y es un instalación bastante simple. La cosa es sólo unos pocos KB grandes y viene con un archivo JS que puedes buscar en GitHub.

    Imgclip utiliza el Tesseract.js biblioteca para automatizar el procesamiento de imágenes y tirar texto a través LOC. Es una de las bibliotecas de OCR más poderosas hasta la fecha, y es completamente de código abierto como imgclip.

    Creo que estoy muy impresionado con la calidad y la velocidad de esta herramienta. Realmente funciona para extraer texto exacto Y es una de las herramientas más simples de usar..

    El comando imgclip debería ser correr directamente en la terminal, seguido por el camino relativo a la imagen. También puedes añadir cuatro opciones Al final para personalizar la salida..

    1. -h, --ayuda: información de uso de salidas
    2. -V, --versión: genera el número de versión
    3. -l, --lang: Muestra el idioma del texto en la imagen.
    4. -pag, --impresión: imprime el texto en la imagen (en lugar de copiar al portapapeles)

    A partir de este escrito, Tesseract. soporta 65 idiomas Con más en camino. El código que adjuntas a la --lang La etiqueta debe ser cualquier código que se use en esos archivos Tesseract.

    Por ejemplo, -l eng buscará la imagen para texto en inglés, mientras -l jpn buscará Texto japonés y hasta puedes correr -l jpn_vert buscar texto japonés orientado verticalmente.

    Ya que imgclip depende en gran medida de Tesseract, básicamente tiene a su disposición el poder de toda la biblioteca..

    A Empezar, Visite la página de GitHub y descargue una copia localmente, o instálela en un directorio específico a través de npm. Luego, puede ejecutar la herramienta en el terminal como una aplicación para analiza cualquier imagen que quieras.

    Para ver imgclip en acción, Echa un vistazo a este breve video creado como una demostración de imgclip.