Cómo extraer imágenes, texto y archivos incrustados de documentos de Word, Excel y PowerPoint
Digamos que alguien le envió un documento de Word con muchas imágenes y desea que guarde esas imágenes en su disco duro. Puede extraer imágenes de un documento de Microsoft Office con un simple truco.
Si tiene un archivo de Word (.docx), Excel (.xlsx) o PowerPoint (.pptx) con imágenes u otros archivos incrustados, puede extraerlos (así como el texto del documento), sin tener que guardar cada uno por separado. . Y lo mejor de todo, no necesitas ningún software adicional. Los formatos de archivo basados en XML de Office, docx, xlsx y pptx, son en realidad archivos comprimidos que puede abrir como cualquier archivo .zip normal con Windows. Desde allí, puede extraer imágenes, texto y otros archivos incrustados. Puede usar el soporte .zip incorporado de Windows o una aplicación como 7-Zip si lo prefiere.
Si necesita extraer archivos de un documento de oficina más antiguo, como un archivo .doc, .xls o .ppt, puede hacerlo con una pequeña pieza de software libre. Detallaremos ese proceso al final de esta guía..
Cómo extraer el contenido de un archivo de Office más nuevo (.docx, .xlsx o .pptx)
Para acceder al contenido interno de un documento de Office basado en XML, abra el Explorador de archivos (o el Explorador de Windows en Windows 7), navegue hasta el archivo del que desea extraer el contenido y seleccione el archivo.
Presione "F2" para cambiar el nombre del archivo y cambiar la extensión (.docx, .xlsx o .pptx) a ".zip". Deja la parte principal del nombre de archivo solo. Presiona "Enter" cuando hayas terminado.
El siguiente cuadro de diálogo muestra una advertencia sobre el cambio de la extensión del nombre del archivo. Haga clic en "Sí".
Windows reconoce automáticamente el archivo como un archivo comprimido. Para extraer el contenido del archivo, haga clic con el botón derecho en el archivo y seleccione "Extraer todo" en el menú emergente..
En el cuadro de diálogo "Seleccionar un destino y extraer archivos", la ruta donde se extraerá el contenido del archivo .zip se muestra en el cuadro de edición "Los archivos se extraerán en esta carpeta". De forma predeterminada, una carpeta con el mismo nombre que el nombre del archivo (sin la extensión del archivo) se crea en la misma carpeta que el archivo .zip. Para extraer los archivos en una carpeta diferente, haga clic en "Examinar".
Desplácese hasta donde desea que se extraiga el contenido del archivo .zip y haga clic en "Nueva carpeta" para crear una nueva, si es necesario. Haga clic en "Seleccionar carpeta".
Para abrir una ventana del Explorador de archivos (o del Explorador de Windows) con la carpeta que contiene los archivos extraídos que muestran una vez extraídos, seleccione la casilla de verificación "Mostrar los archivos extraídos al completar" para que haya una marca de verificación en la casilla. Haga clic en "Extraer".
Cómo acceder a las imágenes extraídas
En el contenido extraído se incluye una carpeta llamada "word", si su archivo original es un documento de Word (o "xl" para un documento de Excel o "ppt" para un documento de PowerPoint). Haga doble clic en la carpeta "word" para abrirla..
Haga doble clic en la carpeta "media".
Todas las imágenes del archivo original están en la carpeta "media". Los archivos extraídos son las imágenes originales utilizadas por el documento. Dentro del documento, puede haber un cambio de tamaño u otras propiedades establecidas, pero los archivos extraídos son las imágenes en bruto sin estas propiedades aplicadas.
Cómo acceder al texto extraído
Si no tiene Office instalado en su PC y necesita extraer texto de un archivo de Word (o Excel o PowerPoint), puede acceder al texto extraído en el archivo "document.xml" en la carpeta "word".
Puede abrir este archivo en un editor de texto, como el Bloc de notas o WordPad, pero es más fácil de leer en un editor XML especial, como el programa gratuito, el Bloc de notas XML. Todo el texto del archivo está disponible en trozos de texto sin formato, independientemente del estilo y / o formato aplicado en el propio documento. Por supuesto, si va a descargar software gratuito para ver este texto, también puede descargar LibreOffice, que puede leer documentos de Microsoft Office..
Cómo extraer objetos OLE incrustados o archivos adjuntos
Para acceder a los archivos incrustados en un documento de Word cuando no tiene acceso a Word, primero abra el archivo de Word en WordPad (que viene integrado en Windows). Es posible que observe que algunos de los iconos de archivos incrustados no se muestran, pero siguen ahí. Algunos de los archivos incrustados pueden tener nombres de archivos parciales. WordPad no admite todas las funciones de Word, por lo que es posible que algunos contenidos se muestren de forma incorrecta. Pero deberías poder acceder a los archivos..
Si hacemos clic con el botón derecho en uno de los archivos incrustados en nuestro archivo de ejemplo de Word, una de las opciones es "Abrir objeto PDF". Esto abre el archivo PDF en el programa de lector de PDF predeterminado en su PC. Desde allí, puede guardar el archivo PDF en su disco duro.
Si WordPad no tiene una opción para abrir su archivo, tome nota de su tipo de archivo aquí. Por ejemplo, nuestro segundo archivo en este documento es un archivo .mp3.
Luego, vuelva a su carpeta "Archivos de [Documento]" y haga doble clic en la carpeta "incrustaciones" dentro de la carpeta "palabra".
Desafortunadamente, los tipos de archivos no se conservan en los nombres de archivo. Todos ellos tienen una extensión de archivo ".bin" en su lugar. Si sabe qué tipos de archivos están incrustados en el archivo, probablemente pueda deducir qué archivo es cuál por el tamaño del archivo. En nuestro ejemplo, teníamos un archivo PDF y un archivo MP3 incrustados en nuestro documento. Debido a que el archivo MP3 es probablemente más grande que el archivo PDF, podemos averiguar qué archivo es cuál mirando los tamaños de los archivos y luego cambiarles el nombre usando las extensiones correctas. A continuación, estamos cambiando el nombre del archivo MP3.
Tenga en cuenta que no todos los archivos se abrirán necesariamente mediante este proceso; por ejemplo, nuestro archivo PDF se abrió correctamente desde WordPad, pero no pudimos abrirlo cambiando el nombre de su archivo .bin..
Una vez que haya extraído el contenido del archivo comprimido, puede revertir la extensión del archivo original a .docx, .xlsx o .pptx. El archivo permanecerá intacto y puede abrirse normalmente en el programa correspondiente..
Cómo extraer imágenes de documentos de Office más antiguos (.doc, .xls o .ppt)
Si necesita extraer imágenes de un documento de Office 2003 (o anterior), hay una herramienta gratuita llamada Office Image Extraction Wizard que facilita esta tarea. Este programa también le permite extraer imágenes de varios documentos (del mismo tipo o diferentes) a la vez. Descargue el programa e instálelo (también hay una versión portátil disponible si prefiere no instalarlo).
Ejecute el programa y aparecerá la pantalla de bienvenida. Haga clic en Siguiente".
Primero, debemos seleccionar el archivo del que desea extraer las imágenes. En la pantalla de entrada y salida, haga clic en el botón "Examinar" (icono de carpeta) a la derecha del cuadro de edición de documento.
Vaya a la carpeta que contiene el documento que desea, selecciónelo y haga clic en "Abrir".
La carpeta que contiene el archivo seleccionado se convierte automáticamente en la carpeta de salida. Para crear una subcarpeta dentro de esa carpeta con el mismo nombre que el archivo seleccionado, haga clic en la casilla de verificación "Crear una carpeta aquí" para que haya una marca de verificación en la casilla. Luego, haga clic en "Siguiente".
En la pantalla Ready to Start, haga clic en "Start" para comenzar a extraer las imágenes.
La siguiente pantalla se muestra mientras se realiza el proceso de extracción..
En la pantalla Finalizado, haga clic en "Haga clic aquí para abrir la carpeta de destino" para ver los archivos de imagen resultantes..
Debido a que elegimos crear una subcarpeta, obtenemos una carpeta que contiene los archivos de imagen extraídos del archivo.
Verás todas las imágenes como archivos numerados..
También puede extraer imágenes de varios archivos a la vez. Para hacer esto, en la pantalla de entrada y salida, haga clic en la casilla de verificación "Modo por lotes" para que haya una marca de verificación en la casilla.
Aparece la pantalla Batch Input & Output. Haga clic en "Agregar archivos".
En el cuadro de diálogo Abrir, navegue a la carpeta que contiene cualquiera de los archivos de los que desea extraer imágenes, seleccione los archivos con la tecla "Mayús" o "Ctrl" para seleccionar varios archivos y haga clic en "Abrir".
Puede agregar archivos de otra carpeta haciendo clic nuevamente en "Agregar archivos", navegando a la carpeta en el cuadro de diálogo Abrir, seleccionando los archivos deseados y haciendo clic en "Abrir".
Una vez que haya agregado todos los archivos de los que desea extraer imágenes, puede elegir crear una carpeta separada para cada documento dentro de la misma carpeta que cada documento en el que se guardarán los archivos de imagen haciendo clic en "Crear una carpeta para casilla de verificación "cada documento" para que haya una marca de verificación en la casilla.
También puede especificar que la carpeta de salida sea la "Igual que la carpeta de entrada de cada archivo" o ingresar o seleccionar una carpeta personalizada usando el cuadro de edición y el botón "Examinar" debajo de esa opción. Haga clic en "Siguiente" una vez que haya seleccionado las opciones que desee.
Haga clic en "Inicio" en la pantalla Listo para comenzar.
La siguiente pantalla muestra el progreso de extracción..
El número de imágenes extraídas se muestra en la pantalla Finalizado. Haga clic en "Cerrar" para cerrar el Asistente de extracción de imágenes de Office.
Si eligió crear una carpeta separada para cada documento, verá carpetas con los mismos nombres que los archivos que contienen las imágenes, independientemente de las carpetas de salida que haya especificado..
Nuevamente, obtenemos todas las imágenes como archivos numerados para cada documento..
Ahora puede cambiar el nombre de las imágenes, moverlas y usarlas en sus propios documentos. Solo asegúrate de tener los derechos para usarlos legalmente.