Supposons que quelqu’un vous ait envoyé un document Word contenant de nombreuses images et que vous souhaitiez que vous enregistriez ces images sur votre disque dur. Vous pouvez extraire des images d’un document Microsoft Office avec une astuce simple.
Si vous avez un fichier Word (.docx), Excel (.xlsx) ou PowerPoint (.pptx) avec des images ou d’autres fichiers intégrés, vous pouvez les extraire (ainsi que le texte du document), sans avoir à les enregistrer séparément . Et surtout, vous n’avez pas besoin de logiciel supplémentaire. Les formats de fichiers basés sur Office XML – docx, xlsx et pptx – sont en fait des archives compressées que vous pouvez ouvrir comme n’importe quel fichier .zip normal avec Windows. De là, vous pouvez extraire des images, du texte et d’autres fichiers intégrés. Vous pouvez utiliser le support .zip intégré de Windows ou une application comme 7-Zip si vous préférez.
Si vous avez besoin d’extraire des fichiers d’un document Office plus ancien, comme un fichier .doc, .xls ou .ppt, vous pouvez le faire avec un petit logiciel gratuit. Nous détaillerons ce processus à la fin de ce guide.
Table des matières
Comment extraire le contenu d’un fichier Office plus récent (.docx, .xlsx ou .pptx)
Pour accéder au contenu interne d’un document Office basé sur XML, ouvrez l’Explorateur de fichiers (ou l’Explorateur Windows dans Windows 7), accédez au fichier dont vous souhaitez extraire le contenu et sélectionnez le fichier.
Appuyez sur « F2 » pour renommer le fichier et changez l’extension (.docx, .xlsx ou .pptx) en « .zip ». Laissez la partie principale du nom de fichier seule. Appuyez sur « Entrée » lorsque vous avez terminé.
La boîte de dialogue suivante affiche un avertissement vous invitant à modifier l’extension du nom de fichier. Cliquez sur « Oui ».
Windows reconnaît automatiquement le fichier comme un fichier compressé. Pour extraire le contenu du fichier, faites un clic droit sur le fichier et sélectionnez «Extraire tout» dans le menu contextuel.
Dans la boîte de dialogue «Sélectionner une destination et extraire les fichiers», le chemin d’accès où le contenu du fichier .zip sera extrait s’affiche dans la zone d’édition «Les fichiers seront extraits dans ce dossier». Par défaut, un dossier portant le même nom que le nom du fichier (sans l’extension de fichier) est créé dans le même dossier que le fichier .zip. Pour extraire les fichiers dans un autre dossier, cliquez sur «Parcourir».
Accédez à l’endroit où vous souhaitez extraire le contenu du fichier .zip, en cliquant sur «Nouveau dossier» pour créer un nouveau dossier, si nécessaire. Cliquez sur «Sélectionner un dossier».
Pour ouvrir une fenêtre de l’Explorateur de fichiers (ou de l’Explorateur Windows) avec le dossier contenant les fichiers extraits montrant une fois qu’ils sont extraits, cochez la case «Afficher les fichiers extraits une fois terminé» afin qu’il y ait une coche dans la case. Cliquez sur «Extraire».
Comment accéder aux images extraites
Le contenu extrait comprend un dossier nommé «word», si votre fichier d’origine est un document Word (ou «xl» pour un document Excel ou «ppt» pour un document PowerPoint). Double-cliquez sur le dossier «word» pour l’ouvrir.
Double-cliquez sur le dossier «media».
Toutes les images du fichier d’origine se trouvent dans le dossier «media». Les fichiers extraits sont les images originales utilisées par le document. À l’intérieur du document, il peut y avoir un redimensionnement ou d’autres propriétés définies, mais les fichiers extraits sont les images brutes sans ces propriétés appliquées.
Comment accéder au texte extrait
Si Office n’est pas installé sur votre PC et que vous devez extraire du texte d’un fichier Word (ou Excel ou PowerPoint), vous pouvez accéder au texte extrait dans le fichier «document.xml» du dossier «word» .
Vous pouvez ouvrir ce fichier dans un éditeur de texte, tel que le Bloc-notes ou WordPad, mais il est plus facile à lire dans un éditeur XML spécial, tel que le programme gratuit XML Notepad . Tout le texte du fichier est disponible en morceaux de texte brut, quel que soit le style et / ou la mise en forme appliqués dans le document lui-même. Bien sûr, si vous souhaitez télécharger un logiciel gratuit pour afficher ce texte, vous pouvez également télécharger LibreOffice , qui peut lire les documents Microsoft Office.
Comment extraire des objets OLE incorporés ou des fichiers joints
Pour accéder aux fichiers incorporés dans un document Word lorsque vous n’avez pas accès à Word, ouvrez d’abord le fichier Word dans WordPad (qui est intégré à Windows). Vous remarquerez peut-être que certaines des icônes de fichiers intégrés ne s’affichent pas, mais elles sont toujours là. Certains des fichiers incorporés peuvent avoir des noms de fichiers partiels. WordPad ne prend pas en charge toutes les fonctionnalités de Word, donc certains contenus peuvent ne pas s’afficher correctement. Mais vous devriez pouvoir accéder aux fichiers.
Si nous faisons un clic droit sur l’un des fichiers incorporés dans notre exemple de fichier Word, l’une des options est «Ouvrir l’objet PDF». Cela ouvre le fichier PDF dans le programme de lecture PDF par défaut sur votre PC. De là, vous pouvez enregistrer le fichier PDF sur votre disque dur.
Si WordPad n’a pas d’option pour ouvrir votre fichier, notez son type de fichier ici. Par exemple, notre deuxième fichier dans ce document est un fichier .mp3.
Ensuite, retournez dans votre dossier «Files from [Document]» et double-cliquez sur le dossier «embeddings» dans le dossier «word».
Malheureusement, les types de fichiers ne sont pas conservés dans les noms de fichiers. Ils ont tous une extension de fichier «.bin» à la place. Si vous savez quels types de fichiers sont incorporés dans le fichier, vous pouvez probablement déduire quel fichier est lequel en fonction de la taille du fichier. Dans notre exemple, nous avions un fichier PDF et un fichier MP3 intégrés dans notre document. Étant donné que le fichier MP3 est probablement plus volumineux que le fichier PDF, nous pouvons déterminer de quel fichier il s’agit en examinant la taille des fichiers, puis en les renommant à l’aide des extensions correctes. Ci-dessous, nous renommons le fichier MP3.
Notez que tous les fichiers ne s’ouvriront pas nécessairement à l’aide de ce processus – par exemple, notre fichier PDF s’est ouvert correctement à partir de WordPad, mais nous n’avons pas pu l’ouvrir en renommant son fichier .bin.
Une fois que vous avez extrait le contenu du fichier compressé, vous pouvez rétablir l’extension du fichier d’origine en .docx, .xlsx ou .pptx. Le fichier restera intact et pourra être ouvert normalement dans le programme correspondant.
Comment extraire des images de documents Office plus anciens (.doc, .xls ou .ppt)
Si vous avez besoin d’extraire des images d’un document Office 2003 (ou version antérieure), il existe un outil gratuit appelé Assistant d’extraction d’images Office qui facilite cette tâche. Ce programme vous permet également d’extraire des images de plusieurs documents (du même type ou de types différents) à la fois. Téléchargez le programme et installez-le (il existe également une version portable disponible si vous préférez ne pas l’installer).
Exécutez le programme et l’écran de bienvenue s’affiche. Cliquez sur Suivant ».
Tout d’abord, nous devons sélectionner le fichier à partir duquel vous souhaitez extraire les images. Sur l’écran Input & Output, cliquez sur le bouton «Parcourir» (icône de dossier) à droite de la zone d’édition du document.
Accédez au dossier contenant le document souhaité, sélectionnez-le et cliquez sur «Ouvrir».
Le dossier qui contient le fichier sélectionné devient automatiquement le dossier de sortie. Pour créer un sous-dossier dans ce dossier nommé de la même manière que le fichier sélectionné, cochez la case «Créer un dossier ici» pour qu’il y ait une coche dans la case. Cliquez ensuite sur «Suivant».
Sur l’écran Prêt à démarrer, cliquez sur «Démarrer» pour commencer à extraire les images.
L’écran suivant s’affiche pendant le processus d’extraction.
Sur l’écran Terminé, cliquez sur «Cliquez ici pour ouvrir le dossier de destination» pour afficher les fichiers d’image résultants.
Parce que nous avons choisi de créer un sous-dossier, nous obtenons un dossier contenant les fichiers image extraits du fichier.
Vous verrez toutes les images sous forme de fichiers numérotés.
Vous pouvez également extraire des images de plusieurs fichiers à la fois. Pour ce faire, sur l’écran Input & Output, cochez la case «Batch Mode» afin qu’il y ait une coche dans la case.
L’écran Batch Input & Output s’affiche. Cliquez sur «Ajouter des fichiers».
Dans la boîte de dialogue Ouvrir, accédez au dossier contenant l’un des fichiers à partir desquels vous souhaitez extraire des images, sélectionnez les fichiers à l’aide de la touche «Maj» ou «Ctrl» pour sélectionner plusieurs fichiers, puis cliquez sur «Ouvrir».
Vous pouvez ajouter des fichiers à partir d’un autre dossier en cliquant à nouveau sur «Ajouter des fichiers», en accédant au dossier dans la boîte de dialogue Ouvrir, en sélectionnant les fichiers souhaités et en cliquant sur «Ouvrir».
Une fois que vous avez ajouté tous les fichiers à partir desquels vous souhaitez extraire des images, vous pouvez choisir de créer un dossier distinct pour chaque document dans le même dossier que chaque document dans lequel les fichiers d’images seront enregistrés en cliquant sur le bouton «Créer un dossier pour chaque document ”, il y a donc une coche dans la case.
Vous pouvez également spécifier que le dossier de sortie doit être le «même que le dossier d’entrée de chaque fichier» ou entrer ou sélectionner un dossier personnalisé à l’aide de la zone d’édition et du bouton «Parcourir» sous cette option. Cliquez sur «Suivant» une fois que vous avez sélectionné les options souhaitées.
Cliquez sur « Démarrer » sur l’écran Prêt à démarrer.
L’écran suivant affiche la progression de l’extraction.
Le nombre d’images extraites s’affiche sur l’écran Terminé. Cliquez sur «Fermer» pour fermer l’Assistant Extraction d’images Office.
Si vous avez choisi de créer un dossier séparé pour chaque document, vous verrez des dossiers portant les mêmes noms que les fichiers contenant les images, quel que soit le ou les dossiers de sortie que vous avez spécifiés.
Encore une fois, nous obtenons toutes les images sous forme de fichiers numérotés pour chaque document.
Vous pouvez maintenant renommer les images, les déplacer et les utiliser dans vos propres documents. Assurez-vous simplement que vous avez le droit de les utiliser légalement.
Voir aussi :
Voici quelques sources : Microsoft Support - Wikipedia windows