Chapitre 25 Nettoyer les métadonnées d’un document

Durée : Quelques minutes.

L’objectif de l’outil que l’on va examiner est d’effacer les métadonnées présentes dans un document avant sa publication. Ces métadonnées ne sont pas les mêmes dans tous les formats de documents : certaines sont plus difficiles à nettoyer que d’autres, voire impossibles. Cependant, la plupart des formats utilisés pour échanger des documents terminés, que ce soient des textes, des images, du son ou de la vidéo, sont « nettoyables ».

L’outil à utiliser pour cela est MAT2 (pour Metadata Anonymisation Toolkit 2) qui permet de nettoyer aisément de nombreux formats de fichiers.

Attention : nettoyer les métadonnées n’anonymise pas le contenu des fichiers, et n’enlève pas les éventuels marquages190 qui seraient inclus dans le contenu lui-même.

25.1 Installer les logiciels nécessaires

Sur un système où il n’est pas encore présent, il faut installer le paquet mat2. Sous Tails, MAT2 est déjà installé.

25.2 Nettoyer un ou des fichiers

Dans le gestionnaire de fichiers, faire un clic droit sur le document dont on veut enlever les métadonnées puis sélectionner Remove metadata. Un nouveau document sans métadonnées est alors créé. Il porte le nom du fichier original suivi de .cleaned puis de l’extension du fichier.

Astuce ! Pour traiter plusieurs fichiers, il est possible de sélectionner un ensemble de fichiers et de faire un clic droit puis Remove metadata. L’opération peut prendre un peu de temps en fonction du nombre de fichiers et de leur taille.

Certains formats ne sont pas supportés par cet outil. Dans ce cas un message d’avertissement Failed to clean some items apparaît. Un bouton Show permet d’avoir la liste des fichiers qui n’ont pas été traités. Si le format n’est pas supporté il est possible d’exporter le fichier qui ne peut pas être traité dans un format plus commun. Par exemple pour nettoyer un fichier au format XCF du programme de manipulation d’images GIMP, il est possible de l’exporter au format JPEG ou PNG.

25.2.1 Cas particulier des fichiers PDF

Pour enlever correctement les métadonnées d’un fichier PDF, MAT2 le « transforme » en image. Ainsi un fichier PDF sans metadonnées perdra tous ses liens hypertextes et aura une taille supérieure au fichier initial.

25.2.2 Cas particulier des vidéos

MAT2 supprime les métadonnées d’un fichier vidéo, mais il n’est pas capable de supprimer d’autres traces qui pourraient parfois permettre d’identifier la source de la vidéo : des rayures ou des traces de doigts sur l’objectif par exemple, ou encore comme on l’a vu plus haut des marques invisibles et indétectables (appelées tatouages numériques, ou digital watermarks en anglais) qui pourraient être directement ajoutées aux images de la vidéo par le matériel ou le logiciel de captation utilisé.

Ainsi, pour faire en sorte qu’une vidéo ne contienne vraiment plus aucune information permettant de retrouver son autrice, la suppression des métadonnées par MAT2 ne suffit pas : il faut aussi réaliser cette vidéo avec du matériel qui n’est lié à aucune identité (c’est-à-dire qui n’a jamais servi pour publier des images avec une autre identité contextuelle), et utiliser uniquement Tails pour l’éditer.

Néanmoins, dans la plupart des cas et face à la plupart des adversaires (et de leurs moyens) qui voudraient identifier l’autrice d’une vidéo, supprimer les métadonnées de cette vidéo avec MAT2 constitue déjà une assez bonne mesure de protection.