Question:
PDF anonymizer - supprimer les métadonnées potentiellement identifiables
Szabolcs
2016-05-09 23:12:24 UTC
view on stackexchange narkive permalink

Je recherche un logiciel d'anonymisation PDF qui supprimera automatiquement les métadonnées potentiellement identifiantes.

Il doit être gratuit comme dans la bière, et il doit fonctionner sous OS X.

C'est le cas pas besoin d'être parfait; c'est pour des raisons de commodité, pas pour des applications légales.

Les outils de ligne de commande sont acceptables tant qu'ils n'ont pas besoin de syntaxes obscures pour atteindre cet objectif. Idéalement, ce devrait être un outil spécialement conçu pour cela. Il est possible que cela soit réalisable avec Ghostscript avec des options de ligne de commande compliquées, mais je ne peux pas les garder à l'esprit, donc ce n'est pas ce que je recherche.

Adobe Acrobat fait cela mais ce n'est pas gratuit.

L'outil suggéré fait certainement ce qu'il est censé faire. Cependant, il existe une spécialité en PDF, qui n'est pas traitée avec l'outil: les données privées. Parfois, les données privées sont également considérées comme des métadonnées et, en fait, les bloopers les plus embarrassants avec PDF ne proviennent pas des métadonnées, mais des données privées. Les données privées désignent les données que l'application de création intègre dans le fichier. On sait que MS Word peut en intégrer beaucoup, y compris l'évolution de l'historique et d'autres choses. C'est à vous de décider si cela dépend de vos préoccupations…
@MaxWyss Je suis définitivement ouvert à plus de suggestions pour de meilleurs outils. [Multivalent] (http://multivalent.sourceforge.net/) était capable de supprimer ce type de données, mais il a également retraité et parfois cassé le PDF. Et il y a quelques années, ses auteurs ont décidé de supprimer cette fonctionnalité et d'essayer d'empêcher les gens de télécharger d'anciennes versions du logiciel qui l'ont encore ...
L'outil qui me vient à l'esprit (APSaveAs par Appligent) n'est pas gratuit, et il est fort probable que d'autres ne le soient pas. Vous devrez l'essayer et être conscient qu'il est évité lors de la pratique, mais le «recryptage» devrait éliminer les données personnelles. Refrying signifie passer le PDF via un pilote d'imprimante PostScript et recréer le PDF à l'aide de Distiller (ou Ghostscript).
Deux réponses:
Steve Barnes
2016-05-10 00:20:38 UTC
view on stackexchange narkive permalink

Pour une application prête à l'emploi, vous pouvez utiliser ExifTool avec une liste de paramètres que vous souhaitez supprimer, par exemple:

  exiftool -Author = -Creator = name_of_pdf.pdf -o clean.pdf 
  • si vous faites ce genre de chose régulièrement, vous pouvez mettre la liste de valeurs à blanc dans un fichier externe ou utiliser un script bash.

ExifTool est:

  • & Open Source gratuit et gratuit
  • Cross Platform écrit en perl
  • Disponible en tant que package OS-X autonome et exe Windows
  • Fonctionne sur de nombreux autres formats de fichiers
J'ai exiftool mais je ne savais pas qu'il pouvait gérer les PDF. Mais «-all =» ne serait-il pas meilleur que «-Author = -Creator =»?
@Szabolcs - -all fonctionnerait mais il se peut que vous souhaitiez conserver certaines données.
Astuce pro: ajoutez `alias pdfanon = 'exiftool -Author = -Creator ='` à votre fichier `.bashrc` et exécutez-le comme` pdfanon in.pdf -o out.pdf`. ;)
Je voulais noter qu'exiftool avertit que les modifications apportées aux métadonnées PDF sont réversibles et peuvent être récupérées. Quoi qu'il en soit, pour mes besoins, exiftool est assez bon. Je n'ai pas besoin de me protéger contre des efforts de désanonymisation importants, je veux juste m'assurer que rien de révélateur n'est accidentellement laissé dans un endroit visible.
homocomputeris
2019-01-22 00:43:38 UTC
view on stackexchange narkive permalink

Metadata Anonymisation Toolkit 2 basé sur Python qui peut nettoyer les métadonnées de différents types de fichiers:

  utilisation: mat2 [-h] [-v] [-l ] [--check-dependencies] [-V] [--unknown-members policy] [-s | -L] [fichiers [fichiers ...]] Boîte à outils d'anonymisation des métadonnées 2 arguments positionnels: fichiers les fichiers à traiter arguments optionnels: -h, --help afficher ce message d'aide et quitter -v, --version afficher le numéro de version du programme et quitter - l, --list lister tous les formats de fichiers pris en charge --check-dependencies vérifier si MAT2 a toutes les dépendances dont il a besoin -V, --verbose afficher des informations d'état plus détaillées --unknown-members policy comment gérer les membres inconnus des fichiers de style archive (la politique doit être l'une des suivantes: abandonner, omettre, conserver) -s, --show lister les métadonnées nuisibles détectables par MAT2 sans les supprimer -L, --lightweight supprimer CERTAINES  


Ce Q&R a été automatiquement traduit de la langue anglaise.Le contenu original est disponible sur stackexchange, que nous remercions pour la licence cc by-sa 3.0 sous laquelle il est distribué.
Loading...