Articles

Panama Papers : les réussites et limites du journalisme de données

Les Panama Papers montrent à quel point les journalistes de demain devront apprendre à travailler avec des banques de données massives

Par Alexandre Roberge , le 17 avril 2016 | Dernière mise à jour de l'article le 26 avril 2016

Début avril 2016 : une bombe médiatique explosait partout sur la planète. Le Consortium international des journalistes d’investigation (ICIJ) dévoilait des papiers de Panama ou «Panama Papers» qui exposait les secrets bancaires des centaines d’individus ayant fait de l’évasion fiscale. Une nouvelle qui a embarrassé des personnalités sportives, du monde de l’entreprise et même politique. Par exemple, le premier ministre islandais a dû, à cause du mécontentement populaire suscité par les révélations des journalistes, démissionner.

Et dire, comme le rappelle cette vidéo du journal allemand Süddeutschen Zeitung, que tout a commencé au printemps 2015 avec une communication anonyme envoyée au quotidien dont voici la traduction libre : «Bonjour. Je suis John Doe. Intéressé par des données? Il y a quelques conditions. Ma vie est en danger. Nous ne discuterons que par des voies cryptées. Jamais de rencontres. Le sujet des articles vous appartient.»

Quand les médias demanderont la grandeur de la banque de données, le lanceur d'alerte affirmera qu’il s’agira de la plus grande quantité jamais vue...

Une tâche titanesque

Il ne mentait pas puisqu’il a transmis au Consortium 2,6 téraoctets d’informations représentant 11,5 millions de documents sur des milliers de compagnies-écrans le tout sur une période allant de 1977 à 2015. Une masse d’informations dix fois plus grande que celle fournie à l’époque par Edward Snowden et seulement 370 journalistes de partout dans le monde pour analyser le tout! D’autant plus qu’il fallait ne rien ébruiter entretemps afin de permettre aux enquêtes journalistiques de se faire et que soient publiés en même temps les premiers articles et reportages sur la révélation des Panama Papers.

Depuis les journalistes ont commencé à aborder comment cette masse d’informations a été analysée. Ils se sont vite rendu compte qu’il serait impossible de travailler avec la base de données brute. Le Consortium a donc dû classer et placer les millions de données sur des serveurs infonuagiques aux connexions protégées.

Les experts techniques de l’ICIJ ont inventorié les différents types de documents (courriels, banque de données, PDF, images et autres documents écrits) et ensuite les sujets de ces documents (prêtes-noms et noms de compagnies, de particuliers, institutions bancaires, etc.) grâce à deux logiciels d’Apache (Solr et Tika). Par la suite, grâce au programme Luxurious, les journalistes ont enfin pu commencer à enquêter et noter visuellement les liens entre institutions, individus, etc.

Avec tout ce travail accompli, il suffisait de taper les noms des familles les plus riches, des politiciens et autres personnalités pour voir en quelques minutes s’ils étaient bénéficiaires ou acteurs quelconques dans ce stratagème de paradis fiscal.

Un nouveau type de journalisme

L’histoire des Panama Papers n’est pas terminée. D’autres articles et révélations devraient avoir cours au fil des semaines et mois. Logique étant donné la quantité incroyable de documents transmis. Toutefois, certains commencent déjà à faire les bilans de cette enquête qui, bien qu'auréolée de succès, a montré certaines limites de ce type de journalisme.

Comme le souligne Le Monde dans un article couvrant les coulisses de cette enquête, il faudra que le Consortium travaille sur des outils encore plus efficaces pour la collaboration entre médias de différents pays. Par exemple, l’ICIJ voulait crowdsourcer la vérification des véritables identités derrière les prête-noms pour faciliter le travail des confrères. Or, étant donné la lourdeur de la tâche, le tout ne s’est pas concrétisé, forçant les journalistes à faire cette vérification de leur côté et ralentissant le processus d’enquête et de rédaction. Ainsi, certaines histoires auront été ignorées involontairement par les travailleurs de l’information.

De plus, si les entreprises et la recherche utilisent de plus en plus des outils pour analyser les big data, le monde du journalisme n’a pas encore systématiquement adopté de telles applications. Elles leur sont inconnues ou pratiquement inaccessibles et pourtant, il s’agit d’un des secteurs qui en bénéficieraient le plus. Ce à quoi travaille l’ICIJ en ce moment, d’ailleurs.

Il semble évident que de plus en plus, les travailleurs de l'information auront à faire des banques de données massives. Nous parlions il y a quelques années de la possibilité de former des journalistes uniquement spécialisés dans la lecture et la fouille de données. Sinon, il faudra à tout le moins que les journalistes d’enquête apprennent à naviguer et à se retrouver devant ces informations, à les classer, à les vérifier, etc.

Afin que les journalistes d’aujourd’hui et demain puissent couvrir avec rigueur des masses de données qui les dépassent, le monde de la communication et la formation de ces futurs communicants devront s’y intéresser, enseigner leur analyse et des façons de collaborer entre confrères de différents médias et pays. Une façon de donner plus de crocs aux chiens de garde de nos sociétés.

Illustration : ProStockStudio, shutterstock

Références

Abbruzzese, Jason. "400 Reporters Kept the Panama Papers Secret for a Year. Here's How They Pulled It Off." Mashable. Dernière mise à jour : 4 avril 2016. http://mashable.com/2016/04/04/panama-papers-media.

Baruch, Jérémie et Maxime Vaudano. "« Panama Papers » : Un Défi Technique Pour Le Journalisme De Données." J'ai Du Bon Data. Dernière mise à jour : 8 avril 2016. http://data.blog.lemonde.fr/2016/04/08/panama-papers-un-defi-technique-pour-le-journalisme-de-donnees/.

Heymann, Sébastien. "Panama Papers: How Linkurious Enables ICIJ to Investigate the Massive Mossack Fonseca Leaks." Linkurious. Dernière mise à jour : 5 avril 2016. http://linkurio.us/panama-papers-how-linkurious-enables-icij-to-investigate-the-massive-mossack-fonseca-leaks/.

Kabra, Mar, and Erin Kissane. "The People and Tech Behind the Panama Papers." Source. Dernière mise à jour : 11 avril 2016. https://source.opennews.org/en-US/articles/people-and-tech-behind-panama-papers/.

Roberge, Alexandre. "Le Journalisme De Données, Un Nouveau Métier ?" Thot Cursus. Dernière mise à jour : 15 janvier 2014. http://cursus.edu/dossiers-articles/articles/21048/journalisme-donnees-nouveau-metier.

Woodie, Alex. "Inside the Panama Papers: How Cloud Analytics Made It All Possible." Datanami. Dernière mise à jour : 7 avril 2016. http://www.datanami.com/2016/04/07/inside-panama-papers-cloud-analytics-made-possible/.

Apache Solr - http://lucene.apache.org/solr/

Apache Tika - https://tika.apache.org/

Avez-vous apprécié cette page?

Voir plus d'articles de cet auteur

Accédez à des services exclusifs gratuitement

Inscrivez-vous et recevez des infolettres sur :

De plus, indexez vos ressources préférées dans vos propres dossiers et retrouvez votre historique de consultation.

M’abonner
Je suis déja abonné