Articles

Le Big Data exploité par la communauté scientifique

La participation scientifique à travers l'échange de données

Par Élodie Lestonat , le 20 octobre 2014 | Dernière mise à jour de l'article le 19 novembre 2014

Les données sont produites en grand nombre mais leur exploitation est soumise à deux conditions : leur accessibilité d'une part, leur interprétation d'autre part. Il revient aux établissements scientifiques de faciliter cette exploitation. Voici l'exemple d'une initiative intéressante.

Le site du Cirad (organisme de recherche agronomique pour le développement) propose des ressources intéressantes en matière de publication scientifique. Si vous souhaitez publier dans une revue scientifique, pourquoi ne pas utiliser le data paper ? Les fiches synthétiques proposées par le Cirad vous expliquent ce qu’est un data paper et la démarche pour les élaborer.

Qu’est-ce que le data paper ?

« Data » signifie "données" et « paper », "papier" soit un article dans le langage journalistique. Plus précisément  « le data paper est une publication qui décrit un jeu de données scientifiques brutes (data, dataset), notamment à l’aide d’informations précises, appelées métadonnées (metadata) ». « Les métadonnées détaillent pourquoi, par qui et comment ces données ont été collectées, qui en est propriétaire, sous quel format elles sont stockées, etc. ». Les données sont donc brutes puisqu’elles ne présentent pas de conclusions.

La particularité de ces données est qu'elles sont accessibles (souvent sous la forme de fichiers annexés ou de liens URL vers un « data repository » ou entrepôts de données. Cet accès facilité est donc propice à une démarche participative.

Quelle est l’utilité du data paper ?

Les data papers sont utilisés dans les publications scientifiques à destination des pairs afin de communiquer des données qui se prêtent à de multiples utilisations. La communauté scientifique peut donc bénéficier librement des données qui leurs sont communiquées. Les indications qui contextualisent la donnée permettent une utilisation future et le croisement de données afin de vérifier des hypothèses et d’élaborer des conclusions scientifiques. La précision apportée à la collecte et à la méthode scientifique utilisée assure la fiabilité et la reconnaissance de l'auteur des travaux par la communauté scientifique et permet la mutualisation des recherches.

Le formidable potentiel de ces données n'est cependant pas sans risques. Pour le moment, la communauté des chercheurs reste seule capable d'analyser, de confronter les hypothèses et de valider les conclusions en traitant ces données. Mais de grands groupes privés lorgnent déjà sur ces données...

Comment se construit un data paper ?

Afin de favoriser la compréhension et l’échange de ces données, certaines mentions doivent apparaitre dans la partie descriptive (noms des auteurs, résumé, introduction ou contexte de l’étude, descriptions du matériel et de la procédure de collecte des données, informations sur la fiabilité de la collecte, contributions, références bibliographiques, synthèse). Les fichiers associés à la donnée sont numériques et stockés dans l’entrepôt de données. Le site du Cirad vous propose des exemples en Sciences du Vivant pour illustrer les fiches mises à votre disposition.

 Références

Coopérer en information scientifique et technique - Cirad. "5 - Liens utiles : exemples et guides / Rédiger et publier un data paper / Rédiger / Aide à la publication."Date de publication 10 octobre 2014. http://coop-ist.cirad.fr/aide-a-la-publication/rediger/rediger-et-publier-un-data-paper/5-liens-utiles-exemples-et-guides.

Illustration : Darren Baker, Shutterstock.com

Avez-vous apprécié cette page?

Voir plus d'articles de cet auteur

Accédez à des services exclusifs gratuitement

Inscrivez-vous et recevez des infolettres sur :

De plus, indexez vos ressources préférées dans vos propres dossiers et retrouvez votre historique de consultation.

M’abonner
Je suis déja abonné