Actualités

Publié le 06 janvier 2023 Mis à jour le 06 janvier 2023

La structuration des données publiques pour le commerce

Collecte, analyse et partage des données

Structuration de données non-structurées - Pixabay

Des données disponibles

Les entreprises qui vendent en ligne présentent leurs produits de manière attrayante et détaillée, en spécifient généralement les prix, les conditions de vente, de livraison et de disponibilité. Certains sites comme Alibaba, Amazon, Expedia, Etsy, eBay ou Airbnb sont de véritables places de marché qui donnent le pouls de l'activité commerciale. Des entreprises comme Walmart, Costco et autres grandes chaines de distribution proposent des catalogues élaborés et régulièrement mis à jour au fil des tendances et des saisons.

Pour se donner une idée du volume des données, la part du commerce en ligne au niveau mondial est estimée de l’ordre de 18 à 20 % du commerce global. Plus de 30 000 milliards de dollars de produits et services ont été achetés en ligne en 2022, ceci incluant les ventes entre entreprises et aux particuliers. Dans certains pays comme au Japon, en Corée ou en Chine, cette proportion du commerce en ligne dépasse 25 %. Autrement dit, presque tout ce qui est produit dans le monde est décrit en détail dans Internet, du plus petit objet au plus complexe. Enfin, le volume des échanges commerciaux au niveau mondial continue d'augmenter de 4 à 6 % par année en moyenne depuis 1995 et rien n'indique un ralentissement de tendance à moyen terme.

En somme, dès que l’on désire faire du commerce en ligne, on présente nécessairement ses produits. Si en plus on veut qu’ils soient bien indexés dans les moteurs de recherche, on les rend facilement accessibles. Ce qui était pratiquement impossible à l’ère des catalogues papier devient maintenant une pratique courante : analyser et comparer les offres.

Mais le problème avec ces données est qu’il n’y a aucun standard de présentation. Chaque entreprise entend bien les présenter comme elle le souhaite. Globalement, ce sont des données non-structurées. Il s’agit d’assurer la conversion des sites web en données structurées et exploitables

Des données à collecter

Si n’importe qui peut accéder à un site de commerce en ligne et consulter les données sur les produits proposés., collecter ces données de manière systématique demande un peu plus d’expertise et de régularité. Pour qui y parvient, une véritable mine d’or s’ouvre.

On peut obtenir rapidement un portrait de différentes industries en aspirant le contenu de leurs principaux joueurs et aussi de ceux qui nous intéressent particulièrement. Parts de marché, évolution des prix, distribution effective, géolocalisation, toutes sortes de données peuvent être ainsi déduites et ce en toute transparence.

Mais ce qui parait facile l’est un peu moins si on considère ces éléments :

  • si à chaque fois il faut passer par un captcha;
  • s'il faut retrouver le bon chemin vers les données quand le site change;
  • s'il faut contourner les horloges de rafraichissement de page;
  • si d’autres caractéristiques techniques en évolution sont implantées...

Ces obstacles demandent des compétences avancées pour les controuner. Accéder à de grands ensembles de données, les classer et s’y retrouver se gagne avec beaucoup de compétences et de persévérance.

Les données des consommateurs

Les consommateurs apprécient, commentent, se plaignent, se vantent et vont s’agiter dans Internet à propose de leurs achats ou de leurs expériences. Sans chercher à savoir qui émet ces commentaires, savoir ce qui est apprécié et ce qui l’est moins peut prendre une valeur stratégique importante, ne serait-ce que pour maintenir l’intégrité de la réputation d’une entreprise. Vaut mieux identifier et résoudre les problèmes avant qu’il ne soit trop tard.

Veiller ce qui se dit sur les réseaux sociaux et dans Internet est une tâche qui peut être automatisée pour ainsi détecter les tendances, profiter des occasions, ne pas être pris par surprise, prévenir les problèmes. Ici encore, Il s’agit d’assurer la conversion de données disparates en données structurées et exploitables.

Des données à analyser

Comme pour les connaissances que l’on peut trouver dans internet, les données commerciales sont accessibles; pour en profiter, tout l’art consiste à poser les bonnes questions.  Les exemples donnés dans le vidéo ci-dessous montrent bien comment les données prennent du sens si on les met en relation, si on les structure dans des catégories pertinentes.

  • «Qu’elle est ma marge d’augmentation de prix pour compenser l’inflation ?» 
  • «Quelles sont les offres sur le marché et ce qui fonctionne le mieux ?»
  • «Sur quel bouton ma mise en marché devrait-elle appuyer ?»
  • «Quels sont les tendances du marché de l’éthanol en Europe ?»





De bonnes décisions d’affaires se prennent sur de bonnes données. Le domaine du marketing se trouve transformé en entier par l’accès à ce genre de données. Les institutions éducatives incluent maintenant l’utilisation des outils de collecte et d’analyse dans les curriculum d’administration, spécialement en «Intelligence d’affaires». Mais à voir l’évolution rapide des technologies et de leur puissance, la formation sera forcément à la traine par rapport aux pratiques les plus efficaces.

Une puissance régulatrice

Hors Internet, on peut penser que ce qui s’y fait ne nous concerne pas, pourtant, sans même sans même être connecté, on y ajoute des données malgré nous. Les flux de matière, d’énergie, de personnes et même d’idées sont veillés. Des seuils d’alerte dont définis, des données sont comparées. Les meilleures pratiques et les avantages sont identifiés et, si elles sont communiquées et partagées, mènent à de nouvelles initiatives, à des régulations naturelles ou légales, à de la formation et globalement à un équilibre optimal du marché et du partage des richesses. On est tous concernés, connecté ou pas.

Dans la mesure ou ces outils de collecte et d’analyse des données demeurent accessibles à tous, leur fonction régulatrice peut s’exercer. Si au contraire leur accès n’est réservé qu’à une classe d’entreprises capable de se les payer, alors on peut craindre l’apparition de pratiques capables de balayer toute concurrence. Pour l’instant, leurs coûts sont raisonnables et l’ouverture semble un principe accepté et avantageux pour tous.

L’éthique de leur utilisation est actuellement une condition de l’accessibilité à ces outils. Il va de soi qu’une régulation externe et universelle assure à la fois le respect de certaines règles de vie privée, de concurrence loyale, de valeurs humaines et aussi l’acceptation sociale de leurs effets.

En savoir plus sur cette actualité

Le fil RSS de Thot Cursus via Feed Burner.


Les tweets de @Thot


Accédez à des services exclusifs gratuitement

Inscrivez-vous et recevez des infolettres sur :

  • Les cours
  • Les ressources d’apprentissage
  • Le dossier de la semaine
  • Les événements
  • Les technologies

De plus, indexez vos ressources préférées dans vos propres dossiers et retrouvez votre historique de consultation.

M’abonner à l'infolettre

Superprof : la plateforme pour trouver les meilleurs professeurs particuliers en France (mais aussi en Belgique et en Suisse)


Effectuez une demande d'extrait d'acte de naissance en ligne !


Ajouter à mes listes de lecture


Créer une liste de lecture

Recevez nos nouvelles par courriel

Chaque jour, restez informé sur l’apprentissage numérique sous toutes ses formes. Des idées et des ressources intéressantes. Profitez-en, c’est gratuit !