Formations

Tendances de la technologie de recherche : variété et précision

le 22 septembre 2008

Indépendants - Ressources gratuites

On sait que la recherche est la deuxième activité des internautes après le courrier électronique. Même si la fenêtre de recherche se présente toujours sous la même forme rectangulaire, les entreprises spécialisées dans le développement d’outils de recherche sont quant à eux en pleine expansion.

Les marchés visés sont les universités, puisqu’elles transfèrent de plus en plus leurs cours et leurs archives en ligne, et les organismes gouvernementaux qui sentent le besoin pressant de diffuser les discours et les séances publiques sur le réseau.

Actuellement, trois catégories sont en pleine croissance :

  • la recherche de contenus multimédias (audio, vidéo, texte, images);
  • la recherche de produits et de services par emplacements;
  • la recherche d’entreprises électroniques.

Recherche de contenus multimédiasIl y a énormément de connaissances à tirer de contenus audio et vidéo. Convera, une entreprise spécialisée dans la gestion de contenus numériques, croit que la recherche de contenus vidéo n’est pas seulement une possibilité mais une nécessité : On verra bientôt apparaître des millions de sites qui pourront transmettre des contenus vidéo en temps réel à l’écran de l’ordinateur ou de la télé des utilisateurs. Il faudra alors des outils de recherche pour repérer ces contenus.

Le processus qui permet d’exploiter, par exemple, des contenus vidéo n’est pas simple. Le logiciel de Convera diffuse d’abord le contenu vidéo en temps réel puis le divise en sections. L’outil détecte automatiquement les changements de scènes et fournit les images pour chacune d’entre elles. Il peut aussi extraire les métadonnées de chaque segment, le code temporel de synchronisation, le texte, le sous-titrage, les paroles enregistrées sur une piste audio. Il peut également convertir un discours enregistré en format audio en format texte. Enfin, il peut indexer et rechercher plus de 200 types de documents emmagasinés dans des bases de données et des systèmes de gestion documentaire.

Un autre exemple est le groupe de Lernout & Hauspie, spécialisé en technologies vocales et linguistiques avancées. L’entreprise travaille depuis quelques années à la création d’une technologie pouvant transmettre des contenus en temps réel, particulièrement les contenus audio tels que les conférences téléphoniques, les exposés, et les réunions. Leur logiciel (AudioMining) fonctionne de façon similaire à celui de Convera et transmet le contenu audio dans un fichier pour ensuite être analysé et indexé. Le coût d’AudioMining commence à 20 000 $ et grimpe à mesure que le client adapte la technologie à ses besoins.

Recherche par emplacementsGeosign est l’une des trois entreprises créatrices de logiciels qui indexent les coordonnées des entreprises et des groupes par emplacements géographiques. Une démonstration du produit est disponible sur le site, il suffit de vous inscrire.

Lasoo, une autre entreprise de même type, offre cette option à la page d’accueil de son site Web, donnant ainsi accès à plus de 25 millions de compagnies établies au Canada et aux États-Unis et à plus de 25 000 sites Web à travers le monde. Northern Light Technology est son équivalent américain.

Recherche d’entreprises électroniquesLes programmeurs du logiciel Easy Ask ont opté pour un marché particulier : les sites individuels des entreprises électroniques. Larry Harris d’EasyAsk affirme que lorsqu’il s’agit d’entreprendre une recherche sur un site spécifique, il devient possible de structurer la recherche en l’organisant autour des éléments contenus dans la base de données. Alors que beaucoup d’entreprises en ligne ont construit leur site d’après les catalogues de produits emmagasinés dans les bases de données telles qu’Oracle et Sybase, depuis quelques années, plusieurs ont trouvé de meilleures tactiques pour repérer les produits et les entreprises en ligne.

La plupart cherchent dorénavant à identifier la base de données relationnelle au lieu de la description du produit. L’approche du logiciel EasyAsk est typique. Le logiciel est installé sur le site d’un e-commerce (à partir de 30 000 $) et EasyAsk fouille la base de données ciblée et construit un dictionnaire personnalisé qui traduit les recherches en questions. On peut alors effectuer une recherche en langage naturel en inscrivant une question dans l’espace de recherche ou par mots clés.

Par exemple, pour trouver des chandails rouges, Easy Ask ne cherche pas les termes "chandail" et "rouge" mais la base de données de la compagnie afin d’obtenir un tableau descriptif du produit. Puis, il cherche d’autres informations plus spécifiques telles que la couleur. Étant donné que l’outil a été conçu à partir de la base de données de la compagnie, les résultats obtenus sont précis. Easy Ask croit que de plus en plus d’entreprises électroniques auront leurs propres engins de recherche développés à partir de leurs bases de données.

Une évolution qui permettra de déceler en moins de temps l’information recherchée, mais à quel prix?

Avez-vous apprécié cette page?

Voir plus d'articles de cet auteur

Accédez à des services exclusifs gratuitement

Inscrivez-vous et recevez des infolettres sur :

De plus, indexez vos ressources préférées dans vos propres dossiers et retrouvez votre historique de consultation.

M’abonner
Je suis déja abonné