Abondance.com : Recherche d'information, referencement et promotion de sites Web    
 Rechercher sur Abondance : avec Synomia
Recherche avancée
Sur tout le site Sur l'actu depuis 1998

  Toute l'info et l'actu sur les annuaires et moteurs de recherche : Recherche d'information et référencement

     
 
 Accueil > Tribune >

Christophe AsselinChristophe Asselin (Intelligence Center) : "Le futur a déjà ses moteurs"

On aurait pu croire que l'hégémonie de Google allait décourager les initiatives de création d'outils de recherche. Heureusement de nouveaux concepts de moteurs apparaissent régulièrement. Bien sûr, tous ne pourront pas rivaliser avec les outils majeurs utilisés par le grand public. Mais la plupart de ces sociétés développent (et vivent) des applications pour l'entreprise.

On peut faire au moins un reproche à Google : toujours fournir, après plus de 4 ans d'existence, des résultats en "vrac" : une liste de documents sans possibilité d'affinage ou de mémorisation.
Alors, à côté de Google, moteur à "tête bien pleine", se développent des moteurs à tête bien faite qui se focalisent davantage sur la diffusion et l'organisation des résultats : Certains catégorisent, mémorisent, personnalisent et affinent les requêtes. D'autres outils plus complexes destinés aux professionnels vont s'attaquer directement à la source en tentant de structurer le net qui voit coexister des fichiers très hétéroclites. Enfin, une entreprise de Seattle a bien envie d'imposer l'outil "universel" qui recherchera à la fois sur votre PC et sur le web.

Petit tour d'horizon (non exhaustif) des outils grand publics et des projets pour entreprise qui devraient dessiner les futures tendances….

Affinage et catégorisation

Feu NorthernLight avait été le précurseur de l'organisation des résultats d'une requête en dossiers. L'excellent métamoteur Vivisimo poursuit dans cette voie. Tapez un mot comme "internet", vous obtiendrez un classement dans les catégories "réseau", "logiciel", "marketing", …En somme, on vous propose des documents rangés sur des étagères et non plus empilés les uns sur les autres.

Un autre système consiste à vous assister dans votre recherche, à l'instar d'un libraire : Ainsi, Altavista propose sa technologie d'affinage Prisma, basée sur le nombre d'occurrences tapées par les internautes. Le moteur va afficher des termes connexes à votre requête vous permettant de préciser votre question. Vous tapez "Intelligence" : voulez-vous parler de QI, d'intelligence artificielle, économique ou de robotique ? Pratique pour préciser sa recherche mais aussi pour trouver des idées.

En France, une technologie similaire est développée par Exalead sur Aol.fr et Netscape.fr. Quant à Dipsie (sortie prévue cet été – un index de 10 milliards de pages annoncé), il devrait - notamment - proposer un nouveau principe d'organisation des résultats.

Personnalisation

Nous sommes tous différents. Devoir préciser à chaque fois à son outil de recherche qu'en tapant "stones", on s'intéresse davantage au rock qu'à la géologie prend du temps et génère des pages de résultats inutiles.

En France, le métamoteur KartOO, en mémorisant les requêtes et les sites visités, personnalise vos résultats lors de recherches ultérieures en fonction de vos centres d'intérêt.

En Californie, Eurekster vient de lancer un moteur de recherche qui permet aussi de personnaliser vos résultats selon vos centres d'intérêts. Cliquer sur avocat (le fruit) plutôt que sur le juriste fera que lors d'une prochaine requête, cette réponse alimentaire précédera les résultats juridiques.

En Australie, Mooter tient également compte des mots qui vous intéresse pour personnaliser vos résultats ultérieurs.

Le futur moteur Aomi (Texas) devrait s'adapter au profil de l'internaute avec un système "apprenant" via des technologies issues de "l'intelligence artificielle".

Google semble s'intéresser à cette tendance de recherche puisqu'il racheté Kaltix, start-up qui travaille sur la personnalisation par profil. Auparavant, Google avait déjà acquis Outride, autre société spécialisée dans la personnalisation.

Un seul moteur pour chercher dedans et dehors

Dans l'entreprise, des applications permettent déjà de chercher à la fois sur l'intranet et sur l'internet. En effet, on sait que plus la structure est importante, plus l'information que cherchent ses employés tend à exister déjà au sein de l'entreprise. Imaginez pouvoir faire de même à l'échelle de votre PC : une requête vous rapatrie des documents web mais cherche aussi parmi tous ces liens et documents accumulés sur votre disque. Avec son futur moteur de recherche, Microsoft veut offrir cette possibilité de recherche inter/intra en intégrant cet outil à son prochain système d'exploitation (projet Longhorn). Supériorité technologique mais surtout marketing : en équipant 95% des PC à travers la planète, Microsoft pourrait imposer "son" moteur comme il l'a fait pour Internet Explorer face à Netscape. Google et Yahoo! résisteront-ils ? Tout est fragile : En 1995, le navigateur de Netscape représentait 80% de parts de marché…

Structurer les documents du net

Finalement, l'internet est un vaste capharnaüm; des villes faites d'architectures diverses, qui se développent chaque heure dans l'anarchie. On connaît mal la taille du net mais de nouveaux documents se créent et se modifient tous les jours (environ 50 millions) et ceux-ci sont finalement tous différents : Des documents HTML, des documents bureautiques, des images, des bases de données accessibles, d'autres moins…Comment un moteur peut-il s'y retrouver pour aspirer et indexer tout cela ? Pour l'instant les moteurs existant y arrivent mal. Faute de puissance de calcul, de stockage et de méthodes pour codifier tous les formats de documents qui y cohabitent.

Transformer l'internet en une gigantesque base de donnée constituée de documents codifiés selon un même principe, c'est l'un des objectifs du projet Webfountain d'IBM. Pour cela, la Compagnie utilise notamment les atouts du langage XML. Le XML est un langage standard "structurant". Il permet en effet de définir ses propres marqueurs (tags) et donc de personnaliser l'organisation des données. Le XML va donc permettre une meilleure définition, transmission et interprétation des données entre applications et organisations différentes. C'est déjà un peu le cas avec le RSS (Real Simple Syndication ), basé sur le XML qui permet à un site d'exploiter le contenu d'un autre site (syndication). La description du site (titre, articles, auteurs) est formalisée dans une structure balisée.
Avec Webfountain, IBM a entrepris de "marquer" en XML des millions de documents du net pour convertir des données non structurés en données structurées, donc analysables et "requêtables".
IBM dispose d'une énorme puissance de calcul et de stockage qui permet de traiter chaque semaine plusieurs millions de documents du web mais aussi l'IRC, les Newsgroups et weblogs. Compte-tenu de son coût (120 personnes, budget supérieur à 140 millions de dollars), Webfountain n'est pour l'instant pas destiné au grand public. Le premier partenaire d'IBM est donc une firme traitant d'énormes volumes d'informations, Factiva-Reuters.
Si Webfountain n'est disponible que pour les (riches) professionnels, le projet traduit bien tout le chemin qu'il reste à parcourir pour que l'internaute lambda puisse disposer d'une véritable information structurée et intelligente sur son PC.


Christophe Asselin, Intelligence Center

 

 A la une de l'actu
l'actu au format rss Webmasters, installez les titres de l'actualité sur votre site !
l'actu de la semaine Toute l'actualité de la semaine


Un site du Réseau Abondance (english version : Search Engine Tools) :
Information : Abondance actu référencement - Forums Abondance - Baromètre Référencement - Boutique Abondance - Livre Référencement - Livre Google
Outils : Outiref - Visiref - Keyword Search Engine - Spider Simulator - Soumission-Manuelle - Flash Moteurs - Moklic
Divers / Jeux : Googlefight - LotoFoot Googlefight - Habitants - Googland - Breitling Jet Team - Meeting aérien Lens - Maison en Provence - Grifil.com
Moteurs de recherche : Mozbot.fr - Mozbot.com - Mozbot.co.uk - Goossip - Motref - Rugby engine - Search In The Matrix - Grifil.net - Biomalin - Foot Engine - SearchWings
Recommander ce site à des amis  |  Bienvenue  |  Pourquoi Abondance ?  |  Contact  |  Crédits  |  Rechercher sur le site
Applicatifs réalisés par Brioude Internet et Raynette  |  Site hébergé par GPL Service  |  Publicité sur le site  |  Plan du site