vendredi, octobre 08, 2010

L'algorythme de Teoma et Ask Jeeves

Nous ne connaissons pas beaucoup Teoma et Ask Jeeves, mais ces moteurs de recherche représentent 5% des requetes au USA. Ils ont racheté Excite, MyWay et Iwon ce qui a doublé leur index. Ils sont aussi partenaires avec Expedia, Ticketmaster et Match.com. Ask Jeeves affiche des pubs Adwords qui sont similaires aux résultats organiques. Ils vendent aussi leur propres liens sponsorisés sur des mots clés très concurrentiel. Enfin, il vendent aussi les produits de Kelkoo.com sur des thématiques compétitives. Malgré la similarité des liens commerciaux et organiques, Ask Jeeves sépare les deux pour ne pas abuser l'internaute.

Comment Teoma fonctionne ?

 



Le principal algorythme d'Ask Jeeves est basé sur la technologie Teoma dont le postulat est que la société humaine et le Web se composent de multitudes de petites communautés. Ces dernières sont axées autour d'autorités et de hubs.
Une autorité est un site qui possède de milliers de liens entrants, et un Hub est un site qui possède des milliers de liens sortants. En général, une autorité est liée par beaucoup de Hub et vice versa.

Le modèle de Teoma

 



Teoma utilise un index inversé de tous les mots clés dans sa base de donnée. Par exemple, le mot chaussure peut se trouver dans 10 millions de résultats, et quand l'utilisateur le recherche, Teoma cherche des termes similaires au niveau local basé sur de petites communautés. Ensuite, il prend un genre d'instantané de cette communauté en affichant ses meilleurs sites. Teoma est très efficace pour analyser de grandes catégories qui possède des centaines de sous-catégories. Il utilise la structure des liens entrants et sortants pour juger si un site est une autorité ou non. Par exemple, vous êtes un fabricant de chaussure, et vous venez de créer un modèle révolutionnaire. De ce fait, tous les autres sites de chaussures vont parler de vous avec des liens entrants, et donc Teoma estimera que vous êtes une autorité en la matière. Si vous voulez réussir dans Teoma, vous devez considérer les points suivants :
  • Le concept de communauté ne permet pas d'avoir des liens entrants aléatoires
  • Les liens entrants n'ont aucune valeur s'ils ne viennent pas de la bonne communauté
  • Quelques liens entrants de la bonne communauté suffisent pour booster le site
Vous remarquez que Google utilise aussi ce genre de technique, mais on ne sait pas à quel point. On en a déjà parlé lorsqu'on a abordé le Latent Semantic Indexing, et un expert SEO n'a pas vraiment besoin de savoir tout cela en profondeur, mais c'est toujours bien de connaitre le fonctionnement interne des moteurs de recherche. Et puis, on fait toujours son effet lorsqu'on utilise des termes tels que Latent Semantic Indexing dans une conversation !