Table des matières
Intelligence artificielle et SEO, tout un programme
Pour écrire ce premier article sur l’intelligence artificielle au cœur du moteur de recherche de Google et du SEO, j’avoue humblement avoir pensé le finir en quelques jours. Que nenni ! Le sujet de l’intelligence artificielle en SEO est une tâche plus ardue qu’il n’y parait.
Certes, on trouve pléthore de billets sur le web très bien faits sur cette thématique. En revanche, ces derniers ne donnent souvent qu’une vision parcellaire sur l’usage de l’intelligence artificielle chez Google.
Raison pour laquelle je voulais faire un focus sur Google. Les chiffres parlent parfois mieux que les mots.
Comprendre l’Intelligence artificielle n’est pas très naturel
L’intelligence artificielle a fait et continue de faire couler beaucoup d’encre. L’intelligence artificielle est un terme assez galvaudé, parfois utilisé à des fins commerciales alors que rien ne prouve aux néophytes que nous sommes, qu’il s’agit bien d’IA. Et puis ce terme « intelligence » interroge.
Voici ce qu’en disent quand même les plus grands spécialistes.
- Selon Luc Julia, « elle n’existe pas » et pour lui je cite : « l’emploi du terme « intelligence » pour cette discipline est de fait une vaste fumisterie, car il est basé sur des vœux pieux qui sont bien loin de la réalité. »
- Pour le Dr Laurent Alexandre, « en 2017, l’IA est toujours totalement inintelligente. »
- Sylvain Peyronnet, spécialiste des algorithmes, nous dit que « l’intelligence artificielle est l’automatisation de la bêtise humaine »
- Et pour Yann Lecun, directeur de la recherche en IA chez Facebook, « il faudra encore 10 à 20 ans pour qu’elle soit performante »
Mais alors qu’est-ce que c’est que cette Intelligence artificielle ?
Retrouvez aussi quelques définitions sur l’IA dans notre glossaire ia4marketing.
« Une intelligence artificielle est un système informatique capable d’effectuer des tâches qui requièrent d’ordinaire une intelligence humaine. À la manière d’un humain, l’IA moderne peut apprendre et s’améliorer de manière autonome en s’entrainant à partir de données ou au travers de simulations. C’est ce que l’on appelle le Machine Learning ou apprentissage automatique, dont l’une des principales technologies est le Deep Learning ou apprentissage profond. »
Le Big Data.fr - https://www.lebigdata.fr/intelligence-artificielle
Le référencement naturel n’a encore rien d’artificiel
Le SEO fait partie des leviers d’acquisition incontournables du marketing digital.
Son acronyme ? Search Engine Optimisation : optimisation pour les moteurs de recherche. Autrement appelé référencement naturel, c’est la discipline qui consiste à référencer (entendez positionner) un site dans les pages de résultats d’un moteur de recherche, de manière naturelle – en opposition au SEA (Search engine Advertising) qui, lui, fait appel à des annonces publicitaires payantes.
Le SEO permet d’accroitre la visibilité, la notoriété d’un site et générer du trafic qualifié. L’importance d’activer le SEO pour une entreprise est vitale si on veut capitaliser au long terme, engager ses clients et durer.
Or, accroitre la visibilité naturelle de son site est aujourd’hui loin d’être une sinécure. D’une part, rien n’est jamais gravé dans le marbre, surtout avec Google et d’autre part, depuis les récents évènements liés à la crise sanitaire, la concurrence digitale déjà accrue est en passe de croitre plus encore dans les mois à venir.
La lisibilité des critères inhérents au fonctionnement des moteurs de recherche et particulièrement celui de Google, fait partie des secrets les mieux gardés. Il y aurait plus de 200 critères chez Google et personne, pas même les experts ou les équipes de Google ne serait en mesure de les lister un par un avec certitude. Il y aurait de l’intelligence artificielle au cœur du moteur de Google. Mais où ? et à quoi sert-elle ?
Beaucoup d’entre nous croient savoir comment ça marche, mais dans les faits, c’est bien plus complexe qu’il n’y parait et dans un domaine qui bouge avec une célérité sans précédent. En tous cas, selon moi le référencement naturel, même s’il est dépendant de l’IA, n’a encore rien d’artificiel puisqu’il faut encore un humain pour comprendre et agir.
Fonctionnement classique du moteur
Avant toute chose, rappelons comment fonctionne un moteur de recherche. Dans les grandes lignes et de manière classique, le moteur exécute les étapes suivantes :
- Le crawl : découverte et exploration des pages
- L’indexation : collecte et organisation des pages
- La compréhension de la requête de l’utilisateur
- L’analyse de la pertinence des pages
- L’analyse de la popularité des pages
- La lutte contre les spams
- Le classement final (visible dans les pages de résultats)
Nous reviendrons sur ce slide à la fin de cet article en y ajoutant les interventions de l’intelligence artificielle.
Google : l’algorithme dans la peau
Pour que le moteur de recherche puisse fonctionner et à son plus haut niveau, il lui faut des algorithmes. Google est un ensemble d’algorithmes qui se sont construits au fil des décennies. Voici un des panoramas les plus parlants et clairs que j’ai pu trouver sur les principaux algorithmes de Google.
Source : @Mounirdigital
- Panda (2011) évalue les sites et la qualité de leurs contenus. Cet algorithme déclassera les pages de faible qualité.
- Pingouin (2012) lutte contre les liens ou backlinks artificiels.
- Hummingbird ou Colibri en français (2013) cet algorithme permet à Google de mieux comprendre les requêtes basées sur le langage naturel et ce qu’on appelle en SEO les recherches de longue traine. Cette étape est une avancée majeure vers le NLP ou Natural Language Programming et c’est là que l’intelligence artificielle s’est renforcée chez Google.
- Rank Brain (2016) dont nous reparlerons, est la confirmation de l’émergence de l’IA dans le moteur pour l’aider à comprendre les requêtes complexes suivi de BERT arrivé en 2019.
Rank Brain : le cerveau de Google
Un des cerveaux actifs de Google concerne l’interaction avec l’utilisateur. Sans cette interaction, un moteur n’a pas lieu d’être et c’est même le cœur de sa fonction principale : interagir avec ce que recherche l’utilisateur et lui fournir les résultats les plus pertinents.
C’est un algorithme d’intelligence artificielle connu sous le nom de Google Rank Brain qui prend le relai sur l’interaction avec l’internaute pour améliorer son expérience de recherche.
Rank Brain a été mis en place car sur les 3 milliards de recherche par jour, environ 15% posaient un problème au moteur. Multipliez 3 milliards par 365 jours et vous obtenez le chiffre pharaonique de 1095 milliards de requêtes par an. 15% de ces 1095 milliards et c’est 164 milliards de requêtes non comprises par Google et par an. Il nous est donc aisé de comprendre que Google ait voulu développer un algorithme pour améliorer son moteur et résoudre le problème.
Mais que sont ces 15% de requêtes ?
Les 15% de requêtes représentant de sacrés trous dans la raquette sont essentiellement liées aux problématiques suivantes :
- L’utilisateur ne connait pas les termes qu’ils recherchent et ne peut que baser sa recherche sur des approximations. Exemple : je ne connais pas le terme « unité centrale » pour un ordinateur, alors je vais tourner autour du pot en faisant une longue phrase (longue traine en SEO). Exemple : « Boitier qui contient le disque dur d’un ordinateur »
- Les langues humaines contiennent bien souvent des ambiguïtés. Exemples : « orange », peut référer au fruit, à la couleur ou encore à une entreprise de télécoms.
- Pour une même requête, le besoin peut être aussi différent. Est-ce que je recherche juste des informations ou est-ce que je suis déjà dans une phase de décision d’achat ? Intuitivement et en tant qu’être humain on peut capter l’intention mais pour une machine comment faire ?
Lancé depuis fin 2015 et en constante évolution depuis, Google Rank Brain est un algorithme d’apprentissage automatique basé sur du Deep Learning ou réseau de neurones.
Google Rank Brain et son réseau de neurone sont capables de faire deux choses fondamentales :
- affiner la requête de l’internaute
- observer le comportement humain
Expansion de requête
Google Rank Brain affine la requête en la modifiant en arrière-plan et sans que l’utilisateur n’en soit conscient. Il s’appuie sur les requêtes du passé, en les comparant aux contenus les plus pertinents stockés dans sa base.
Tous les textes qui sont stockés dans l’index ne le sont pas sous forme de textes mais sous forme de vecteurs qui sont des entités mathématiques. Les vecteurs vont être corrélés entre eux selon les relations trouvées entre eux.
Exemple le mot « Roi » est relié dans l’index avec le mot « Reine » avec la relation homme, femme. Autre exemple avec les capitales des pays où la Russie a pour capitale Moscou, la France a pour capitale Paris etc… avec la relation pays, capitale.
Cela se fait grâce à un outil qui s’appelle Word2Vec, basé sur des réseaux de neurones. La machine apprend d’elle-même et réduit ainsi la marge d’erreur sur des requêtes encore jamais vues ou peu demandées, nos fameux 15% non « élucidés » par le moteur.
Apprentissage du comportement humain
En complément de la compréhension de la requête, Google Rank Brain est aussi et surtout capable d’observer les comportements humains et d’apprendre par lui-même pour s’améliorer et proposer une prochaine fois, encore de meilleurs résultats.
Car ce sont aussi les interactions entre les résultats proposés et l’utilisateur qui sont extrêmement importants pour un moteur. L’utilisateur a :
- cliqué sur tel ou tel résultat > Taux de clics.
- passé du temps sur la page et auquel cas peut-on considérer que cette page a satisfait son besoin > Temps passé sur la page.
- cliqué pour revenir en arrière et été obligé de saisir une requête autrement formulée > Taux de rebond.
Autrement dit, le comportement de l’internaute et les traces qu’il va laisser sur les pages web proposées font partie de ce que Rank Brain va analyser. Et Rank Brain va non seulement analyser mais aussi apprendre.
D’après Google, Rank Brain serait devenu le 3e critère le plus important contribuant aux résultats de recherche, avec les liens entrants et le contenu. C’est le fruit d’une décennie d’efforts et d’investissements de la part de Google dans les technologies de l’intelligence artificielle.
L’arrivée de BERT en 2019
Là où Rank Brain analyse la requête, l’affine et observe nos comportements pour juger de la pertinence d’une page plutôt qu’une autre, BERT va encore plus loin.
BERT (acronyme de Bidirectional Encoder Representations from Transformers) s’attaque à la compréhension des requêtes longues et complexes. Il est capable de comprendre le contexte et les nuances d’une langue. Concrètement, les transformateurs (Transformers) permettent une interprétation des mots clés en contexte, et non plus mot à mot. Ainsi, par exemple, le moteur, avec BERT, intègre les connecteurs logiques, comme les mots « vers », « « plus », « sans », « pour » etc…
Prenons l’exemple de la requête ci-dessous et donné par Google dans son blog Google AI.
« 2019 brazil traveler to usa need a visa » ou en français dans le texte « 2019 voyageur brésil aux usa a besoin d’un visa »
Avec l’algorithme précédent, les résultats n’intégraient par la dimension « to » ou « vers ». Désormais, ce sera le cas, ce qui influe bien évidemment sur la réponse. Jugez plutôt AVANT/ APRES.
Source Google Blog : https://blog.google/products/search/search-language-understanding-bert/
La bonne réponse est liée à l’intention de recherche d’un brésilien qui souhaite se rendre aux USA et pas d’un américain qui souhaite aller au Brésil. BERT a compris de lui-même en comprenant le contexte et en choisissant la bonne option.
Notre moteur doté d’intelligence artificielle
Et voici donc notre moteur de recherche Google augmenté de son intelligence artificielle et en résumé bien sûr.
Stratégie SEO face aux impacts des intelligences artificielles de Google
Depuis à peine une décennie (Hummingbird en 2012), Google développe ses algorithmes de deep learning pour améliorer sa compréhension des requêtes en langage naturel et fournir les meilleurs résultats.
Les utilisateurs ont tendance à formuler leurs requêtes en s’adressant à la machine non plus avec de simples mots mais en faisant des phrases entières. On parle déjà à nos devices et notamment nos portables et nos enceintes connectées comme si on s’adresserait à des humains.
Le traitement du langage naturel est donc devenu un impératif pour les moteurs. Il représente un axe d’amélioration et un enjeu majeur puisqu’on passe d’une compréhension basée sur de simples mots clés à des concepts et entités dotés de sens et entrant en relation.
Les algorithmes Google Rank Brain, BERT et plus récemment SMITH dont nous reparlerons dans un autre article sont au cœur de cette recherche de la perfection pour comprendre le langage humain.
Même si les algorithmes fondateurs de Google comme Page Rank, Panda et Pingouin continuent de peser dans la balance pour le classement final, l’intelligence artificielle modifie déjà la donne dans les pages de résultats.
Le pouvoir des neurones artificiels
Les réseaux de neurones apprennent vite, peuvent donner des résultats rapides et parfois même bien plus performants qu’un humain ne peut le faire. Ce qui ajoute aussi à la « nébuleuse » de l’IA dans le moteur est que dans l’architecture de ces réseaux, il peut y avoir des couches cachées ou « boites noires » portant aussi dans leur ADN des biais algorithmiques. Les règles du jeu sont en train de changer. Elles ne sont plus seulement définies par les ingénieurs qui construisent les mécanismes d’apprentissage automatiques mais aussi par ces mêmes mécanismes et leur analyse très « personnelle » des données qu’ils digèrent.
Une météo SEO parfois turbulente
Les changements mis en œuvre chaque année par le géant Google pour affiner ses algorithmes d’IA ne vont-ils pas accélérer le degré des fluctuations dans les classements ? En 2019 et selon l’incontournable blog « Abondance » dirigé par Olivier Andrieu, on a compté pas moins de 3620 modifications algorithmiques soit 10 par jour. Chaque année, sont recensés des bugs et autres mouvements étranges dans les résultats avec parfois de fortes variations inexpliquées qui reviennent dans la plupart des cas et heureusement à la normale. Ces changements peuvent donc réserver des surprises en négatif comme en positif.
La notion de mot clé unique est révolue
La notion de mot clé unique s’estompe au fur et à mesure que les usages internautes et les adaptations du moteur progressent. Même si placer les mots clés et expressions de recherche dans les titres et le contenu textuel reste la base, ces seules règles ne suffisent plus. Les contenus doivent être aussi riches sémantiquement que possible, être pensés autour d’un ensemble de requêtes et besoins informationnels et faire preuve d’expertise.
Continuer à produire du contenu de qualité
Pas de grosse surprise ici puisque la tendance est encore et toujours à produire un contenu qualitatif, exhaustif et utile. Pour ce faire, quelques principes de base comme :
- élargir le champ sémantique aux expressions de recherches les plus plébiscitées
- Souvent Google nous y aide lui-même en fournissant :
- les suggestions d’autocompletion dans la barre de recherche
- les recherches associées et autres question posées
- une liste des PAA ou People Also Ask en bas de page
- un « benchmark naturel » avec la liste des pages qui se positionnent très bien sur la thématique
- Souvent Google nous y aide lui-même en fournissant :
- couvrir l’ensemble des requêtes liées à la thématique et permettre toutes les connexions possibles entre le sujet central et ses sous thématiques
Stratégie tournée vers l’utilisateur
La raison d’être de Google est de fournir les meilleurs résultats pour les utilisateurs. Plutôt que de développer des contenus pour faire uniquement plaisir à Google, penser encore plus en termes de service rendu et expérience utilisateur devient encore plus crucial. Si les utilisateurs apprécient vos pages, Google de facto les appréciera. Le comportement de l’utilisateur étant aussi un des facteurs importants (taux de clics, temps passé couplé au taux de rebond etc..), la stratégie de contenu doit être drivée par une approche de plus en plus User Centric.
Ne pas négliger la technique
Tout ce qui est dit plus haut ne saurait fonctionner de manière optimale sans un socle technique sain et raccord avec les critères attendus. Si le socle technique ou le contenant ne permet pas à l’utilisateur de naviguer sur un site selon les standards recommandés comme par exemple des temps de chargement des pages rapides, une version mobile accessible et lisible, un parcours client efficace, les efforts sur les contenus feront au long terme effet de maigres rustines. Qu’importe le flacon pourvu qu’on ait l’ivresse ? Pas vraiment. Le flacon a aussi une importance fondamentale pour que Google puisse explorer les pages d’un site, les indexer pour ensuite les restituer en fonction des requêtes cherchées. Bichonner le flacon et son contenu mènera peut-être vers l’ivresse : nouvelle devise SEO ?
Intelligence artificielle et SEO: Conclusion
Le SEO est de plus en plus dépendant de l’intelligence artificielle et notamment celle de Google. Le géant de Mountain View s’impose comme LE leader des traitements algorithmiques et d’intelligence artificielle dans son domaine :
- Google Rank Brain, BERT et consorts comprennent de mieux en mieux le langage naturel et « manipulent » déjà les requêtes en arrière-plan pour nous fournir, selon eux, l’information la plus pertinente.
- L’expérience utilisateur est observée de près par les algorithmes et devient de plus en plus importante.
- Sans négliger la technique, les contenus riches sémantiquement, longs et exhaustifs sont plus que jamais d’actualité pour optimiser un site.
Pour aller un peu plus loin
Les technologies d’intelligence artificielle de Google déjà bien installées, assoient leurs prérogatives. Au même titre que l’écriture et l’imprimerie, les nouvelles technologies de l’information selon Google ont déjà changé notre façon de restituer la connaissance et la percevoir. Connaitre ce qui « motive » les résultats du Search sur le web et passer derrière la caméra fait partie et au-delà du SEO, de ce que tout un chacun devrait aussi savoir.
Peut-on ainsi parler d’un avenir de la pensée et de la vérité à l’ère de l’intelligence artificielle ? Un évangile selon Google en quelque sorte. La question mérite d’être investiguée en tous cas et reste ouverte.
Plus de 10 ans d’expérience en gestion de projets IT & Digitaux à l’échelle internationale – Cabinet Conseil (Big 4), Grands Groupes, PME et Start Ups. Reconvertie dans le Marketing Digital et le SEO depuis 2017. J’aime les sciences et techniques, les innovations et les nouvelles technologies qui impactent déjà le monde d’aujourd’hui.
Un commentaire