IA et intelligence humaine : la French Tech SEO monte en puissance !
Babbar n’est ni un éléphant vert, ni un éléphant bleu ni un éléphant rose ! Nous allons parler de la French Tech en matière de SEO avec Sylvain Peyronnet, créateur d’algorithmes dont la portée commerciale peut aller bien au-delà de nos frontières. Il nous fait l’honneur et le plaisir de répondre à quelques questions pour mieux comprendre la portée de deux de ses solutions webmarketing et référencement web : babbar.tech et yourtextguru.
Au menu au fil de cette interview :
- Le parcours de Sylvain et de ses deux algorithmes
- A l’assaut de Semrush
- Le développement de babbar.tech
- Testing : GPT-3 et la génération de textes human and SEO fiendly
- Comprendre le succès des formations des frères Peyronnet
DE L’UNIVERSITE A L’ENTREPRENEURIAT

Biographie de Sylvain Peyronnet
Christophe Bernard : Bonjour Sylvain, pour nos lecteurs qui ne te connaissent pas encore pourrais-tu te présenter ?
Sylvain Peyronnet : je suis aujourd’hui chef d'entreprise, mais j'ai eu une autre carrière puisque j'ai été enseignant chercheur à l'université, maître de conférences à Paris-Saclay et ensuite professeur des universités à l'Université de Caen. Toute ma carrière de chercheur je l’ai faite en travaillant sur des algorithmes d'approximation pour différents problèmes, y compris des problèmes liés à l'anti-spam sur le Web et toutes sortes d'algorithmes qui sont utilisables pour faire des moteurs de recherche.
En 2014, j’ai quitté l’Université pour monter une société qui s’appelle ix-labs, qui était finalement une espèce de version privée de ce que je faisais à l’Université puisque son activité était centrée sur la R&D et la formation. C’est une société qui existe toujours, même si elle est maintenant un petit peu plus indépendante de moi. Elle reste concentrée sur des activités SEO alors que moi je suis beaucoup passé sur Babbar.tech.
FONDATION 2019
J’ai monté Babbar.tech en 2019 avec un groupe de personnes qui se connaissent depuis près de 20 ans pour la plupart. Babbar, c’est une société qui fait des outils en SaaS pour les spécialistes SEO et les webmarketeurs. Deux outils sont plus connus que les autres : Yourtext.guru et Babbar.tech. Notre objectif est de fournir des outils qui permettent de prendre de meilleures décisions au niveau de campagnes webmarketing, pour le content marketing et le référencement web.

Christophe Bernard : en quelques mots quelles sont les fonctionnalités de ces deux principaux outils ?
Sylvain Peyronnet : Yourtext.guru, c’est un outil d’aide à la rédaction pour créer des textes qui se positionnent dans le moteur de recherche Google. C’est un outil multi-langues. Le concept de l’outil, c’est de saisir une requête, et l’outil indique les mots qu’il faut utiliser dans un texte pour bien se positionner dans Google : c’est l’attendu sémantique de Google par rapport à une requête.
Cette fonctionnalité est interactive car les utilisateurs peuvent rentrer un texte, cela permet de scorer en temps réel jusqu’à ce qu’on aboutisse à un texte qui soit meilleur que celui des concurrents. Et puis il y a d’autres fonctionnalités, parmi elles on compte :
- la génération automatique de cocons sémantiques, un concept assez à la mode en référencement et en marketing,
- la possibilité de trouver des idées de rédaction avec des questions associées à des requêtes.
Babbar.tech vise une autre verticale du marketing sur le web et du SEO. Nous disposons d’un index du graphe du web : il y a 730 milliards de pages dans notre index à l’heure où l’on se parle (Août 2021). Cela a vocation à augmenter au fur et à mesure du temps pour atteindre à un moment donné une valeur qui sera à peu près stable et nous positionnera un peu devant nos concurrents internationaux.
On analyse cet index pour calculer la popularité, la confiance que l’on peut accorder à un site, on calcule ce qu’on appelle le PageRank thématique, la cohérence du profil des liens qui sont faits vers un site Web par rapport à la sémantique du site. On fournit des questions reliées aux contenus. Il y a plein de fonctionnalités comme le calcul de contenu dupliqué. On fait toutes sortes de choses pour les référenceurs web et globalement, pour les webmarketeurs.
Christophe Bernard : quel a été l’accueil commercial de ces deux outils ?
Sylvain Peyronnet : Yourtext.guru est assez bien établi maintenant puisque ça fait quelques années qu’il existe. Je pense que son usage a explosé comme la plupart des outils SaaS à la faveur des différents confinements. On a 20 000 comptes actifs et plus de 2 000 utilisateurs réguliers mensuels. On a des abonnés et d’autres utilisant nos outils en payant à la tâche avec un système de tokens.
Babbar.tech est beaucoup plus récent puisqu’il date de novembre 2020, on a vraiment commencé à faire sa promotion en février 2021, il fallait que certaines fonctionnalités soient finalisées. Cette promotion s’accélère depuis qu’on a fait notre levée de fonds. On a pour le moment une grosse centaine d’utilisateurs et Babbar.tech fonctionne parfaitement bien avec Yourtext.guru avec une très belle croissance. On est assez satisfait pour l’instant, même si ce n’est que le début.
Christophe Bernard : Existe-t-il à l’international des outils similaires aux tiens ?
Sylvain Peyronnet : plus ou moins. Le plus connu, c’est SEMRUSH qui a des fonctionnalités en plus des nôtres et d’autres en moins. Il y a aussi Ahref, Majestic, et Moz : ce sont les quatre principaux autres acteurs avec Sistrix.
Sur la partie sémantique, c’est beaucoup plus amusant parce que on est dans un écosystème beaucoup plus riche et plus franco-français. La communauté française est très active sur ce sujet depuis plusieurs années.
Christophe Bernard : il y a une chose qui m’a étonné Sylvain, c’est que tu as aussi une clientèle internationale pour tes outils.
ESSAIMAGE INTERNATIONAL

Sylvain Peyronnet : oui c’est intéressant parce que pour l’instant, on n’a pas fait de vraie promotion à l’international. On a quelques clients qui nous ont découvert un petit peu par hasard à l’étranger, hors pays francophones. Mais il y a aussi un phénomène important. Il y a des français qui s’expatrient : ils partent avec leur savoir-faire à l’étranger et avec leurs outils. Cela a créé de l’essaimage, ils ont fait découvrir nos outils et nos outils sont maintenant connus en Espagne, en Angleterre et en Australie. Pour l’instant, on n’a pas encore fait de vraie promotion à l’international, mais cela va commencer dans les prochains mois. La clientèle internationale est d’une certaine manière plus facile que la clientèle française, elle ne nous transmet pas de remontées. C’est très différent de la communauté française qui est beaucoup plus active en la matière.
Christophe Bernard : qu’est-ce qui motive cette clientèle internationale en dehors du fait que ton outil soit multilingue ?
Sylvain Peyronnet : en toute modestie nos outils sont tout simplement meilleurs. Sur toute la partie netlinking on est face à de très gros compétiteurs internationaux, mais nos compétiteurs utilisent des modèles de calculs de popularité qui sont assez datés. Nous, on a déjà le PageRank sémantique, et on filtre les sites les plus spammy de notre index. On a aussi la capacité de traiter la sémantique en même temps que le linking. Je pense qu’on est à peu près les seuls au monde à la faire. On a des outils qui s’appuient sur une meilleure data et à des prix raisonnables.
Pour l’analyse sémantique, nos clients voient des résultats vraiment intéressants pour eux, c’est pour cela que l’on est très utilisé. Il n’y a pas beaucoup plus à dire pour expliquer notre succès.
Christophe Bernard : Quelle est aujourd’hui ta capacité de crawl ?
Sylvain Peyronnet : elle est de 1,4 milliard de page par jour en refresh et en exploration. On va rapidement monter en capacité avec de nouveaux serveurs malgré quelques retards que l’on subit du fait des goulots d’étranglement sur le marché des chipsets.
Christophe Bernard : est ce qu’il y a une taille d’index qui serait idéale par rapport aux attentes de ta clientèle ?
Sylvain Peyronnet : Oui bien sûr mais il y a déjà une chose amusante à noter : nous avons déjà beaucoup plus de pages qu’il n’en faut pour être un moteur de recherche de très bonne qualité ! Cependant, ce que veulent nos clients, c’est que leur site web soit dessus, même s’il n’a pas une très une grosse notoriété. Nous allons donc faire rapidement mieux. C’est par rapport aux compétiteurs qu’il faut raisonner. Le plus gros compétiteur de ce point de vue-là, c’est AHREF qui domine avec plus de 2 000 milliards de pages. On vise donc à minima 2 000 milliards de pages dans notre index, c’est assez conséquent.
2 000 MILLIARDS DE PAGES MINIMA

Tout le monde communique beaucoup sur le nombre de pages puisque que c’est un chiffre impressionnant. Mais la réalité c’est que si on raisonne en terme de site web, on est à presque à 41 milliards de sites Web indexés au moment où l’on parle. Et en vérité, la plupart des gens, quand ils ont un site Web qui a un peu d’ancienneté, trouvent leur site web dans notre index. Par contre quand on a un site web qui fait 10 000 pages et qu’on a que 5 000 pages dans un outil, on a vraiment l’impression de ne pas avoir toute l’info que l’on pourrait avoir. D’où notre volonté de monter en « taux de couverture » à très court terme.
Christophe Bernard : je comprends cette nécessité, ta récente levée de fond de : 2,1 millions d’euros était justifiée par ce seul motif.
LEVEE DE FOND 2,1 MILLIONS D’EUROS
Sylvain Peyronnet : ce n’est pas le seul motif. Déjà, il faut vivre de façon correcte. Et, puis nous sommes une petite équipe de fondateurs passionnés, on est 6 pour Babbar, sans compter les associés d’origine de yourtext.guru : Frédérik et Benoit. Cette équipe est constituée de forts profils très techniques. Il faut donc développer le commercial : se financer assez pour pouvoir travailler confortablement. L’objectif de cette levée de fonds, c’est de muscler les infrastructures et les ressources humaines avec l’embauche d’une équipe pour compléter la technique, le commercial, la relation client et la gestion du produit. On a commencé à recruter, à la fin de l’été on sera normalement 11. Notre idée, ce n’est pas de recruter à tour de bras, c’est d’avoir des personnes qui seront disponibles pour répondre aux besoins de nos clients.
Christophe Bernard : parlons maintenant de ce que l’on peut attendre comme autres apports de l’IA au monde du SEO. Parlons tout d’abord de la génération de texte par GPT-3. En la matière, il se dit que le test de Turing est validé. Quelle est ton opinion à ce sujet ? Est-ce que GPT-3 constitue un bon outil de production de contenu textuel ?
GPT-3 et SEO

Sylvain Peyronnet : quand on s’intéresse aux textes pour le SEO, il y a deux variables qu’il faut prendre en compte : il y a une variable qui est la qualité du texte, et une autre qui est le niveau d’optimisation du texte.
La qualité du texte, c’est vraiment se demander si l’être humain qui lit le texte le trouve naturel et s’il trouve l’information qu’il souhaite. Les moteurs savent mesurer cela avec des classifieurs en utilisant du machine learning. Grosso modo, ils se sont étalonnés par rapport à des datasets faits par des humains et le moteur finit par apprendre ce qui est plutôt bien écrit, et aussi ce qui est plutôt mal écrit et peu pertinent.
Et puis il y a l’optimisation. Le moteur veut classer des pages prises parmi celles qui sont suffisamment qualitatives. Il va mettre en avant certaines pages et d’autres non. Il le fait par un mécanisme de clustering qui fait que, finalement, il se crée un vocabulaire qui est plus performant que les autres pour être bien classé.
Les deux mécanismes sont donc totalement différents. On peut avoir le vocabulaire, sans avoir la qualité. On ne peut pas avoir la qualité sans avoir le vocabulaire. Si on a les deux, on est très bien placés. Si on a que l’un, on peut être plus ou moins bien placé.
PERTINENCE DES TEXTES
Les modèles génératifs comme GPT-3 permettent de faire de la qualité, mais pas de l’optimisation. On peut faire des textes qui sont statistiquement assez cohérents par rapport à ce qu’attend l’être humain. Il y a en fait deux façons d’utiliser GPT-3 : le mode interactif et le mode one shot. Si je demande par exemple à GPT-3 de créer un texte de 500 mots sur « comment marche un barbecue à gaz », le résultat sera généralement assez mauvais. En fait, il n’y a pas de continuité suffisante entre le début de texte et la fin de texte pour qu’il ait vraiment un cheminement de « pensée » qui soit correct. Si on le fait en mode interactif, c’est-à-dire en donnant une phrase et en choisissant ce que l’on garde ou pas, là, on peut avoir des résultats qui sont raisonnablement qualitatifs, mais ils sont très rarement optimisés pour le moteur de recherche.
LA CREATION DE CONTENU IA : JUSQU’OÙ ?

Nous avons fait des tests avec GPT en générant quelques milliers de textes et en les mettant en ligne. Grosso modo, il y a un texte sur 500 ou 1 000 qui performe vraiment. Si des êtres humains écrivaient de la soupe, c’est ce qui se passerait. Mais voilà, ce n’est pas du texte optimisé, donc c’est une problématique. Utiliser GPT-3 ne répond pas à l’intégralité de la problématique. Quelqu’un qui voudrait vraiment faire des textes qualitativement suffisamment bons et optimisés, devrait les reprendre avec Yourtext.guru pour optimiser. C’est faisable, mais c’est long. Le souci, c’est que les gens veulent utiliser l’intelligence artificielle pour accélérer leur processus de rédaction. Cela marche seulement pour faire des textes pas très qualitatifs et qui ne seront pas vraiment optimisé.
Christophe Bernard : qu’est-ce qu’on pourrait attendre de GPT-3 ou d’autres intelligences artificielles qui pourrait être utiles à la communauté SEO ?
Sylvain Peyronnet : cela dépend en fait ce qu’on veut faire. Il y a une problématique qui est la pauvreté des contenus pour les sites qui sont très « templatés ». L’e-commerce vient à l’esprit et pour les annuaires, c’est le même genre de choses. Pour ces sites, il y a un intérêt. En fait, on peut nourrir des modèles génératifs GPT-3 ou d’autres IA avec de l’information particulière pour générer des textes. Si on prend par exemple les résultats d’une élection, c’est toujours un petit peu formé de la même manière, tout comme la description des commerces dans une ville. Pour ce genre de choses, on arrive à un certain degré de maturité qui permet de faire des textes qui sont suffisants pour l’être humain. Même s’il se rend compte que le texte est généré par une IA, il se dira qu’il a l’info qui lui faut. Après, si on veut faire du texte vraiment informationnel pour l’instant cela ne marche pas suffisamment bien. Cependant, si on veut faire de la soupe pour meubler, il n’y a aucun problème. On peut le faire au kilomètre, cela marche parfaitement bien.
LA CREATION DE CONTENU IA = DANGER ?
Je pense que c’est une démarche qui va être assez vite flaguée par Google. Nous avons testé cela jusqu’au bout. Nous avons créé un site web où nous avons placé beaucoup de contenu généré par un GPT un peu customisé. Les contenus ont été indexés par Google. Certains se sont positionnés et d’autres pas. Et pour aller jusqu’au bout de la démarche nous avons fait une demande d’insertion dans le système publicitaire de Google pour voir ce qui se passait. Après un peu d’attente, on a reçu un mail personnalisé : notre demande a été analysée par un être humain. On nous a dit que notre site était constitué de textes générés par un procédé algorithmique, et notre demande d’insertion publicitaire a été rejetée. Il y a donc une problématique qui au niveau de Google est clairement identifiée. Je pense qu’il y a des sites qu’ils suspectent parce qu’ils se rendent compte de certaines propriétés statistiques de ces modèles.
Christophe Bernard : parlons maintenant de spam, Google détecte 15 000 milliards de pages de spams chaque année, où en est-on à ce sujet ?
15 000 MILLIARDS DE PAGES DE SPAMS
Sylvain Peyronnet : nous le voyons très clairement chez Babbar.tech car notre index est nettoyé périodiquement. On voit d’importants signes de spam, notamment dans certains pays, puisqu’on a un index international. C’est assez amusant parce que c’est un petit peu ce qui se passait en France dans les années 2000. Ça se pratique encore dans certains pays qui visent souvent d’autres moteurs que Google, par exemple en Chine avec Baidu et d’autres moteurs qui sont probablement moins efficaces pour filtrer le spam que Google.
Christophe Bernard : Tu as aussi une activité importante en matière de formation avec ton frère Guillaume. Quel est le champ que vous couvrez en termes de formation ?
Sylvain Peyronnet : Ce sont les formations dites des frères Peyronnet. Nos formations essayent toujours de faire passer les savoirs et les bonnes pratiques liées à l’utilisation d’algorithmes et de techniques pour le webmarketing au sens large et le SEO. On a une formation star qui existe depuis très longtemps, elle s’appelle la Master Class Moteurs + SEO qu’on retrouve actuellement chez Olivier Andrieu via Formaseo : algorithmie des moteurs dans laquelle on explique comment fonctionne un moteur de recherche de A à Z. Ça, c’est vraiment la formation qui nous a fait connaître.
MASTER CLASS MOTEURS + SEO

On a d’autres formations sur le cocon sémantique, sur les audits SEO, sur l’utilisation de la data et du machine learning pour le webmarketing. Ces formations s’appuient sur nos connaissances et notre expertise qui est plutôt technique et algorithmique. Nous vulgarisons au maximum pour que la communauté travaillant sur les problématiques de visibilité web au sens large se l’approprie. Nous croyons fortement qu’il y a moyen de faire mieux avec une meilleure expertise algorithmique et technique. Historiquement, les métiers de la visibilité sur le Web, sont plutôt vus comme des métiers un petit peu « mous » parce que pas très techniques et un peu trop commerciaux. En fait, les métiers du marketing sont des métiers extrêmement techniques. Il y a moyen de progresser pour prendre de meilleures décisions marketing, c’est l’objectif de notre offre de formation.
Christophe Bernard : ta formation sur l’algorithmie des moteurs de recherche suscite effectivement un fort engouement. Quelles sont d’après toi les raisons de ce succès ?
Sylvain Peyronnet : il y a deux choses. En vérité la plupart des pros du web savent assez peu comment fonctionne un moteur de recherche, et ils veulent contextualiser leur métier pour simplement comprendre quels sont les objets avec lesquels ils travaillent, d’où ils viennent. En fait, la plupart des gens pensent que Google, c’est une espèce de truc magique alors que ce n’est qu’une suite d’algorithmes empilés les uns sur les autres. Ce qui est plutôt miraculeux, c’est que cela marche finalement d’empiler les algorithmes les uns sur les autres (rire).
LA MAGIE DE GOOGLE
Et puis, il y a des chocs, des révélations. On a souvent des idées préconçues sur le fonctionnement d’un moteur, mais elles sont assez fausses. Se rendre compte de comment cela marche, c’est super alléchant. C’est assez souvent au bout d’une semaine, après avoir suivi les cours : on reçoit des mails de personnes nous disant qu’ils n’auraient jamais cru que cela fonctionnait comme ça. Ils comprennent maintenant pourquoi on leur dit en SEO de faire ceci ou cela. Cela légitime finalement leur métier. Les gens comprennent d’un seul coup ce qu’il faut faire, tout simplement.
Christophe Bernard : Parlons du futur, de tes projets !
Sylvain Peyronnet : on peut parler de plein de choses, mais nous sommes très focus sur nos outils web aujourd’hui. On rajoute beaucoup de fonctionnalités dans Babbar.tech et dans Yourtext.guru, qui vont aller vers une proximité de plus en plus forte. Je ne crains pas de dire que l’on veut se diriger vers des périmètres fonctionnels, équivalents ou plus larges à nos plus grands compétiteurs internationaux comme SEMRUSH ou d’autres. Notre objectif, c’est de faire mieux qu’eux sur absolument tout. C’est très ambitieux, car ils sont en bourse. Nous on est une petite boite alors on se doit d’être très ambitieux !
BABBAR ACADEMY
Et nous avons bien sûr tout notre entourage. On ne perd pas de vue cette mission qui est finalement d’aider les pros du web à faire leur métier, avec une certaine vision de comment le job doit être fait. On va donc entourer nos outils de tout un écosystème d’apprentissage, on va créer ce qu’on appelle la Babbar Academy. On veut que les gens progressent. C’est bien utile pour mieux vendre nos outils, mais c’est aussi intéressant parce que cela permet une meilleure structuration de nos métiers. Le référencement aujourd’hui se structure de plus en plus. Mais on voit bien que dans le grand public, cela reste assez mystérieux. Il y a toutes sortes de professionnels dont certains sont plus ou moins cotés que d’autres. Parfois, il y a des déficits d’image dans notre communauté… Aller vers de meilleurs process, je pense que c’est le bon sens d’un point de vue professionnel.

10 d’expérience en marketing et communication chez l’annonceur et en agence, 15 ans de création de contenu pour la télévision, le web et le phygital. Je suis actuellement SEO in house au sein du groupe Premista pour conquérir la SERP française du crédit et de l’assurance.
2 commentaires