Comme Anna et Edwin viennent de vous l’annoncer, mes deux thèses sont disponibles dès maintenant au téléchargement. Découvrez de nombreuses opportunités marketing à saisir et des leviers de productivité à actionner. Je vous invite à les lire et à échanger ensemble sur ces sujets.
L’achèvement de ces deux thèses est l’occasion de tenter d’apporter une conclusion générale. C’est un exercice périlleux, car les deux écosystèmes étudiés, celui du search et celui des applications vocales des annonceurs activables sur les enceintes connectées, sont de nature très différente. Explications et convergences futures.

Qu’est-ce-qui conditionne la visibilité d’un site web ?
Pour le vocal search sur les appareils avec écran, le niveau de visibilité du contenu d’un annonceur est conditionné par :
- Le niveau des budgets dédiés au SEO et le niveau qualitatif des contenus ;
- Le bon vouloir des algorithmes déterminant le ranking ;
- L’activité SEO de la concurrence ;
- La qualité du travail du référenceur.
Qu’est-ce-qui conditionne la visibilité d’une application vocale pour enceinte connectée ?
Pour l’interaction vocale sur les appareils sans écran, le niveau de visibilité du contenu d’un annonceur, hormis en matière de search sur le Web, est conditionné par :
- Le niveau du budget de communication pour faire connaître l’application vocale ;
- L’amélioration par Google et Amazon des solutions algorithmiques facilitant la découverte des applications en mode vocal ;
- La pertinence de l’application vocale crée ;
- L’adoption des enceintes connectées et leur usage futur.
L’adoption est en effet à la traîne, la défiance envers les assistants vocaux présents au sein du foyer est forte en France, mais aussi aux États-Unis. 30 % des Français qui sont possesseurs d’une enceinte connectée le sont à la suite d’un cadeau qu’ils ont reçu pour les fêtes de fin d’année… Si les Français ont peur à titre individuel, ils n’hésitent cependant pas à offrir ce cadeau à des amis ou à des membres de leur famille. Mais passons, projetons-nous dans un futur, peut être proche, dans lequel ces résistances auront disparu. Un autre problème serait alors à régler, celui de la visibilité des applications vocales.

La compréhension de nos intentions de recherche
L’AEO permet aux annonceurs de rendre visibles leurs pages web. Il est en revanche aujourd’hui extrêmement difficile de trouver une application vocale pour Google Home ou Amazon Écho. Le plus facile est de consulter les listes éditées par Google et Amazon. C’est un peu comme à l’époque de la préhistoire du Web : ce sont des annuaires ! Quand on veut découvrir directement une application en parlant à une enceinte connectée, c’est souvent très compliqué. Alexa et le Google Assistant ont beaucoup de progrès à faire sur ce point : ils ont du mal, pour le moment, à comprendre nos intentions de recherche pour ouvrir l’application vocale la plus pertinente. Google avance sur ce sujet, tout comme Amazon qui va étendre progressivement à tous les pays et à toutes les langues son système de name free invocation. Une interaction qui devrait permettre aux utilisateurs de se passer des phrases, aujourd’hui utiles à connaître par cœur, pour interagir pleinement avec Alexa.
Quand ces deux écueils, adoption et découvrabilité, seront dépassés, nous verrons donc peut être apparaître une sorte de convergence entre les deux écosystèmes en apparence si éloignés ! Une nouvelle branche du SEO que l’on pourrait appeler le VSEO, un acronyme fictif, signifiant Vocal Search Engine Optimisation, pourrait apparaître. Le VSEO consisterait à identifier les expressions de recherches prononcées qui sont utiles à la découverte des applications vocales et de leurs contenus. Cette opportunité d’amélioration de la visibilité des contenus vocaux n’est pas mobilisable, dans toute sa profondeur, pour le moment. Il existe cependant des pépites que l’on peut « ramasser » dès aujourd’hui, il suffit de se pencher sur le paragraphe qui suit.

Opportunités à saisir !
L’écosystème des enceintes connectées n’est pas aujourd’hui soumis à la pression concurrentielle. Les annonceurs, hormis peut-être dans le domaine de la grande distribution, ne se sont pas précipités sur ce nouveau canal. On est, en effet, dans une logique de R&D ou ce sont plutôt les DSI qui s’acculturent sur ce sujet, plus que les équipes marketing. Le ROI à obtenir aujourd’hui est celui de l’expérience acquise.
Il est assez rare, en marketing digital, de pouvoir s’affranchir pour un temps de la concurrence. C’est un des facteurs qui m’a amené à mettre en avant, dans la conclusion de ma thèse sur les applications vocales, l’importance de prendre position dès maintenant afin d’occuper à minima un slot Action et un slot Skill. Il s’agit, pour faire simple, de « réserver » des mots permettant de lancer une application vocale : l’équivalent du nom de domaine dans le search.

Si vous réservez aujourd’hui chez Google un nom d’invocation, il devient votre « propriété ». Si vous y adossez une application ultra basique, vous aurez réservé à moindre coup un nom d’invocation qui sera votre propriété. Les acteurs de la grande distribution se sont « battus » pour l’expression « liste de course ». Vous comprenez aisément pourquoi…
Le futur des IOT
De grands progrès technologiques doivent cependant être faits pour que les enceintes connectées et leurs applications vocales tierces deviennent demain des most wanted. Le Graal étant, qu’à terme, nous puissions avoir un vrai échange conversationnel avec elles.
La première interrogation de bon sens est, en effet, de se demander si l’usage des enceintes connectées dépassera le simple usage de la domotique et du récréatif. Si je compare l’usage d’une enceinte connectée à celui d’un smartphone, je vois que les seules choses mieux faites par l’enceinte connectée sont l’amplification et la captation du son. Ce type d’appareil dispose cependant d’atouts certains.

Les enceintes connectées Google et Amazon sont, en effet, peu coûteuses et leur utilisation ne nécessite aucune compétence digitale spécifique. Elles peuvent donc offrir une réelle praticité d’usage. Est-ce un gage de leur pérennité ?
Les enceintes connectées et les smartphones ne sont peut-être après tout que des appareils transitoires dans l’histoire de l’interaction vocale de l’homme avec la machine. Je ne veux pas ici parler de transhumanisme, mais plutôt parler des futurs nouveaux IOT qui permettront de mieux comprendre le contexte de notre interaction : nos émotions, le lieu dans lequel nous sommes et avec qui nous sommes au moment de l’interaction.
Luc Julia à la rescousse ?
Si l’on met de côté les questions d’acceptabilité sociale, on peut imaginer que les caméras de surveillance domestique, puissent devenir des assistants idéaux. Elles disposent d’un micro et d’une caméra permettant de mieux comprendre le contexte de nos interactions.

Luc Julia, le co-créateur de Siri, m’a indiqué, lors de la préparation de ma thèse, qu’il n’a pas la moindre idée concernant le device qui viendra supplanter nos appareils actuels. Il pense que le vrai enjeu n’est pas l’appareil, mais l’usage.
« Ma définition à terme d'IOT, c’est Intelligence Of Things. Quand les choses deviennent intelligentes, parce qu’elles sont en train de délivrer des services qui vous sont complètement utiles au moment où elles doivent rendre ces services. Ces dialogues, entre les objets et moi, créent cette Intelligence Of Things, cette nouvelle IOT cela va être cela, pour moi, qui va créer des nouveaux besoins de conversation avec ces objets. »
Luc Julia
J’imagine effectivement bien toute l’utilité, lorsque je fais mes courses, de pouvoir demander à mon frigo ce qu’il contient. Mais finalement, la vraie question que je me pose, tout comme Luc Julia, est de savoir si c’est intéressant d’avoir une conversation avec un frigo…
Au-delà de cette question, pleine de philosophie, Valéry Hapiot, consultant, formateur SEO et voice, m’a apporté une vision pragmatique de nos futurs modes d’interaction.

« Moi dans l’idée, je pense à J.A.R.V.I.S., l’assistant de Stark dans l’univers Marvel. Un assistant qui n’est pas là physiquement, mais qui s’interconnecte quel que soit la pièce ou l’endroit où tu es. Je peux interagir dans la salle de bain avec un miroir connecté. Je vais dans le salon, et là, j’ai mon enceinte. Dans ma voiture, j’ai mon assistant embarqué. Dans la rue, je parle avec mes écouteurs, ma montre ou mon smartphone. L’assistant nous suivra quel que soit l’appareil. C’est ma vision du futur. Il faut bien distinguer l’assistant vocal de l’appareil sur lequel il est implanté pour comprendre le vocal. C’est comme la confusion que font de nombreuses personnes entre ce qu’est un moteur de recherche et ce qu’est un navigateur Internet. Les gens pensent, à tort, que l’assistant Google est l’enceinte connectée alors que l’assistant peut être n’importe où. En revanche, je ne crois pas au tout audio. J’ai toujours eu la vision d’un avenir ou les écrans resteront. 90 % de l’information passe par la vue, le son est un plus. Sauf dans quelques endroits, comme dans la voiture ou dans la rue avec les wearables . Mais autrement, il y aura toujours un mélange. Même si les gens posent des questions à voix haute, ils ont besoin de vérifier sur écran la véracité des informations. L’être humain a besoin de voir pour être sûr. »
Valéry Hapiot

Le futur du conversationnel
Je partage la vision de Valéry Hapiot. Il est fort probable que le futur proche soit marqué par l’amélioration de la continuité de notre interaction avec les assistants vocaux. Si vous écoutez un podcast sous la douche, la lecture pourra continuer dans votre salon, puis dans votre voiture et jusque dans l’ascenseur vous menant à votre bureau. Comme l’assistant vocal connaîtra le contexte d’utilisation, la qualité de son interaction sera meilleure. Il pourra, par exemple, dès son lancement à domicile, vous proposer un épisode de podcast compatible avec la durée de votre trajet. Il pourra aussi puiser dans votre agenda afin de vous proposer un épisode de podcast en rapport avec vos rendez-vous du jour.
Au-delà de ces interrogations concernant la facilité d’interaction, il y a un défi technologique majeur à relever pour que l’intelligence artificielle nous permette un jour d’avoir une conversation intelligente avec nos machines. Ce premier défi, c’est tout simplement que l’intelligence artificielle fasse preuve d’intelligence. Sur ce terrain-là, la tâche est immense. Luc Julia m’a donné de multiples exemples.

L’IA est meilleure que l’humain au jeu de Go. Cependant, si vous ajoutez une seule case sur un jeu de Go, l’IA devient incompétente à la différence de l’humain. De fait, en marketing conversationnel, le chemin que peut faire l’IA semble limité : elle peut aider, par exemple, à pré-qualifier un appel téléphonique, mais pas beaucoup plus. En soit, cela peut paraître dérisoire, mais le peu de chemin fait par l’IA peut être une source de productivité et d’amélioration de la relation client considérable. Les utilisateurs du Serveur Vocal Interactif de la GMF le savent. L’époque du « tapez 1 » est révolue. L’IA vous identifie, qualifie votre demande avec beaucoup de précision, et vous met en relation avec un être humain dès qu’elle n’est plus assez compétente. Quand on sait à quel point la qualité de la relation client est fondamentale pour les annonceurs, on peut promettre un avenir radieux à ce type de solution.

La technologie à la rescousse ?
L’IA peut-elle encore progresser en compétence dans une logique conversationnelle avancée ? LaMDA de Google nous le laisse penser, mais semble n’être pour le moment qu’une simple vitrine. Je connais l’opinion de Luc Julia concernant l’intelligence de l’intelligence artificielle, après avoir regardé ses conférences et lu son dernier ouvrage : l‘intelligence artificielle n’existe pas. Les limitations de l’IA sont immenses. Je m’interroge donc : est-on finalement parti sur les bonnes bases technologiques dès le début ? La réponse que Luc Julia m’a apportée est d’une grande clairvoyance.
« C’est complètement de la force brute. Vous avez peut-être entendu parler de Bert, de Roberta et de camemBERT en France. Ce sont des bases de données qui ont des milliards de conversations et des milliards de phrases et on va aller se retrouver dedans pour savoir ce qui a été dit, et ce que ça veut dire. Cette méthode-là, c’est complètement inadmissible. J’aimerais qu’on arrive au small data au lieu des big data. C’est une chose importante, non seulement pour la beauté du résultat, mais surtout aussi pour éviter de faire péter la planète parce que les méthodes qu’on utilise aujourd’hui en force brute ne sont pas viable à l’échelle. Le problème aujourd’hui, c’est que c’est une solution de facilité qu’on utilise, mais ce n’est certainement pas la solution qu’il faudrait utiliser, ce n’est pas une solution intelligente. »
Luc Julia
Ce point de vue sur la force brute démesurée en IA , mise en regard avec son efficacité opérationnelle relative, m’a fait penser à trois citations d’Alfred Einstein. Il est amusant de les lire comme étant une seule phrase et de les mettre en perspective avec les propos de Luc Julia : “Un problème sans solution est un problème mal posé “, “Dieu ne joue pas aux dès” , “L’intelligence n’est pas la capacité de stocker des informations, mais de savoir ou les trouver”.

Le chemin technologique qui nous amènera à l’intelligence conversationnelle n’a rien d’évident. Imaginer que nous réussissions à avoir une conversation avec une machine en dehors d’un sujet et d’un contexte très précis n’a rien d’évident. Certains scientifiques voient la technologie comme étant un moyen d’y arriver.
La quantique à la rescousse ?
Une des avancées, présentée à tort comme étant majeure, c’est l’ordinateur quantique. Je me suis tourné vers Vivien Londe, ingénieur en logiciel quantique chez Microsoft, pour savoir ce que nous pouvons attendre du quantum machine learning.

« À terme, il y a effectivement la volonté d’aller vers l’intelligence artificielle. Mais pour l’instant, on manque encore pas mal de hardware quantique pour faire tourner tous ces algorithmes. On en est encore à un niveau théorique. Et si l’on parle des premières applications, cela ne va pas être du côté du machine learning quantique. Je ne serais pas surpris que ce soit plutôt la simulation moléculaire, la simulation de la matière. J’ai l’impression que le machine learning quantique, c’est un petit peu plus loin dans le temps. »
Vivien Londe

Photogramme extrait de 2001 : A Space Odyssey. © Creative Commons.
La solution n’est donc pas dans la puissance des machines, elle serait plutôt dans une sorte de révolution de l’IA : repartir à zéro pour trouver une solution nous permettant un jour d’avoir des machines moins bêtes et moins gourmandes en énergie.
En attendant de pouvoir vivre un jour une expérience du même type que celle du Dr David Bowman avec Hall 9000 dans 2001, l’Odyssée de l’Espace, mon opinion est qu’il faut aussi garder à l’esprit la réalité de ce qu’est aujourd’hui l’échange conversationnel entre les hommes et les machines :

Interaction d’une grand-mère de 85 ans avec une Google Nest Mini

10 d’expérience en marketing et communication chez l’annonceur et en agence, 15 ans de création de contenu pour la télévision, le web et le phygital. Directeur marketing et communication, consultant en webmarketing mais aussi créateur de contenu (photos, vidéos, rédactionnel et podcast) : je suis un couteau suisse digital.
Un commentaire