Content Marketingl’IA et le Speech to text ou la Voice transcription, ça vous parle

ia4marketing à la rencontre de Florian Stègre, CEO de Checksub, expert du speech to text pour les contenus vidéos

Parmi les raisons principales d’utiliser Internet, il y a la consommation de vidéos. A ce titre, Youtube.com se place en deuxième position des sites les plus visités au monde en 2020. D’ailleurs, plus de 90%* des données qui circulent dans les tuyaux (magnifique jeu de mot) du réseau des réseaux sont des vidéos. Elles permettent de s’informer, se divertir ou tout simplement se révèle être un passe temps.

Pour les marketeurs, c’est un véritable levier de content marketing. Il permet de faire découvrir sa marque, ses produits ou solutions, ses expériences désormais, ou encore d’animer sa communauté de snack content.
Vous allez découvrir dans cet article, comment l’intelligence artificielle, le deep learning et la reconnaissance vocale permettent d’automatiser et de traduire des sous-titres vidéos. Parlons-en, ainsi que des opportunités et des gains de cette approche où la machine accélère et remplace la production de l’homme sur des taches répétitves.

(*Source: Digital 2021 – Global overview report by We are social & Hootsuite )

IA et Speech to text Photo florian stegre CEO Checksub

Florian Stègre, CEO de Checksub

J'ai le plaisir de rencontrer Florian Stègre, CEO de Checksub. Il utilise désormais l'intelligence artificielle pour développer des solutions permettant d'automatiser les sous-titres des vidéos. En s'appuyant sur le speech to text, il créé des sous-titres avec une approche innovante. En effet, Checksub génère, grâce à la reconnaissance vocale, un script automatique issu de la vidéo et peux ensuite le traduire automatiquement en 140 langues. Imaginez le gain de temps et les opportunités...

Comment as-tu démarré ton activité sur les sous-titrages vidéos ?

Il y a 4 ans après avoir travaillé dans la production de contenu vidéo, je me suis rendu compte à quel point l’étape du sous-titrage était compliqué. Pour mon premier projet de sous-titrage, j'avais dû y passer la nuit. Après cette expérience, je m’étais promis de ne plus jamais faire de sous-titrage. Mais 6 mois après j’avais de plus en plus de demande, mais aucune solution sur le marché ne répondait à la demande, j’ai donc décidé de la créer.

La complexité du sous-titrage vidéo

Quand on crée une vidéo on a déjà de nombreuses choses à gérer, script, tournage, montage… Mais, souvent on prend du retard sur leur planning de diffusion et quand on arrive à l’étape de sous-titrage c’est la très mauvaise surprise. En effet, on doit y passer un temps hallucinant. Et il faut retaper tout le texte, le synchroniser, prendre en main le logiciel de sous-titrage, gérer l’incrustation de sous-titres etc… 

Checksub simplifie tout le process ! Vous importez la vidéo. On génère un sous-titrage automatique facile à corriger. Vous exporter un fichier de sous-titres (SRT, VTT,...) ou la vidéo avec les sous-titres. 

Florian Stègre CEO Checksub Tweet

L’avantage, c’est que vous évitez de repasser par une étape de montage et d’exportation. Et quand vous n’avez pas le temps vous pouvez aussi confier votre projet à un réseau de sous-titreur professionnel. Dans ce cas vous avez un projet clé en main et aucune relecture n’est nécessaire.

Checksub ne mise pas uniquement sur la technologie de reconnaissance vocale, mais on croit aussi que les sous-titreurs et traducteurs ont encore un rôle central à jouer.

Florian Stègre CEO Checksub Tweet

D’ailleurs, c’est eux qui vont corriger et perfectionner le résultat de notre outil, notamment en matière de traduction dans de nombreuses langues. C’est pourquoi, notre application a pour ambition de faire le lien entre ces technologies. On veut ainsi apporter à nos clients l’assurance de sous-titre crée en un temps record avec une qualité professionnelle.

Qu'est-ce que le Speech to text OU Voice transcription et pourquoi c'est important pour les marketeurs ?

Le speech to text ou la voice transcription sont du domaine de la reconnaissance vocale. Il s’agit de la capacité à retranscrire avec exactitude les paroles sous la forme de texte. Puisqu’elle permet facilement de convertir de l’audio en texte, le marketeur peut en tirer plusieurs bénéfices.

Augmenter le reach de ses vidéos

Le premier usage des marketeurs que nous pouvons constater sur Checksub et la création de sous-titrage pour ses contenus vidéos. C’est un usage qui a explosé sur les derniers mois avec l’augmentation du nombre de vidéos créés sur internet. Il y a un énorme bénéfice sur les réseaux sociaux comme Facebook. En effet, la majorité des études révèlent que les internautes regardent majoritairement les contenus sans le son. Cela représente entre 75% et 90% des vues sur Facebook. Avec des sous-titres ils peuvent consulter votre vidéo même s’ils n’ont pas le son. Et s’il le souhaite ils peuvent activer le son dans un second temps. De plus, les sous-titres améliorent aussi la mémorisation du message. Il faut savoir qu’environs 60% de la population a une mémoire visuelle contre 30% une mémoire auditive. Quand on est un marketeur, c'est important que son message soit mémorisé. en outre, le sous-titrage de ses contenus booste également le référencement naturel des pages. Pour cela, il est nécessaire d’inclure ses transcriptions sur son site internet ou en utilisant un fichier de sous-titres comme le format SRT dans son player vidéo. Ce type de format est pris en compte par Google pour l’indexation de la page.

Adapter des contenus existants

Pour tous les marketeurs, le contenu est devenu essentiel dans sa stratégie. Mais cela à un coût et les options permettant de réutiliser du contenu déjà crée est d’autant plus pertinent. Par exemple en retranscrivant ces contenus vidéos, ces interviews ou ces podcasts, il peut augmenter son reach avec un minimum d’effort. Un des cas d’usage de nos clients est de transformer leurs vidéos ou leurs podcasts en articles de blog grâce à la transcription automatique :

Comment le Speech to text fonctionne-t-il ?

Les technologies speech-to-text ont fait d’énorme progrès ces dernières années. Elles ont profité de nombreuses améliorations liées au deep learning.

0 %
d'exactitude dans la reconnaissance audio ou vidéo

Les algorithmes sont désormais capables de reconnaître avec une exactitude proche de plus de 90% les mots et expressions d’un extrait audio ou vidéo. Certes, cette technologie n’est pas encore parfaite (surtout par rapport à des mots rares ou dans un environnement bruyant). Mais elle permet d’accélérer le processus de sous-titrage. Ce travail qui a toujours été réservé à des professionnels de la transcription et de la traduction, se voit ainsi révolutionné.

Des solutions de sous-titrage automatique par exemple font gagner beaucoup de temps à une tâche traditionnellement longue et exigeante.

Checksub par exemple transcrit et synchronise la vidéo et ensuite vous avez même le choix de la traduire vers 120 langues. Tout cela peut se faire en quelques minutes.

Florian Stègre CEO Checksub Tweet

Pour un résultat parfait il est parfois nécessaire que l’humain puisse travailler avec la machine et son apprentissage profond. Sur Checksub l’éditeur de sous-titres permet de facilement relire et corriger le travail réalisé par la machine.

Quels sont les potentiels du Speech to text au niveau mondial ?

La transcription automatique facilite la mise en place d’une stratégie de localisation de ses contenus. Sachant que seulement 3% des internautes sont francophones et 25,9% anglophones, il serait bête de limiter son audience.

"Parole à texte" cad Speech to text : traduire ses contenus en anglais

  • Le premier conseil serait de traduire ses contenus en anglais, mais aussi dans d’autres langues comme l’espagnol. Checksub permet de traduire automatiquement ses vidéos une fois que la version originale est créée.

Etendre le champs d'application

  • La technologie Speech to text a déjà trouvé de nombreuses applications en termes de business : que ce soit les assistants vocaux (Alexa, Siri, …), la recherche vocale sur Google, l’aide aux malentendants ou encore l’Internet-of-Things. D’une manière générale de nombreuses entreprises ont déjà investi dans ces solutions pour améliorer l’expérience utilisateur. Pour ce qui est du sous-titrage automatique et de la transcription, le marché connait une progression constante. Ceci est dû notamment à l’explosion des contenus vidéos sur internet. en effet, les utilisateurs sont de plus en plus friands de vidéos pour s’instruire, se divertir et se rassembler en communauté. Pour les entreprises, ces types de contenus leur permettent de créer un lien plus fort avec les consommateurs. Mais aussi, de forger une voix plus authentique et humaine sur les réseaux sociaux, tout en rentabilisant leurs campagnes vidéos publicitaires.

Penser aux contenus internes

  • Mais il y a aussi une tendance de fonds sur les contenus internes avec une forte progression des formations en ligne et des webinars avec le contexte du Covid. Dès lors, avec le sous-titrage automatique, ces contenus sont à la portée de l’ensemble de ses collaborateurs ou de ses partenaires. Cela permet d’aller au-delà de la barrière de la langue et des handicaps (notamment pour les sourds et malentendants). Les sous-titres permettent donc de rendre l’internet encore plus inclusif, et de connecter des cultures et des communautés éloignées les unes des autres.

Quels sont tes prochains challenges ?

Construire une entreprise mondiale depuis le sud de la France ! Depuis le premier jour, nous sommes une entreprise organisée en “Remote”. Aujourd’hui l’équipe est située dans 5 pays différents. Nous voulons nous imposer comme la référence du sous-titrage automatique dans le monde.

La technologie speech to text progresse sans cesse. Mais on a l’avantage de maitriser ces technologies depuis plusieurs années et de collaborer avec un laboratoire de recherche. On veut pouvoir mettre à jour constamment la précision de notre outil. Nous avons une très forte progression de notre nombre d’utilisateurs et de clients chaque mois. Désormais nous devons stabiliser notre outil et le rendre encore plus productif. Ce ne sont que des problématiques positives et très motivantes que nous devons résoudre. Mais notre priorité reste de satisfaire nos utilisateurs. On passe beaucoup de temps à leur parler et à comprendre leur besoin.

Merci beaucoup Florian pour ces précieux insights sur l'automatisation du sous-titrage vidéo, un vrai plus pour la stratégie de contenu vidéo des marketeurs !! La prochaine fois on enregistre notre discussion puis on la converti texte dans la foulée 😊

Florian Stègre

CEO & Fonder Checksub

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée Champs requis marqués avec *

Poster commentaire