Vous pouvez écouter notre podcast en cliquant sur le bouton ci-dessous, ou via votre lecteur de podcast préféré.
Mais quelles sont les limites du callbot aujourd’hui ? Le Callbot rassemble des innovations technologiques de taille (STT/TTS, IA, interfaçage avec le Système d’Information et les Telecom de l’entreprise…). Pour autant, il est bon de connaître ses limites, dont on a du mal à se départir aujourd’hui. Voici quelques exemples…
Des difficultés avec les noms propres existent.
Le système de translation de la voix vers le texte sont devenus très performants, mais ils ont aussi leur limite. La plus importante réside dans la compréhension des noms propres.
Les noms de famille sont souvent mal interprétés.
Les noms de famille sont plus ou moins compris. Tant que, dans une langue donnée, le nom de famille fait référence à un nom commun, comme par exemple un nom de métier (Charpentier, Boulanger,…), la conversion du prénom, de la voix vers le texte, est parfaite. Des corrections peuvent être cependant malencontreuses (Carpentier devient Charpentier).
Si le nom de famille est exotique, notamment d’origine étrangère, la plupart des outils STT du marché vont chercher à corriger le nom, en s’appuyant sur un corpus lexicologique inapproprié. Si le nom de famille est composé, il y a de forte chance qu’il ne soit pas compris.
Comment corriger ce problème ? La parade consiste à apprendre à l’intelligence artificielle à distinguer le nom propre du nom commun. On s’appuiera soit sur une analyse syntaxique grammaticale, mais comme il faut le faire pour chaque phrase, ce système, en-soi assez sûr, n’est pas utilisé pour ne pas ralentir le traitement des données. Soit on apprendra à l’IA à reconnaître l’emplacement potentiel d’un nom propre dans des phrases d’exemple (ce que l’on appelle la reconnaissance d’entités nommées). Une fois le nom propre tagué, il est possible de connecter le robot à un annuaire d’entreprise (via un protocole de type LDAP) et de comparer le résultat.
Les prénoms, de plus en plus complexes
Les prénoms sont également problématiques. Si au Moyen-Âge une dizaine de prénoms suffisait à désigner les personnes. La société humaine a rapidement eu besoin d’y associer des noms dits de famille pour distinguer tous les Paul du village. D’où Paul Boulanger, Paul Dupont,…
Aujourd’hui, les personnes sont « ultra distinguées » par des choix de prénoms sophistiqués, rares et de surcroît aux orthographes flottantes.
Pour les systèmes de conversion de la voix au texte, il est difficile de savoir si Timothée s’écrit traditionnellement, ou Timoté, Thimothé, Tymoté,…
La solution consiste aussi à traiter le prénom comme une entité nommée. Reste à la distinguer du nom de famille, ce qui rend plus complexe les règles de recherche dans l’annuaire d’entreprise.
Noms de lieux : un univers étrange pour le callbot !
La toponymie pose aussi problème.
D’abord, il y a la même difficulté que pour les noms de famille ou les prénoms. Cela peut se résoudre en comparant le toponyme prononcé avec la liste des communes (potentiellement du monde entier).
Ensuite, il y a les ambiguïtés liées à l’expression orale. Ainsi, « j’habite Saint-Maur » peut se comprendre tel quel, ou bien il faudra savoir si le locuteur parle de Saint-Maur ou Saint-Maur des Fossés ou Saint-Maur-des-Bois ou Saint-Maur-sur-le-Loir. Ensuite, il faudra savoir si le locuteur désigne Saint-Maur dans le Cher, le Gers, l’Indre, le Jura, l’Oise. Autant de possibilités qui impliquent des scénarios dialogiques sophistiqués.
Accents et articulations altèrent le signal
Selon son origine, le locuteur peut parler un accent plus ou moins prononcé. Il y a non seulement les accents régionaux, mais aussi étrangers.
Au-delà des accents, il y a la capacité articulatoire de la personne. Selon son niveau social, ses habitudes familiales, ses handicaps, son état émotionnel, la capacité articulatoire de l’auditeur peut être grandement altérée. En réalité, le parler est à ce niveau idiosynchrasique.
Ces deux limites constituent un véritable challenge pour les convertisseurs de voix, car les situations rencontrées sont presque infinies. Il n’existe pas pour l’heure de parade réelle. La seule solution consiste à s’appuyer sur des systèmes très entrainés. C’est la raison pour laquelle les systèmes STT de Google, Amazon ou encore Apple ont des années-lumière d’avance : en implémentant leur système au sein des téléphone, ils accumulent une expérience colossale en ce domaine.
Les niveaux de langue : de l’automobile à la bagnole
Ajoutons également que le niveau socio-éducatif de l’interlocuteur provoque des variations importantes de pratique de la langue.
Au niveau syntaxique, c’est-à-dire de l’ordre des mots pour construire la phrase, peut grandement compliquer l’interprétation de l’IA.
Au niveau paradigmatique, c’est-à-dire du choix des mots, les surprises peuvent être de taille. L’oral peut être plus relâché que l’écrit. Ainsi, un véhicule peut rapidement devenir une Renault puis une bagnole…
Les niveaux de langue sont aussi pris en compte quand on crée un chatbot, purement textuel, mais le callbot implique de considérer l’expression orale, avec sa complexité propre.
La qualité de la ligne
Enfin, la qualité technique de la communication est fondamentale. Le signal peut être altéré : friture télécom, instabilité du débit numérique, mauvaise tenue de l’appareil, ou encore bruits ambiants (travaux publics, réseaux routiers proches, bruits de foule…).
Ces problèmes peut provoquer des artéfacts qui vont introduire dans le signal de la parole des bruits parasites. Le convertisseur STT reçoit un signal complexe et parasité.
Le bas débit numérique peut aussi provoquer des ralentissements dans le traitement du flux vocal.
Il est donc crucial d’installer le Callbot sur une infrastructure capable de résister à tous ces aléas techniques.
En conclusion, le callbot est une technologique opérationnelle mais dont il faut prendre en compte toutes les spécificités.
Faire un callbot n’est pas faire un chatbot, encore moins un serveur vocal interactif. Il vous faudra donc bien prendre en compte toutes ses limites pour bénéficier de toutes ses qualités.