En quête d'une vraie conversation

Publié par Luc JULIA (Docteur, 1995) | N° 198 - L'intelligence artificielle l'âge de l'industrialisation et L'égalité entre les hommes et les femmes

Siri fait aujourd’hui figure de Dinosaure. Exactement 10 ans après son rachat par Apple, il (ou elle ?) l’est. Apple, ou plutôt Steve Jobs, a bien été, une fois de plus, visionnaire et cette acquisition lui a permis de se positionner comme le pionnier de la reconnaissance de la parole même si de multiples équipes travaillaient sur ces problèmes depuis des dizaines d’années, il leur a volé la vedette. Il est vrai qu’utiliser un assistant vocal sur un appareil muni d’un microphone et d’un haut-parleur que l’on avait en permanence sur nous donnait enfin tout son sens à la technologie. Mais malgré près de 500 millions d’utilisateurs enthousiastes en cinq ans, et surtout à cause de la disparition de Jobs, Siri n’a pas pris le tournant technologique qu’il aurait dû prendre et n’est aujourd’hui plus un leader du domaine. Bien sûr il y a toujours des centaines de millions d’utilisateurs réguliers, mais c’est en général pour eux un usage bien particulier, comme dicter un SMS, contrôler de la musique ou dire « Appelle Maman », ce qui est très loin de la vision d’un assistant universel.

Les leaders d’aujourd’hui sont Amazon avec Alexa et Google avec Google Home. Le tournant qu’Apple aurait dû prendre pour rester dans la course est celui du Deep Learning vers 2012 ou 2013. Google, qui avait évidemment sorti un assistant similaire à Siri pour Android dès 2011, a reconnu que cette nouvelle technologie allait améliorer les performances de reconnaissance et de compréhension et l’a très vite adoptée. Amazon, en tant que tout nouveau venu, l’a utilisé dès ses débuts en 2014. Microsoft a lui aussi eu l’opportunité de venir chambouler le trio de tête avec la sortie de Cortana en 2015, mais, certainement par manque de plateformes hardware pour le supporter, cet assistant a été plus ou moins abandonné à la façon de Microsoft en 2019.

Le Deep Learning n’intervient pas vraiment au niveau du traitement du signal, de la reconnaissance des sons, mais au niveau de ce qu’on appelle le NLP, Natural language Processing. C’est l’étape, une fois les phonèmes et les mots plus ou moins bien reconnus, qui permet à l’assistant de comprendre le sens de la phrase, et d’effectuer la tâche correspondante. Par des méthodes de backtracking le NLP permettra aussi d’aller corriger les mots qui avaient été faussement reconnus, mais intéresserons-nous plutôt aux techniques de Deep Learning. Force est de constater que les leaders évoqués sont aussi certainement ceux qui collectent une des plus grandes quantités de texte au travers des nombreuses interactions que leurs sites, le moteur de recherche ou le magasin en ligne, génèrent. Et c’est bien là le nerf de la guerre, les données. En gros les méthodes utilisées sont statistiques et le système va déterminer si la suite de mots détectés correspond à une forme de phrase présente dans le modèle créé grâce à cette immense quantité de données.

Ces systèmes reconnaissent donc maintenant assez bien une phrase et son sens, peut-être même mieux que ce qu’un humain ne ferait, mais sont encore loin de pouvoir soutenir la logique et le contexte d’une conversation. Le prochain défi sera de développer ces assistants conversationnels qui n’en sont encore qu’à leurs balbutiements.

À l’autre bout de la chaîne, il y a le TTS, Text to Speech ou synthèse vocale. Elle est en fait née dans les Bell Labs avec Voder en 1936, une quinzaine d’années avant les premiers reconnaisseurs de parole. Après tout, générer semble beaucoup plus simple que comprendre : les mots français ne sont-ils pas que l’assemblage des 36 phonèmes qui composent notre langue ? Eh bien non.

Pour éviter une production hachée, la façon dont nous prononçons ces phonèmes dépend des phonèmes qui l’entourent. La synthèse devient un problème combinatoire beaucoup plus complexe qu’il n’y paraît. Nous avons tous entendu ces voix d’une platitude métallique, très énervantes à écouter qu’on imagine mal pouvoir supporter plus de quelques secondes. C’était le vieux monde… Là encore, le Deep Learning permet de s’attaquer à ces problèmes combinatoires, et par la collecte d’immenses bases de données de voix de générer du TTS plus agréable comme on l’entend avec Alexa ou Google Home.

Plus agréables, mais toujours très imparfaites. Il faut encore améliorer la prosodie et donner la possibilité aux systèmes d’épeler « SOS » au lieu de dire « sauce ». Il faudrait aussi pouvoir modéliser certaines subtilités comme utiliser une voix beaucoup plus enjouée lorsque qu’elle délivre des informations sportives que celle qui parlerait d’une guerre par exemple. Mais si un système réussit à repérer qu’il parle de sport et qu’il annonce de sa voix pleine de joie la défaite de son équipe préférée, il y a de forte chance que l’auditeur en soit fort irrité… Le plus gros problème est que ces machines n’ont encore aucune idée de ce qu’elles racontent, et à qui elles le racontent…

Luc JULIA (1995)

En tant que Directeur Technique et Innovation à Samsung, Dr. Luc JULIA a défini et conduit la stratégie du groupe pour l’IoT. Il se consacre maintenant à rendre ces objets intelligents.

Luc a dirigé Siri à Apple, a été Directeur Technique à HP et a cofondé plusieurs start-up dans la Silicon Valley dont ORB Networks où il a inventé le « place shifting ».

Il a débuté sa carrière au SRI International ou il a fondé le « Computer Human Interaction Center » et a participé à la création de « Nuance Communications » aujourd’hui leader mondial de la reconnaissance de la parole.

Luc est diplômé en Mathématiques et Informatique de l’Université Pierre et Marie Curie de Paris et a obtenu un Doctorat à Télécom Paris. Il est aujourd’hui membre de l’Académie Française des Technologies.

Il est l’auteur du best-seller « L’Intelligence Artificielle n’existe pas », titulaire de plusieurs dizaines de brevets et reconnu comme l’un des 100 développeurs français les plus influents du monde numérique.

Auteur

Luc JULIA (Docteur, 1995)

Docteur ENST Voir les 2 Voir les autres publications de l’auteur(trice)

Article précédent Article suivant

Retour au numéro

Articles du numéro

Lire la suite

- Editorial L'intelligence artificielle
Editorial L'intelligence artificielle Fin 2017, un premier dossier sur l’Intelligence Artificielle avait été publié dans cette revue....
28 octobre 2020
Lire la suite >
Lire la suite

- Impact AI et l'Observatoire de la Notoriété et de l'Image de l'Intelligence Artificielle en France
Impact AI et l'Observatoire de la Notoriété et de l'Image de... Le collectif Impact AI publie chaque année l’Observatoire de la Notoriété et de l’Image de...
28 octobre 2020
Lire la suite >
Lire la suite

- Le machine learning est-il réellement incapable de modéliser le monde physique ?
Le machine learning est-il réellement incapable de modéliser... Dans cette revue, nous souhaitions aussi parler des limitations de l’IA lorsqu’on la met en...
28 octobre 2020
Lire la suite >
Lire la suite

- Un enfant de cinq ans saurait faire ça, mais pas l'IA ?
Un enfant de cinq ans saurait faire ça, mais pas l'IA ? L’intelligence numérique va-t-elle finir par s’approcher de l’intelligence humaine ? Non, et loin...
28 octobre 2020
Lire la suite >
Lire la suite

- Culture data, data management et technologies : pour aller au-delà des prototypes chez Total
Culture data, data management et technologies : pour aller... Total accélère sa transformation digitale avec la création de la « Total Digital Factory », une...
28 octobre 2020
Lire la suite >
Lire la suite

- Intelligence artificielle Bienvenue dans la jungle !
Intelligence artificielle Bienvenue dans la jungle ! L’intelligence artificielle (ou IA pour les intimes) a connu une singulière remontée en force ces...
28 octobre 2020
Lire la suite >
Lire la suite

- Le numérique des bureaux des temps pour une mobilité urbaine plus saine et moins contraignante
Le numérique des bureaux des temps pour une mobilité urbaine... Les frontières entre vie de famille, vie sociale et vie professionnelle étaient jusqu’à aujourd’hui...
28 octobre 2020
Lire la suite >
Lire la suite

- Les robots parlent notre langue
Les robots parlent notre langue Les algorithmes d’intelligence artificielle font des progrès rapides sur des tâches considérées,...
28 octobre 2020
Lire la suite >
Lire la suite

- Les médecins survivront-ils à l'intelligence artificielle ?
Les médecins survivront-ils à l'intelligence artificielle ? L’intelligence artificielle fascine d’autant plus que personne ou presque n’est capable de la...
28 octobre 2020
Lire la suite >
Lire la suite

- Retour vers le futur : Il y a 35 ans, la Revue Telecom et l'intelligence artificielle
Retour vers le futur : Il y a 35 ans, la Revue Telecom et...
28 octobre 2020
Lire la suite >
Lire la suite

- AI evolves to enable human decisions, not just workflows
AI evolves to enable human decisions, not just workflows Since the days of Techne, man’s highest aspiration has been to leverage his ingenuity to transform...
28 octobre 2020
Lire la suite >
Lire la suite

- Qu'attendre de l'Intelligence Artificielle, en temps de crise et après ?
Qu'attendre de l'Intelligence Artificielle, en temps de... L ’IA va-t-elle ici ‘changer la donne’ dans la découverte d’un vaccin contre la Covid-19 ?Comme dans...
28 octobre 2020
Lire la suite >
Lire la suite

- Editorial Égalité entre les femmes et les hommes
Editorial Égalité entre les femmes et les hommes Une petite impression de déjà vu dans ce titre, non ? N’a-t-on pas l’impression, au sein des...
28 octobre 2020
Lire la suite >
Lire la suite

- Réflexion sur les fondements historique et philosophique des inégalités entre les femmes et les hommes
Réflexion sur les fondements historique et philosophique des... Si l’égalité est un principe au sens des droits fondamentaux et universels, elle constitue...
28 octobre 2020
Lire la suite >
Lire la suite

- L'exclusion des femmes des métiers de l'informatique, un processus historique
L'exclusion des femmes des métiers de l'informatique, un... Aujourd’hui, le pourcentage de femmes en études d’informatique est bien maigre. Il est facile...
28 octobre 2020
Lire la suite >
Lire la suite

- Masculinité et inégalités femmes-hommes
Masculinité et inégalités femmes-hommes Pas d’égalité femmes-hommes sans remise en cause de la masculinité. Mais suffit-il de prôner une «...
28 octobre 2020
Lire la suite >
Lire la suite

- Crise économique et inégalité entre les sexes
Crise économique et inégalité entre les sexes Les inégalités professionnelles sont structurelles, la division sexuée du travail en est la cause....
28 octobre 2020
Lire la suite >
Lire la suite

- LES STEM comme clé du succès pour un accès égal aux métiers du futur
LES STEM comme clé du succès pour un accès égal aux métiers... Aujourd’hui le monde est en train de vivre de profonds changements et tout se modifie très...
28 octobre 2020
Lire la suite >
Lire la suite

- Les convictions et la politique de l'oréal en faveur de l'égalité femmes-hommes
Les convictions et la politique de l'oréal en faveur de... La diversité et l’inclusion font partie du socle de valeurs sur lesquelles s’est bâti L’Oréal. Tout...
28 octobre 2020
Lire la suite >
Lire la suite

- ANITI l'institut interdisciplinaire d'Intelligence Artificielle de Toulouse se dote d’une commission mixité
ANITI l'institut interdisciplinaire d'Intelligence... Pour construire une IA éthique, une des clefs est de lutter contre les stéréotypes, quels qu’ils...
28 octobre 2020
Lire la suite >

Partagez :

Connexion

Auteur

Articles du numéro