Le pouvoir médiatique de l’oxymore « IA », Intelligence Artificielle, entraîne une cohorte de fantasmes et d’idées fausses. Il convient pourtant de prendre l’ensemble au sérieux et d’en comprendre quelques réalités pour faire des choix de société en connaissance de cause.
(Ilustration : Fille née sans mere 1916-18 – Francis Picabia )
Dans notre quotidien, nous côtoyons principalement deux branches de l’IA ou Intelligence Artificielle.
La première est l’apprentissage profond (de l’anglais deep learning, ou machine learning). Il permet à un ordinateur de produire une information non plus « à la papa », à partir d’une séquence d’instructions qu’on lui a programmée, mais par une « prise d’habitudes ».
Imaginons qu’on introduise dans un tel système, quotidiennement et pendant de nombreux jours, un ensemble de données comme l’ensoleillement de la veille, l’humidité de la veille, le vent de la veille, la température de la veille et le temps qu’il fait aujourd’hui. Après avoir fourni un grand nombre d’exemples au système – la « phase d’apprentissage» – il va arriver un moment où en ne lui fournissant que les données du jour,il va estimer la météo du lendemain avec une fiabilité acceptable.
Apprentissage ou habitude ?
Cette approche par classification est extrêmement efficace pour reconnaître des chats sur des photos, anticiper une panne mécanique sur une voiture ou savoir si un produit en bout de chaîne de fabrication est conforme ou pas.
On peut raisonnablement penser qu’elle sera vite très efficace aussi pour anticiper des maladies. Ou offrir d’autres avantages, qu’on ne détaillera pas ici.
Le principe du deep learning, c’est donc d’utiliser les« habitudes », le passé pour anticiper l’avenir. Untel système est donc par nature conformiste. Et totalement incapable de prévoir un événement qui n’est pas dans la continuité de ceux qui se sont déjà passés. En tout cas pas plus que votre voyante préférée.
Les assistants vocaux sont sur-vendus
La seconde branche principale de l’IA concerne l’interaction entre l’homme et la machine, et en particulier le traitement du langage naturel. Pour une machine,pouvoir répondre à une question posée par un homme demande trois étapes :entendre ce que l’utilisateur a dit, comprendre le sens de sa demande et répondre à son attente.
C’est en utilisant le deep learning que les géants de l’internet ( Google, Facebook, Microsoft, IBM, Apple, Amazon,…) ont récemment fait d’énormes progrès sur la première étape. En entraînant leurs algorithmes avec les demandes que nous formulons tous à leurs systèmes, ces derniers ont acquis une efficacité comparable à celle des humains.
Et ensuite… Le système va-t-il être en mesure de « donner du sens » à ce que dit l’utilisateur ? Là les choses se gâtent : les systèmes actuels sont très peu en mesure de comprendre ce qu’on leur dit.
Beaucoup moins que poussent à le croire les exemples donnés par ceux qui commercialisent les assistants vocaux actuels comme l’Echo d’Amazon ou le Google Home.
Parce que là non plus, comparaison n’est pas raison.
Si je demande à la machine « Apporte moi une baguette de pain», elle va être incapable de « deviner » une réponse satisfaisant ma demande,parce qu’incapable d’effectuer une action qu’on ne lui a pas apprise, comme passer une commande à mon boulanger pour que mon pain me soit livré.
Cette limitation est due au fait que cette dernière demande ne peut pas être simplement associée à une information. Elle doit induire l’exécution d’une suite d’actions (la troisième étape).
Et quand cela est possible, comme pour envoyer un SMS par exemple, c’est parce qu’un humain a associé la demande à une fonction que le téléphone peut réaliser. De telles fonctions ne sont pas, à ce jour, « inventées »par les machines mais programmées « à la main », par des humains rares, chers et difficiles à gérer.
Les machines ne sont pas (encore) capables d’apprendre toutes seules à faire des choses
Ne nous leurrons donc pas : dans l’état actuel de la technologie, la très grande majorité des actions réalisées par les assistants vocaux ne sont donc pas inventées par les machines mais programmées spécifiquement par des informaticiens.
Prétendre que les machines sont en mesure, grâce à l’IA,d’apprendre toutes seules à faire des choses est à ce jour une supercherie. Comme l’est prétendre que les machines peuvent anticiper une situation qui n’a jamais été rencontrée.
Convenons que la loi des grands nombres et la numérisation de l’ensemble des activités humaines permet de faire de la classification avec une grande efficacité.Convenons que cela va bouleverser fortement notre quotidien.
Convenons que l’écart entre classer de l’information et la comprendre est (encore) de taille. Et convenons que de la façon dont nous gérerons la réduction de cet écart dépendra la société vers laquelle nous nous dirigeons.
Franck Lefèvre, Décembre 2018
Cet article a initialement été publié dans « Le Journal de la Voix« .