Comment les robots apprennent à lire et à penser

Qu'est-ce que cela signifie pour un robot de pouvoir lire et comprendre du texte? Et plus important encore, comment est-ce possible pour un robot de faire cela?

Nous parlons tout le temps des ordinateurs qui nous comprennent. Nous disons que Google "savait" ce que nous cherchions, ou que Cortana "comprenait" ce que nous disions, mais "comprendre" est un concept très difficile. Surtout quand il s'agit d'ordinateurs.

Un domaine de la linguistique computationnelle, appelé traitement du langage naturel (NLP), travaille sur ce problème particulièrement difficile. C'est un domaine fascinant en ce moment, et une fois que vous avez une idée de comment cela fonctionne, vous allez commencer à voir ses effets partout.

Une note rapide: Cet article a quelques exemples d'un ordinateur répondant à la parole, comme quand vous demandez à Siri quelque chose. La transformation de la parole audible en un format compréhensible par l'ordinateur s'appelle la reconnaissance de la parole. La PNL n'est pas concernée par cela (au moins dans la capacité dont nous discutons ici). La PNL ne joue que lorsque le texte est prêt. Les deux processus sont nécessaires pour de nombreuses applications, mais ils sont deux problèmes très différents.

Définition de la compréhension

Avant d'aborder la façon dont les ordinateurs traitent le langage naturel, nous devons définir quelques éléments.

Tout d'abord, nous devons définir le langage naturel. C'est facile: chaque langue utilisée régulièrement par les gens tombe dans cette catégorie. Il n'inclut pas les choses comme les langues construites (Klingon, Esperanto) ou les langages de programmation informatique. Vous utilisez un langage naturel lorsque vous parlez à vos amis. Vous l'utilisez aussi probablement pour parler à votre assistant personnel numérique.

Alors, que voulons-nous dire quand nous disons comprendre? Eh bien, c'est complexe. Qu'est-ce que cela signifie de comprendre une phrase? Peut-être que vous diriez que cela signifie que vous avez maintenant le contenu prévu du message dans votre cerveau. Comprendre un concept pourrait signifier que vous pouvez appliquer ce concept à d'autres pensées.

Les définitions du dictionnaire sont nébuleuses. Il n'y a pas de réponse intuitive. Les philosophes ont discuté de choses comme ça pendant des siècles.

comprendre le dictionnaire de définition

Pour nos objectifs, nous allons dire que la compréhension est la capacité d'extraire avec précision le sens du langage naturel . Pour qu'un ordinateur comprenne, il doit traiter avec précision un flux entrant de discours, convertir ce flux en unités de sens, et être capable de répondre à l'entrée avec quelque chose qui est utile.

Évidemment, tout cela est très vague. Mais c'est le meilleur que nous pouvons faire avec un espace limité (et sans un degré de neurophilosophie). Si un ordinateur peut offrir une réponse humaine, ou du moins utile, à un flux de données en langage naturel, nous pouvons dire qu'il comprend. C'est la définition que nous utiliserons à l'avenir.

Un problème complexe

Le langage naturel est très difficile à gérer pour un ordinateur. Vous pourriez dire, "Siri, donnez-moi des instructions pour Punch Pizza, " alors que je pourrais dire, "Siri, Punch Pizza route, s'il vous plaît."

Dans votre déclaration, Siri pourrait choisir la phrase clé «donnez-moi des instructions», puis exécuter une commande liée au terme de recherche «Punch Pizza». Dans le mien, cependant, Siri doit choisir «route» comme mot clé et savoir que Punch Pizza "est où je veux aller, pas" s'il vous plaît. "Et ce n'est qu'un exemple simpliste.

Siri pizza commande

Pensez à une intelligence artificielle qui lit les courriels et décide s'ils peuvent ou non être des escroqueries. Ou celui qui surveille les messages des médias sociaux pour mesurer l'intérêt pour une entreprise en particulier. Une fois, j'ai travaillé sur un projet où nous devions apprendre à un ordinateur à lire des notes médicales (qui ont toutes sortes de conventions étranges) et glaner des informations de leur part.

Cela signifie que le système devait être capable de traiter les abréviations, la syntaxe étrange, les fautes d'orthographe occasionnelles, et une grande variété d'autres différences dans les notes. C'est une tâche très complexe qui peut être difficile même pour les humains expérimentés, et encore moins pour les machines.

Définir un exemple

Dans ce projet particulier, je faisais partie de l'équipe qui enseignait l'ordinateur pour reconnaître des mots spécifiques et les relations entre les mots. La première étape du processus consistait à montrer à l'ordinateur l'information contenue dans chaque note, de sorte que nous avons annoté les notes.

Il y avait un grand nombre de différentes catégories d'entités et de relations. Prenez la phrase "Ms. Le mal de tête de Green a été traité avec de l'ibuprofène, "par exemple. Mme Green a été étiquetée comme une PERSONNE, un mal de tête a été étiqueté comme SIGNE OU SYMPTÔME, l' ibuprofène a été étiqueté comme MEDICATION. Ensuite, Mme Green a été liée à un mal de tête avec une relation PRESENTS. Enfin, l'ibuprofène était lié à un mal de tête avec une relation TREATS.

annotation de note médicale

Nous avons étiqueté des milliers de notes de cette façon. Nous avons codé les diagnostics, les traitements, les symptômes, les causes sous-jacentes, les comorbidités, les posologies et tout ce que vous pourriez penser de la médecine. D'autres équipes d'annotation ont codé d'autres informations, comme la syntaxe. En fin de compte, nous avions un corpus rempli de notes médicales que l'IA pouvait «lire».

La lecture est tout aussi difficile à définir que la compréhension. L'ordinateur peut facilement voir que l'ibuprofène traite un mal de tête, mais quand il apprend cette information, il est converti en un et des zéros sans signification (pour nous). Il peut certainement rendre des informations qui semblent humaines et utiles, mais cela constitue-t-il une compréhension? Qu'est-ce que l'intelligence artificielle n'est pas ce que l'intelligence artificielle n'est pas Des robots intelligents et sensibles vont-ils conquérir le monde? Pas aujourd'hui - et peut-être jamais. Lire la suite ? Encore une fois, c'est en grande partie une question philosophique.

L'apprentissage réel

À ce stade, l'ordinateur a parcouru les notes et appliqué un certain nombre d'algorithmes d'apprentissage automatique. 4 Algorithmes d'apprentissage automatique qui façonnent votre vie 4 Algorithmes d'apprentissage automatique qui façonnent votre vie Vous ne le réalisez peut-être pas. il peut exercer un degré surprenant d'influence sur votre vie. Ne me crois pas? Vous pourriez être surpris. Lire la suite . Les programmeurs ont développé différentes routines pour marquer les parties du discours, analyser les dépendances et les circonscriptions et étiqueter les rôles sémantiques. En substance, l'IA apprenait à "lire" les notes.

Les chercheurs pourraient éventuellement le tester en lui donnant une note médicale et en lui demandant d'étiqueter chaque entité et chaque relation. Lorsque l'ordinateur reproduit fidèlement des annotations humaines, on peut dire qu'il a appris à lire lesdites notes médicales.

Après cela, il s'agissait simplement de rassembler une énorme quantité de statistiques sur ce qu'il avait lu: quels médicaments sont utilisés pour traiter quels troubles, quels traitements sont les plus efficaces, les causes sous-jacentes de certains ensembles de symptômes, et ainsi de suite. À la fin du processus, l'IA serait en mesure de répondre aux questions médicales basées sur des preuves de notes médicales réelles. Il ne doit pas dépendre de manuels, de sociétés pharmaceutiques ou d'intuition.

L'apprentissage en profondeur

Regardons un autre exemple. Le réseau de neurones DeepMind de Google apprend à lire des articles de presse. Comme l'AI biomédicale ci-dessus, les chercheurs voulaient que l'information pertinente et utile soit tirée de textes plus volumineux.

Entraîner une IA sur des informations médicales était assez difficile, vous pouvez donc imaginer combien de données annotées vous auriez besoin pour faire une IA capable de lire des articles d'actualité générale. Embaucher suffisamment d'annotateurs et passer suffisamment d'informations serait trop coûteux et trop long.

L'équipe DeepMind s'est donc tournée vers une autre source: les sites d'informations. Plus précisément, CNN et le Daily Mail.

Pourquoi ces sites? Parce qu'ils fournissent des résumés pointus de leurs articles qui ne tirent pas simplement des phrases de l'article lui-même. Cela signifie que l'IA a quelque chose à apprendre. Les chercheurs ont essentiellement dit à l'IA: «Voici un article et voici l'information la plus importante.» Ensuite, ils lui ont demandé de tirer le même type d'information d'un article sans les points culminants à puces.

Ce niveau de complexité peut être géré par un réseau neuronal profond, qui est un type particulièrement compliqué de système d'apprentissage automatique. (L'équipe DeepMind fait des choses incroyables sur ce projet.Pour obtenir les détails, consultez cet excellent aperçu de la revue technologique du MIT.)

Que peut faire une lecture AI?

Nous avons maintenant une compréhension générale de la façon dont les ordinateurs apprennent à lire. Vous prenez une grande quantité de texte, dites à l'ordinateur ce qui est important et appliquez des algorithmes d'apprentissage automatique. Mais que pouvons-nous faire avec une IA qui tire des informations du texte?

Nous savons déjà que vous pouvez extraire des informations spécifiques à partir de notes médicales et résumer des articles de presse généraux. Il existe un programme open source appelé PAN qui analyse la poésie en extrayant des thèmes et des images. Les chercheurs utilisent souvent l'apprentissage automatique pour analyser un grand nombre de données sur les médias sociaux, lesquelles sont utilisées par les entreprises pour comprendre les sentiments des utilisateurs, voir de quoi les gens parlent et trouver des modèles utiles pour le marketing.

Les chercheurs ont utilisé l'apprentissage automatique pour comprendre les comportements d'envoi de courriels et les effets de la surcharge des courriels. Les fournisseurs de messagerie peuvent l'utiliser pour filtrer les spams de votre boîte de réception et classer certains messages en priorité. 8 Bots que vous devez ajouter à votre application Facebook Messenger 8 Bots que vous devez ajouter à votre application Facebook Messenger Facebook Messenger est ouvert aux robots de discussion, permettant aux entreprises de fournir un service client, des nouvelles et plus directement à vous via l'application. Voici quelques-uns des meilleurs disponibles. Lire la suite . Partout où il y a du texte, il y a un chercheur qui travaille sur le traitement du langage naturel.

Et comme ce type d'apprentissage automatique s'améliore, les possibilités ne font qu'augmenter. Les ordinateurs sont meilleurs que les humains aux échecs, Go, et les jeux vidéo maintenant. Bientôt, ils peuvent être meilleurs à lire et à apprendre. Est-ce la première étape vers une IA forte? Voici pourquoi les scientifiques pensent que vous devriez être inquiet de l'intelligence artificielle Voici pourquoi les scientifiques pensent que vous devriez être inquiet au sujet de l'intelligence artificielle Pensez-vous que l'intelligence artificielle est dangereuse? L'IA peut-elle poser un risque sérieux pour la race humaine. Ce sont quelques raisons pour lesquelles vous voudrez peut-être être concerné. Lire la suite ? Nous devrons attendre et voir, mais c'est peut-être le cas.

Quels types d'utilisations voyez-vous pour une IA de lecture de texte et d'apprentissage? Quels types d'apprentissage automatique pensez-vous que nous verrons dans un proche avenir? Partagez votre opinion dans les commentaires ci-dessous!

Crédits image: Vasilyev Alexandr / Shutterstock