La
compréhension du
langage
naturel

Cogito comprend le langage naturel car il interprète la signification des concepts contenus dans les textes de la même manière que les humains. Cette capacité quasi-humaine repose sur la « désambiguïsation ».

La désambiguïsation : c’est quoi ?

Notre langage recèle de nombreuses ambiguïtés – le mot « orange », par exemple, peut désigner un fruit, une couleur, un lieu ou une société. Les humains, riches de leur expérience et de leur éducation, sont capables de lever contextuellement les ambiguïtés de sens, mais l’interprétation du langage par une machine constitue un véritable défi.

Cogito lève les ambiguïtés grâce à l’interaction entre son moteur sémantique intégré et son graphe de connaissance. Cette interaction lui permet de prendre en compte le contexte pour évaluer toutes les significations possibles de chaque élément de phrase, et de lever toute incertitude.

Le résultat final du processus de désambiguïsation est une carte cognitive des concepts et entités qui apparaissent dans un texte, et de leurs relations.

Phases du processus de désambiguïsation

Cogito analyse le texte en plusieurs phases successives :

  • Analyse lexicale et grammaticale qui rattache chaque mot à sa classe grammaticale : nom commun, nom propre, verbe, adjectif, article …;
  • Analyse syntaxique qui identifie les groupes de mots (groupes nominaux, groupes verbaux, groupes prépositionnels…), les clauses (constituées par un sujet et un prédicat), et enfin les phrases;
  • Analyse sémantique qui associe les mots à leur signification en s’appuyant sur l’interaction entre le moteur sémantique Cogito et le graphe de connaissance. Après l’analyse lexicale, grammaticale et syntaxique, chaque mot est associé aux concepts auquel il se réfère potentiellement au sein du graphe de connaissances. Le mécanisme de désambiguïsation parcourt alors la liste de ces significations candidates, et retient le meilleur compte du contexte.
Menu