Les agents conversationnels animés – Catherine Pelachaud, Télécom ParisTech

Aujourd’hui l’informatique, demain la robotique, les machines en tout genre font partie intégrante de notre quotidien. Mais entre elles et nous, les utilisateurs, les échanges sont parfois difficiles. Comment communiquer naturellement avec un robot, un ordinateur ou un programme informatique ? C’est le rôle des agents conversationnels animés, véritables interfaces de dialogue entre l’Homme et la machine. Observer nos modes de communication pour les modéliser informatiquement : un domaine de recherche entre sciences cognitives et intelligence artificielle qu’étudie l’IMT. À Télécom ParisTech, Catherine Pelachaud travaille depuis plusieurs années à rendre la machine plus humaine…

Télécharger l’article au format PDF

Quand nous parlons à un interlocuteur, nous utilisons bien souvent sans nous en rendre compte toute une gamme de codes, de l’intonation de la voix aux expressions du visage. Un hochement de tête, un léger sourire, ces petits détails qui pourraient paraître insignifiants permettent en réalité une véritable interaction entre les deux interlocuteurs. « Développer un agent conversationnel animé, c’est modéliser cette communication. Nous cherchons à construire un agent virtuel autonome, capable de communiquer verbalement et non-verbalement », explique la directrice de recherche Catherine Pelachaud.

201210_Pelachaud_enc1

Concrètement, il s’agit bien souvent d’un personnage virtuel de type humanoïde, qui pourra dialoguer avec un utilisateur en reprenant le plus naturellement possible tous les codes de la communication humaine. Alors que ces agents virtuels deviennent de plus en plus réalistes, leurs champs d’applications s’étendent tout autant. Si ces systèmes permettent de rendre un robot plus crédible dans ses échanges avec l’utilisateur ou d’agrémenter un site web d’un agent virtuel autonome capable de dialoguer, ils peuvent nous rendre bien d’autres services. « Par exemple, nous travaillons actuellement sur le projet européen Verve1 destiné aux personnes âgées qui ont peur de sortir de chez elles, peur de la  foule, détaille Catherine Pelachaud. Nous cherchons ici à développer des agents qui pourront communiquer avec le patient dans un environnement virtuel ». Le but :vaincre les angoisses du patient en le confrontant dans un premier temps à un milieu contrôlé, plus rassurant que le monde réel. Autre projet, autre exemple d’application : le projet européen Tardis2 , qui a débuté en 2011 et prendra fin en 2014. Ici, ce sont les jeunes en difficulté sociale qui bénéficieront des recherches menées à Télécom ParisTech.
L’agent conversationnel animé pourra leur servir d’interlocuteur virtuel pour mieux leur apprendre à communiquer et à se présenter, notamment lors d’un entretien d’embauche. L’équipe de Catherine Pelachaud travaille ainsi sur une dizaine de projets, pour la plupart lancés dans le cadre du 7e PCRDT (Programme cadre de Recherche et Développement Technologique de l’Union européenne), allant du serious game à la robotique. Sciences cognitives, modélisation informatique, voire linguistique, ces projets touchent à des domaines de recherche particulièrement variés, si bien qu’il est parfois difficile de mettre cette approche  pluridisciplinaire dans une case bien définie, même pour les principaux intéressés. S’il fallait tout de même trouver un dénominateur commun aux nombreux programmes menés, il porterait le nom de « Greta ».

Greta, les premiers pas

C’est en 1999 que Catherine Pelachaud développe ce premier agent conversationnel animé nommé Greta, au sein du projet MagiCster. « Le but de ce projet européen était de créer un personnage capable de parler de façon crédible, se rappelle la chercheur. Il fallait que les gestes, les expressions du visage et la parole soient cohérents. Cette notion de crédibilité était essentielle, et l’est encore aujourd’hui ».
La première étape consiste donc à analyser le plus finement possible la communication humaine. Un minutieux travail d’observation est alors nécessaire avant même de se pencher sur un ordinateur. « Nous utilisons énormément la littérature en sciences humaines et sociales déjà existante, les modèles théoriques, mais aussi l’analyse de vidéos, reprend Catherine Pelachaud. En Italie, j’ai également beaucoup travaillé avec Isabella Poggi, psycholinguiste à l’université de Rome III, qui s’intéressait aux expressions du visage et aux gestes communicatifs chez l’Homme ». Une fois cette base de données constituée, les chercheurs peuvent alors commencer à créer leur agent virtuel qui mimera ces expressions humaines. En 1999, Greta prenait ainsi forme sous les traits d’un visage féminin. Sur l’écran d’ordinateur, cet avatar était à l’époque incapable de communiquer avec un utilisateur réel, mais pouvait déjà adapter ses expressions du visage en fonction de la teneur de son récit, reproduit avec une voix de synthèse. Le fonctionnement de Greta pouvait donc se résumer en trois phases simples : que dire, comment le montrer et, enfin, réaliser ce comportement.

Quand le corps communique

Très vite, cet agent virtuel devint une véritable base de travail pour tous les projets suivants, permettant d’améliorer toujours plus cette plateforme. Ainsi, dix ans plus tard, au sein de Télécom ParisTech, le projet européen Semaine (achevé fin 2010) donnait naissance à quatre agents virtuels différents, basés sur le système Greta. Chaque agent virtuel doté d’un caractère bien précis — attitude agressive, à l’écoute, pragmatique, etc. — pouvait cette fois communiquer en temps réel avec un utilisateur humain, en totale autonomie. « En réalité, ces agents n’étaient pas capables de comprendre ce que disaient les utilisateurs, explique Catherine Pelachaud. Pour cela, il faudrait reconnaître le vocabulaire et l’interpréter : c’est extrêmement difficile et nous bloquons encore aujourd’hui sur cette partie-là ». Mais alors, comment parler de communication lorsque l’interlocuteur virtuel ne comprend pas un mot de ce qui lui est dit ? L’équipe de Télécom ParisTech a donc pris le parti de se pencher principalement sur le comportement non-verbal. Dans le cas du projet Semaine, une caméra filmait en temps réel l’utilisateur humain pour déceler ses attitudes corporelles et ses  micro-expressions du visage. Les données étaient ainsi transmises directement au système Greta, permettant à l’agent virtuel de réagir en conséquence. Ce dernier piochait alors dans un répertoire de phrases types pour relancer la conversation. Mais surtout, les agents conversationnels animés réagissaient visiblement au discours de leur interlocuteur humain, via des hochements de tête ou de légers sourires. « Cette communication non-verbale est essentielle dans une discussion, souligne Catherine Pelachaud. Si je parle, et que la personne en face de moi n’a absolument aucune réaction, c’est totalement déstabilisant ! » En utilisant ces feedbacks, ou rétroactions, les agents virtuels donnent donc l’illusion d’une communication réelle entre deux interlocuteurs. Une illusion qui ne cesse d’être améliorée au fil des différents projets.

Un domaine en plein essor

Actuellement, Catherine Pelachaud et la quinzaine de chercheurs qui l’entourent à Télécom ParisTech se penchent sur des domaines aussi variés que le rire, les émotions, les interactions sociales, ou encore la synchronisation avec l’interlocuteur. Dans le petit monde de la recherche sur les agents conversationnels animés, l’institut Mines-Télécom se spécialise donc sur le comportement non-verbal, en rendant de plus en plus crédibles les réactions et attitudes des agents virtuels basés sur le système Greta. Si les applications concrètes sont encore rares dans notre quotidien, les progrès sont de plus en plus rapides. Greta est aujourd’hui open source et permet donc à des équipes du monde entier de perfectionner toujours plus les agents conversationnels animés.
Chaque unité de recherche apportant ainsi sa pierre à l’édifice, pourra-t-on un jour s’imaginer discuter naturellement avec un robot ou un personnage virtuel ? « C’est encore très compliqué : cela demande une compréhension de ce que l’agent entend, une interprétation des attitudes, ainsi qu’une mémoire de tout ce qui a été dit. Nous y arriverons sûrement un jour… Mais je ne me risquerai pas à donner de date ! », conclut Catherine Pelachaud. Autrement dit, les droïdes volubiles de science-fiction n’en sont qu’à leurs tout premiers balbutiements : à l’heure actuelle, la machine est encore loin d’égaler les prouesses de la communication.

Dès ses premiers cours d’imagerie à l’université, Catherine Pelachaud se découvre une passion pour ce domaine de recherche si particulier. Un intérêt qui ne s’est toujours pas démenti une vingtaine d’années après. En 1991, elle obtient un doctorat en informatique, à l’université de Pennsylvanie, basée à Philadelphie. Elle effectue sa thèse intitulée  » Communication and Coarticulation in Facial Animation », sous la direction d’un spécialiste de l’animation du corps humain et d’un spécialiste de l’intonation de la voix. Catherine Pelachaud poursuite ses travaux à Philadelphie jusqu’en 1993, puis elle continue de développer différents axes de recherche sur les agents conversationnels animés en travaillant dix ans à l’université de Rome.  Après quelques années d’enseignements à Paris, elle devient, en 2008, directrice de recherche sein du LTCI (Laboratoire Traitement et Communication de l’Information), l’unité mixte de recherche du CNRS et de Télécom ParisTech.

1 Personalised Virtual Reality Scenarios for Groups at Risk of Social Exclusion http://www.verveconsortium.eu
2 Training young Adult’s Regulation of emotions and Development of social Interaction Skills http://tardis.lip6.fr

2 réponses

Trackbacks (rétroliens) & Pingbacks

  1. […] Lire l’article intégral sur le site Internet de l’IMT. […]

Les commentaires sont fermés.