Mon compte Twitter développeur a été accepté pour mes deux comptes : @cheznadia et @nadiaserairobo. J’en suis donc à déployer mon petit dispositif d’interaction automatisé constitué avec mes données. Un double numérique quoi. On dit parfois robot conversationnel, mais il faut définir ce que peut être un robot. Allons donc voir du côté du CNTRL :
Le Centre national de ressources textuelles et lexicales (CNRTL), se fondant sur des auteurs de science-fiction, définit ainsi le robot : « Machine, automate à l’aspect humain capable d’agir et de parler comme un être humain » (2020). Dans un contexte « technique », le CNTRL définit le robot comme un « appareil effectuant, grâce à un système de commande automatique à base de microprocesseur, une tâche précise pour laquelle il a été conçu dans le domaine industriel, scientifique ou domestique ». Par exemple, des robots destinés à l’interaction directe avec les humains ou les robots « jouets » sont largement commercialisés. On les décrit comme des « robots sociaux » et ils sont conçus pour tenir compagnie aux humains, les distraire, les sécuriser, souvent dans des établissements de soins de santé[1]. (Seraiocco, 2021)
Un programme informatique qui produit du texte…
Toutefois, le robot conversationnel n’a pas nécessairement une matérialité physique comme en témoigne cette définition : « Les chatbots sont des programmes qui génèrent des contributions langagières, écrites ou orales dans des situations conversationnelles » (Relieu et al., 2020 ; p.83). Cette définition pose de façon claire sous quelle typologie technologique, soit le programme informatique, se situe le robot conversationnel.
Ce que je nomme mon robot conversationnel, un peu à la blague, est un script, donc une ligne de code qui ira piger dans une base de données – une feuille Excel dans le cas présent, dont une colonne est composée de près de 100 à 200 messages générés par GPT-2 à partir de mes données / une colonne mot-clics ou hashtag / une colonne image et légende. Les quelque 100 messages ont été sélectionnés à partir des propositions de GPT2 et je me suis fixé les règles suivante à-propos de leur manipulation prépublication :
- D’abord de les passer dans Antidote pour clarifier le sens en corrigeant les accords ou les fautes d’orthographe.
- Ensuite, dans certains cas, j’ai retiré les doublons de mots, les symboles ou signes qui polluaient la compréhension, de même que certaines espace de typo.
- Puis, pour certaines phrases, j’ai parfois ajouté une ponctuation de fin phrase, surtout si la proposition était extraite d’un texte plus long.
Ce que fait le script
Le script choisira un message, un mot-clic et parfois une image ou dans certains cas, seulement une image avec légende. Il créera donc des interactions, mais il fera pas la conversation, enfin pas à ce stade-ci. Les contenus ont été créé à partir de mes données. Travailler avec GPT2 m’a fait prendre conscience, comme le disait par ailleurs Yoshua Bengio, pas plus tard qu’en novembre 2020, que le robot fluide qui jasera ou écrira aisance n’est encore près de voir le jour. Pour le moment, on peut scripter des interactions, permettre à une fonction d’IA de répondre en proposant des contenus liés à des mots du texte (ou audio) de l’autre partie.
Mon double numérique sera-t-il vraiment un jumeau? Cela reste à prouver.
Cela dit, Woebot le chatbot psychologue, montre bien que le taux de satisfaction dans une interaction avec un programme conversationnel est souvent redevable à ce que l’humain comptait obtenir.
[1] Kidd, Taggert et Turkle (2006) ont étudié les interactions entre les robots sociaux et les patients âgés d’un centre de soins de longue durée.