Auteur: Raymond Lepage, Ph.D, Vulgarisateur scientifique, Biron Groupe Santé, Brossard, QC
Intelligence artificielle
Maintenant que la pandémie de la COVID-19 est essentiellement derrière nous, d’autres sujets semblent plus populaires dans les revues scientifiques et la presse grand public. Le mois de mars dernier a été particulièrement fébrile dans le domaine de l’intelligence artificielle (AI) à l’occasion de l’arrivée sur nos ordinateurs des dernières versions de robots conversationnels comme la version 4.0 de ChatGPT. Ces nouveaux outils soulèvent autant d’enthousiasme que d’inquiétudes.
Le défi semble de taille, entre autres, pour le milieu de l’éducation où la possibilité de détecter dissertations et examens rédigés à l’aide de ces robots devient une tâche titanesque, voire impossible. Voici donc en vrac et en désordre, quelques lectures réalisées dans les derniers mois.
Ce qui me ramène aux intrusions de cette technologie dans le domaine scientifique et médical, pour le meilleur et le pire. Un article entièrement écrit par ChatGPT et contenant 30 références a été accepté pour publication dans la revue Innovations in Education and Teaching International après révision par 4 experts (humains…). L’auteure principale (D.R.E Cotton) était une personnalité connue du domaine de l’éducation en Angleterre et elle avait pris bien soin de cacher cette information qui portait justement sur les défis posés par le trichage en éducation!
Mon premier réflexe de baby boomer a été que c’est possible dans des disciplines parfois qualifiées de « sciences molles ». Mais l’équipe anglaise n’est probablement pas la première à utiliser l’IA pour produire des articles scientifiques.
Des usines à produire des articles
Dans le Presse Plus du 8 janvier 2023, Philippe Robitille-Grou rapporte que la fabrication de faux articles scientifiques est devenue une véritable industrie : les paper mills! Déjà dénoncés depuis quelques années ces usines à publier offrent aux chercheurs « désespérés » des articles clés en main moyennant finance. Il y a un tarif pour premier auteur, deuxième auteur, etc.
P. R. -Grou cite une prépublication de janvier 2023 de David Bimler qui a répertorié plus de 800 articles en cristallographie (Metal-Organic Frameworks) publiés entre 2015 et 2022 provenant vraisemblablement du même paper mill. Plusieurs de ces articles avaient été publiés dans des journaux qualifiés d’« exotiques » mais certains avaient franchi les portes de publications plus réputées. Dans plusieurs cas, les articles proposaient même des applications thérapeutiques potentielles aux structures inventées de toutes pièces. Et il ne s’agirait que de quelques-uns de la centaine de milliers d’articles produits par ces paper mills dans tous les domaines scientifiques!
Publish or perish! Je crois entendre la « douce » voix de mon patron de doctorat nous rappeler cette règle incontournable : il faut publier coûte que coûte. Pas surprenant que des entreprises aient vu dans cette nécessité des occasions en or d’aider leur prochain. Le problème semble particulièrement préoccupant en Chine et quelques autres pays où les paper mills rejoignent directement les chercheurs par courriel ou sms pour leurs proposer leurs services! Heureusement que quelques Sherlock Holmes scrutent des séries d’article pour détecter les petites erreurs qui soulèvent le doute: utilisation de logiciels pour repérer les images identiques dans plusieurs publications; adresses courriels qui ne correspondent pas aux noms, styles graphiques caractéristiques, etc. Et c’est là que l’IA pourrait devenir un allié des paper mills en évitant ces petites incohérences qui permettent actuellement l’identification des articles frauduleux. Est-ce qu’on pourra par ailleurs utiliser l’IA comme outil de contre-espionnage? À suivre prochainement sur Netflix….
ChatGPT et les examens de médecine
On savait déjà que l’intelligence artificielle était capable d’égaler sinon battre les meilleurs joueurs d’échec du monde. Est-ce qu’on est vraiment surpris d’apprendre que l’lA avait réussi à obtenir la note de passage aux examens écrits pour devenir médecin américain.
À noter que des questions qui comportaient des éléments visuels (images, photographies et graphiques) aveint été exclues. Il faut noter également que ChatGPT n’a obtenu qu’au mieux, et non systématiquement la note de passage (60%). Nul doute que ce score sera probablement nettement dépassé dans quelques années. Et ce sera probablement le cas de tous les examens basés sur la mémorisation de connaissances encyclopédiques comme celui de la spécialité en biochimie clinique de l’Ordre des chimistes ou ceux de l’Académie canadienne de biochimie clinique. Peut-être pas ceux de l’Ordre des infirmières et infirmiers du Québec…
On sait (ou on espère?) que la pratique de la médecine et de beaucoup d’autres professions dont la nôtre repose sur d’autres éléments que le savoir encyclopédique : sens clinique scientifique, résolution de problèmes, empathie, etc. Entretemps, il ne fait pas de doute que ChatGPT et consorts vont rapidement servir de « livres» de référence pour l’étude de plusieurs disciplines scientifiques et médicales.
L’AI, pas si nouvelle?
Même si on n’utilisait pas encore la notion d’« intelligence artificielle », il y a longtemps qu’on tente d’utiliser la puissance de l’ordinateur dans tous les domaines de la médecine dont la médecine de laboratoire. Déjà dans les années 1970, avant même que les biochimistes cliniques de l’époque n’aient un ordinateur à leur disposition, des experts proposaient des approches mathématiques assimilables à de l’IA. La fameuse équation de Friedewald en 1972 pour le calcul de la fraction de cholestérol-LDL est un exemple d’application d’IA avec les moyens informatiques d’une autre époque.
Les années 1970 et 1980 ont constitué l’âge d’or des bilans et profils d’analyses de laboratoire de toutes sortes. Les plus vieux se souviennent des analyseurs de type parallèle comme le SMAC de Technicon ou encore le M-300 de Vicker qui fournissaient systématiquement 2 douzaines de résultats sur chaque spécimen analysé (wow, la valeur prédictive positive d’un résultat anormal dans un bilan de 24 paramètres!). Plusieurs auteurs ont tenté à l’époque de développer des outils informatiques dont l’analyse par clusters pour extraire l’information contenue dans une telle masse de données, en particulier pour le diagnostic et le suivi des cancers. Ce type d’analyse s’apparente à de la reconnaissance de formes (pattern recognition), possiblement les ancêtres de certaines techniques d’interprétation d’images aujourd’hui.. N’ayant pas la bosse des mathématiques, je comprenais (visualisais) très bien la notion d’un cluster dans un graphique en deux ou trois dimensions. J’avais cependant et j’ai toujours beaucoup de difficulté à saisir la notion en « n » dimensions, où « n » serait un nombre supérieur à 3 de paramètres utilisés.
Les applications intéressantes et prometteuses dans le domaine de l’IA sont trop nombreuses pour être discutées ici (perceptrons, LISP, réseaux neuronaux, etc.) Des réflexions très récentes sur le rôle de l’IA en biochimie clinique peuvent être retrouvées dans plusieurs publications dont les 2 suivantes:
A Status Report on AI in Laboratory Medicine
Applications of Machine Learning in Routine Laboratory Medicine: Current State and Future Directions
Doit-on s’inquiéter de l’impact de ces nouvelles technologies sur le rôle des biochimistes cliniques? Je suis persuadé que l’AI peut faire aussi bien, sinon mieux et surtout beaucoup plus rapidement que nous, entre autres en contrôle de qualité. Règles de Westgard, here we come…) Il y a, j’espère, d’autres dimensions au rôle des biochimistes cliniques…
A chacun de faire un examen de la valeur ajoutée de leur rôle dans la dispensation des soins. À voir à quelle vitesse évolue l’AI, je suis inquiet. À voir à quelle vitesse évoluent les dossiers informatiques dans le réseau de la santé, beaucoup moins…
Décodeur des pensées
Mais l’article sur l’IA qui m’a le plus intrigué dans les derniers mois est celui portant sur l’utilisation de l’AI pour décoder nos pensées !
Dans une étude originant de l’Université du Texas à Austin, des chercheurs ont utilisé des images de résonance magnétique fonctionnelle (IRMf) capables de mesurer de façon non intrusive l’activité des aires du cerveau via les changements locaux de la circulation sanguine. Pendant un total de 16 heures étalées sur quelques journées, des IRMf ont été enregistrées chez trois volontaires pendant qu’ils écoutaient quelques balados narratifs. Les chercheurs ont ensuite utilisé l’AI pour apparier les patrons d’activité cérébrale avec les mots et phrases contenues dans ces balados (phase d’apprentissage). Dans un deuxième temps, les chercheurs ont testé leur décodeur en demandant aux volontaires d’écouter de nouveaux enregistrements et vérifiant à quel point les phrases recréées par l’AI correspondaient aux nouveaux textes.
Malgré des imperfections, l’exemple suivant rapporté dans l’article du New York Times est très troublant!
Enregistrement du balado : “I got up from the air mattress and pressed my face against the glass of the bedroom window expecting to see eyes staring back at me but instead only finding darkness.”
Activité cérébrale décodée: “I just continued to walk up to the window and open the glass I stood on my toes and peered out I didn’t see anything and looked up again I saw nothing.”
Big brother inquiétant? Pour l’instant, la technologie utilisée (IRMf) est trop dispendieuse et compliquée et la durée d’apprentissage trop longue pour être appliquée à un grand nombre d’individus. D’autant plus que les données enregistrées sur un sujet ne peuvent être transférées à un autre individu (pas obligatoire de relire Orwell). Et il demeure toujours possible pour le « cobaye » de court-circuiter le décodeur en pensant à autre chose. Comme le conclut Oliver Whang du New York Times, « L’A.I. est capable de lire dans nos pensées, mais, ce sera strictement sur un individu à la fois, et avec sa permission…pour l’instant.