Auteurs: Michel Rohrbach (à gauche) et Alexander Gerlings (à droite), Codirecteurs du Centre IDES
L’intelligence artificielle va-t-elle tuer les métiers de l’information et de la documentation? La question semble contenir la réponse, tant les domaines sont intrinsèquement liés. IDES y pense aussi.
L’intelligence artificielle (IA) va-t-elle tuer les métiers de l’information et de la documentation (I&D)? Poser la question, c’est presque y répondre, tant les domaines sont intrinsèquement liés. Utiliser de manière intelligente et intelligible les briques et modules d’IA pour servir au mieux les publics cibles des centres d’information et de documentation sera le défi. IDES, à son niveau, y réfléchit aussi.
ChatGPT, que sais-tu sur la pénurie d’enseignants?
Demandons à ChatGPT 3.5 quelles sont les mesures prises par les cantons suisses pour lutter contre la pénurie d’enseignants. Le résultat, compilant des informations recueillies jusqu’en janvier 2022 sur le web visible est assez bluffant.
Continuons l’exercice et demandons à ChatGPT 3.5 s’il dispose de données chiffrées et de scénarios dans ce domaine. Les acteurs du système savent que ces éléments sont élaborés et mis à disposition par l’Office fédéral de la statistique (OFS). Ici, la réponse de ChatGPT3.5 est un peu plus décevante, même si les conseils dispensés sont corrects. Les sources et publications de l’OFS ne sont en l’état pas accessibles aux calculateurs de ChatGPT. Le rapport sur l’éducation publié par le CSRE, n’a pas non plus encore été moissonné, alors qu’il contient d’intéressantes informations à ce sujet.
À noter que ChatGPT ne peut se nourrir que des informations récoltées sur le web visible, représentant probablement moins de 10 % des informations disponibles sur le web global.
Naturellement, l’IA ne se résume pas au modèle ChatGPT, même si celui-ci a mis en lumière bon nombre de problématiques qui sont ainsi entrées dans le débat public.
IA et I&D: une histoire liée
Les sciences de l’information et de la documentation (I&D) sont intrinsèquement liées aux questions qui se posent avec l’essor des techniques utilisant l’intelligence artificielle. Depuis les années 1950, des briques et des modules d’IA ont déjà été introduits dans les processus de traitement, de conservation, de diffusion et de recherche des informations et des documents. Pensons simplement à la reconnaissance optique de caractères (OCR), qui permet de retrouver des informations contenues dans des documents n’ayant pas été créés de manière numérique. Il y a une vingtaine d’années encore, les résultats des systèmes OCR n’étaient pas très brillants: les mots étaient souvent mal interprétés, certaines polices de caractères ne pouvaient pas être lues ou alors il y avait trop d’erreurs pour une utilisation efficace. Aujourd’hui, l’IA est capable de reconstruire de nombreux éléments en fonction de leur contexte par exemple. Des manuscrits peuvent être analysés, tout comme des images, ce qui permet de mettre à disposition de nouvelles sources inédites et donne lieu à de nouveaux champs de recherche. De même, de nombreux autres aspects (indexation automatique, contrôle qualité) peuvent être soutenus par l’IA.
Des évolutions encore plus importantes peuvent être attendues en lien avec le développement de l’open access et, corollaire, d’ensembles de données trop volumineux et complexes pour un usage traditionnel. D’un point de vue documentaire, il restera primordial de constituer des corpus de données identifiées et placées dans leur environnement contextuel: les métadonnées (auteurs, institutions, mots-clés ou descripteurs, description des sets de données) et leur qualité seront toujours plus importantes.
Les spécialistes de l’information et de la documentation ont leur rôle à jouer ici. Certainement pas seuls, mais en collaboration avec les personnes ayant une expertise dans un domaine donné. L’IA ne peut pas bien fonctionner sans des sources de bonne qualité et l’élaboration des sources par les professionnels peut profiter des outils mis à disposition par l’AI.
Et dans le domaine de l’information et de la documentation sur l’éducation et la formation en Suisse?
Dans ce domaine, un projet tel que le Virtual Educational Observatory semble un cas d’étude intéressant – et c’est pourquoi il est intégré au PNR77 «transformation numérique». Il vise à reprendre, dans une collaboration interdisciplinaire entre experts de l’informatique de l’éducation, en sociologie et en exploration de données, plusieurs jeux de données afin de les réunir et d’aboutir à une image de l’éducation, de l’apprentissage et de la transformation numérique. Ces démarches sont certainement destinées à enrichir le processus de monitorage de l’éducation; certes pas à remplacer les expertes et les experts qui en sont responsables, mais à les soutenir en élargissant les approches envisageables.
De même, avec le projet Connectome de Switch, les développements vont dans le sens de relier entre elles les sources et les ressources de nombreuses institutions dont les données ne sont actuellement pas accessibles et de les transformer en données ouvertes afin de permettre des connexions pertinentes.
Ces deux projets sont liés à la Haute école spécialisée des Grisons et notamment au « Schweizerisches Institut für Informationswissenschaft (SII) ». Or, IDES a la chance de collaborer depuis plus de cinq ans avec cette institution pour mettre à disposition le Serveur suisse de documents pour l’éducation et la formation edudoc.ch. Gageons que des avancées intéressantes pourront être atteintes, et que des liens entre les données pertinentes pourront être établis.
Alors IA et I&D, une évolution en symbiose et en toute conscience?