Le séminaire public « Les nouveaux paradigmes de l’Archive » est coordonné par le Conservatoire National des Arts et Métiers (laboratoire Dicen‐IDF) et les Archives Nationales en partenariat avec le LabEx hastec. Il est ouvert aux chercheurs, jeunes chercheurs, étudiants (niveau Master) en archivistique, documentation, et traitement des Data, et professionnels des archives et du Records Management.
Il propose d’analyser les nouveaux paradigmes de l’Archive liés à la généralisation des documents numérisés ou nativement numériques et des données massives. L’enjeu est d’identifier les disruptions liées aux mutations numériques du document, aux flux de data, au rôle des algorithmes, et à l’intelligence artificielle, et d’envisager les conséquences des nouvelles productions issues de la société et des organisations publiques et privées, sur les pratiques archivistiques : Comment les missions traditionnelles de collecte, de conservation, de classement et de communication s’adaptent‐elles déjà et s’adapteront‐elles à ces nouveaux objets?
Comité Scientifique
Evelyne Broudoux (Cnam), Ghislaine Chartron (Cnam), Françoise Lemaire (AN), Rosine Lheureux (AN), Yann Potin (AN), Clothilde Roullier (AN), Claire Scopsi (Cnam), Martine Sin Blima‐Barru (AN)
Institutions de rattachement : Archives nationales, Ecole Nationale des chartes, INA, Dicen-IDF Cnam Paris, BNF, ENSSIB, TGIR HUMA-NUM, Institut Historique Allemand (DHIPIHA), ComUE Université Paris Lumières – UPL , laboratoire CERLIS (Université de Paris), LabSIC-Université Paris 13, Université de Montpellier (LIRMM), société QUINTEN, société Ourouk, Cabinet Archive17
Séance 1 – 24 février 2020 – 10h00 -12h30 – visio-conférence
Données, métadonnées, documents ? Questions sémantiques
Archivistes, bibliothécaires, documentalistes, informaticiens et spécialistes de la data donnent l’impression d’utiliser des vocabulaires communs pour désigner les objets sur lesquels ils travaillent. Cependant le sens de chacun des mots est souvent différents en fonction des métiers, des contextes de production et des usages. Cette table ronde inaugurale du séminaire entend interroger les points de rencontre, de divergences de ces dénominations qui sont employés par tous mais sont polysémiques.
Séance 2 – 8 juillet 2020 – 10h00 -12h30 – visio-conférence
Le tout et la partie : L’agrégation de données numériques
Nous proposons d’aborder une interrogation commune aux acteurs de l’information : L’agrégation de données numériques et leur interprétation. Nous proposons de faire dialoguer une historienne et un data analyst, autour des questions suivantes : quels sont les apports des données numériques pour l’Histoire ? Quels en sont les outils ? Comment choisit-on d’agréger tel ou tel type de données pour lui donner du sens ; Quels sont les risques de ces pratiques en terme d’interprétation abusive , quelles informations sont nécessaires pour une juste interprétation des données croisées ? Comment y sensibiliser et former les jeunes chercheurs? A l’inverse l’archiviste, l’historien sont confrontés à des collections, des lots de documents pré-organisés par les producteurs et dont il ignore le sens et dont il doit percevoir les logiques internes.
Séance 3 et 4 – 3 novembre / en visio-conférence
L’intelligence artificielle au service de l’archivage et de l’analyse des archives
Le développement des technologies d’intelligence artificielle constitue une opportunité pour les services d’archives et les archivistes. Nous proposons d’interroger l’état de l’art mais aussi les enjeux éthiques et scientifiques de cette option et les formes que prennent les collaborations entre les centres de recherche, les archives, et les firmes impliquées dans le développement des algorithmes. Nous considérerons aussi l’algorithme comme archive : Parcours sup. montre (entre autres exemples) l’importance que prendra la connaissance des algorithmes pour comprendre la réalité sociale, administrative etc.
Regard ethnologique sur les mutations des professions et des pratiques archivistiques et documentaires
Des chercheurs observent les professionnels des archives et de la documentation. Ils interrogent la temporalité des métiers, leur rôle de médiateur ou leur relation avec leur environnement, les usagers, les institutions. Ils s’interrogent sur les malentendus du regard porté sur ces métiers de l’invisibilité dont le public n’appréhende pas toujours la technicité. Nous leur demanderons quels fondamentaux identitaires survivent aux mutations numériques.
Séance 5 – 15 décembre / en visio-conférence
Des lacs de données pour quelles archives ?
Le choix par l’Ina d’une architecture de Lac de données a propulsé le terme dans le domaine du patrimoine audiovisuel. Nous proposons d’éclaircir le principe des « Datalake » et d’en évaluer la portée pour les institutions patrimoniales ; s’agit-il d’un modèle précurseur offrant la solution idéale pour le stockage des données volumineuses ou d’un modèle adapté à certaines missions, certains types de fonds, certains volume mais « maléfique » pour la valorisation des données?. Il s’agit ici de comprendre en quoi l’architecture de stockage des données interagit avec l’environnement professionnel et les usages attendus et en quoi il est lié aux progrès des algorithmes et du machine learning.