13 mars – Les nouveaux paradigmes de l’Archive – séminaire – séance 2/6

2 février 2019 Aucun commentaire »
13 mars – Les nouveaux paradigmes de l’Archive – séminaire – séance 2/6

Le séminaire public « Les nouveaux paradigmes de l’Archive » est coordonné par le Conservatoire National des Arts et Métiers (laboratoire Dicen‐IDF) et les Archives Nationales en partenariat avec le LabEx hastec. Il est ouvert aux chercheurs, jeunes chercheurs, étudiants (niveau Master) en archivistique, documentation, et traitement des Data, et professionnels des archives et du Records Management.
Il propose d’analyser les nouveaux paradigmes de l’Archive liés à la généralisation des documents numérisés ou nativement numériques et des données massives. L’enjeu est d’identifier les disruptions liées aux mutations numériques du document, aux flux de data, au rôle des algorithmes, et à l’intelligence artificielle, et d’envisager les conséquences des nouvelles productions issues de la société et des organisations publiques et privées, sur les pratiques archivistiques : Comment les missions traditionnelles de collecte, de conservation, de classement et de communication s’adaptent‐elles déjà et s’adapteront‐elles à ces nouveaux objets?

Comité Scientifique :
Evelyne Broudoux (Cnam)
Ghislaine Chartron (Cnam)
Françoise Lemaire (AN)
Rosine Lheureux (AN)
Yann Potin (AN)
Clothilde Roullier (AN)
Claire Scopsi (Cnam)
Martine Sin Blima‐Barru (AN)


Télécharger le « Programme 2019 du séminaire »


Séance 2 – mercredi 13 mars – 10h00 -12h30 – lieu : Archives Nationales, Site de Pierrefitte, salles de commission 3 et 4
Accès : http://www.archives-nationales.culture.gouv.fr/web/guest/site-de-pierrefitte-sur-seine


Le traitement des données de masse

La dématérialisation des principales activités d’enregistrement de données issues du monde social et économiques, tant par l’Etat que par les acteurs privés, pose ouvertement la question de leur accessibilité, certes, mais avant tout du traitement archivistique de ces mêmes données. Les big data ou données de masse, sont les flux de données numériques textuelles, audiovisuelles produites en masse par l’activité quotidienne des entreprises privées ou publiques, ou des organismes scientifiques. Elles sont issues des instruments de mesure, des processus de travail collectifs, des publications en ligne ou des collectes de l’activité des internautes. Elles sont disponibles sous des formes brutes, ou reformatées par des algorithmes. (ce sont deux univers de données volumineuses traitées par des personnes et avec des réalités de traitement différents). Les discours des nouveaux business models et la transformation numérique ont attiré l’attention des entreprises sur l’usage et la valeur économique des jeux de données, mais la question de leur archivage est encore peu évoquée. L’archivage doit assurer la pérennité, et l’intelligibilité de ces données. Il doit également en garantir l’authenticité, la fiabilité, et le respect des règles juridiques et éthiques. Avec le changement d’échelle, les archivistes doivent assurer la maitrise de contenus hétérogènes sans pouvoir les consulter. Quelle organisation, quelle place pour les contrôles de qualité, une fois que l’humain n’est plus le seul acteur à intervenir en production de métadonnées sur les archives dont il assure la conservation ? Les modèles de description doivent-ils évoluer de manière à ne plus répondre forcément à des standards définis a priori, mais plutôt à des modes de consultation déterminés en aval par les moteurs d’interrogation ? C’est aux questions structurelles soulevées par le recours au numérique et à l’intelligence artificielle que cette séance propose de se consacrer, En vue de ne pas limiter la séance aux données de masse à valeur (et usage) quantitatif, on s’intéressera au traitement des « données » qualitatives, qu’il s’agisse de mesures à haute valeur scientifique, ou d’archives audiovisuelles de masse (1 million d’heures annuelles supplémentaire à l’Institut national de l’Audiovisuel).

Participants

Ghislaine Chartron introduction scientifique

Boris Blanckemane, chef de projet au sein du service du dépôt légal du web (direction des collections) et Jean Carrive, responsable adjoint du département Recherche et innovation numérique (direction de la diffusion et de l’innovation), Institut national de l’audiovisuel (INA)

Etienne Ollion (Chargé de recherche au CNRS)

Marie Odile Charaudeau (coordinatrice de l’association Alliance big-data) (sous réserve)

Animation : Ghislaine Chartron, Martine Sim Blima-Barru

A lire aussi