Préchargement

Refuge Huguenot

La base de données du refuge Huguenot

L’initiative de créer une base de données sur le Refuge huguenot revient à Michelle MAGDELAINE, chercheur à l’Institut d’Histoire Moderne et Contemporaine (IHMC – CNRS). C’est elle qui a en grande partie collecté, codé et enregistré électroniquement les données à partir de 1978.

But de la recherche

Le but de la recherche de cette historienne était de reconstituer la première génération du Refuge, celle des individus qui fuirent le royaume, à la suite de la révocation de l’Édit de Nantes (1685), entre 1685 et la fin du siècle ; intervalle de temps que justifie l’importance du flux migratoire à partir d’octobre 1685, qui va s’enflant dans les années suivantes pour diminuer très rapidement à partir de 1688 89 et se tarir pratiquement à la fin du siècle, malgré de légères reprises au moment de l’annexion de la principauté d'Orange et de la recrudescence des persécutions par deux fois au XVIIIème siècle.

Modalités de la recherche

Concernant les modalités de la recherche, Michelle MAGDELAINE opta pour l’exhaustivité en décidant que la collecte des données ne se limiterait ni à des sondages dans le temps, ni à certaines régions du Royaume, ni enfin à une liste d’informations particulières, élaborée a priori. En effet, s’ils peuvent convenir à l’étude d’une population sédentaire, les sondages dans le temps sont inappropriés à celle d’un flux migratoire, par essence très dynamique. Par ailleurs, choisir une région de préférence à une autre, par exemple, une province du sud du royaume parce que là se trouvaient le plus de protestants, ne conduit pas nécessairement à des interprétations réalistes. Les protestants, nombreux en Cévennes, sont relativement peu partis, au contraire de ceux du Dauphiné et du bas-Languedoc par exemple. Quant aux protestants du nord de la Loire, même s'ils sont une minorité, leur comportement n’en est pas moins significatif. Enfin, en ne retenant des archives que certaines informations, par exemple, le patronyme, il serait devenu impossible d’identifier un individu alors que les homonymes foisonnent. Impossible aussi de connaître l'état sanitaire des fugitifs et ses conséquences sur la durée de leur voyage, sur les conditions de leur installation et sur celles de leur intégration.

Archives dépouillées

Les données dépouillées et stockées aujourd’hui dans la base proviennent de différents pays et de diverses sources. C’est à partir des registres d’assistance de l’Église française de Francfort que Michelle Magdelaine commença, en 1978, sa recherche et la collecte des données. Cette ville-Etat a vu, en effet, passer la majeure partie des fugitifs originaires des provinces du sud de la France et bon nombre de ceux des provinces du nord. Y existait, depuis le milieu du XVIème siècle, une Église d'origine wallonne, fondée par des protestants venant des Pays Bas espagnols. Elle était de langue française et de confession réformée dans un milieu germanophone, de confession luthérienne. Et, seule, cette Église va accueillir, réconforter, aider les réfugiés qui arrivent en masse et ne peuvent s'établir à Francfort, laquelle refuse l’installation des non luthériens. Elle va aussi tenir très scrupuleusement des registres où seront consignés les noms et prénoms des réfugiés, leur origine géographique, leur statut personnel, leur profession, leur état de santé, les circonstances de leur fuite, leur itinéraire, l'endroit où ils ont l'intention de s'installer, la somme qui leur est allouée pour continuer leur voyage. Le dépouillement de ces registres a produit quarante six mille notices individuelles pour la période comprise entre 1685 – date de la révo-cation de l'Édit de Nantes – et 1695 que l'on peut considérer comme la fin du flux migratoire principal. Suite à la formation d’un groupe de recherche international en 1981, des archives furent dépouillées dans d’autres pays. Le nombre total de notices établies s’élève en 2010 à 230000, dont 135000 sont aujourd’hui dans la base de données.

Méthode de dépouillement des archives et leur stockage électronique

Les techniques informatiques pratiquées à l’Institut de Recherche sur l’Histoire des Textes (IRHT – CNRS) s’imposèrent, dès le début, quant à la méthode de dépouillement des archives et quant à la structure de leur stockage électronique. On retiendra que ces techniques relevaient de ce que la recherche informatique nommera vingt ans plus tard, modèles de données semi-structurées ; elles offraient souplesse, adaptabilité et, à l’époque, cerise sur le gâteau, possibilité de saisir sans perte d’information le contenu des archives. L’interrogation de la base se faisait principalement par des tris au moyen du logiciel CLEO. S’attachent à cette période de la base les noms d’Agnès GUILLAUMONT et de Caroline BOURLET, toutes deux membres de l’IRHT.

Évolutions informatiques de la base de données

Dès le début de la recherche, les données furent stockées au CIRCE (Centre Inter Régional de Calcul Électronique ; Orsay). En 1993, elle fut transférée au CNUSC (Centre National Universitaire Sud de Calcul) à Montpellier, où des essais furent menés en vue de son stockage par un Système de Gestion de Bases de Données (SGBD). À partir de 1998, s’appuyant sur la nature des dépouillements, l’Atelier d’Ingénierie des Données (ATID) du Centre d’Analyse et de Mathématique Sociales (CAMS ; EHESS – CNRS) proposa de les stocker grâce à un gestionnaire de données qui s’inspirerait des thèmes de recherche de l’époque sur les données semi-structurées et, parallèlement, de les intégrer dans la toile Internet pour en assurer l’accès et la pérennité. Ce projet a été mené à bien par Claude DEL VIGNA, membre du CAMS. Enfin, en 2009, les circonstances conduisirent Michelle MAGDELAINE et Claude DEL VIGNA à rechercher un nouveau centre pour accueillir et pérenniser la base de données et le site Internet. Ils sont aujourd’hui implantés au Laboratoire de Recherche Historique Rhônes-Alpes (LARHRA), à Lyon. Ce transfert a été réalisé, du côté lyonnais, par Yves KRUMENACKER, professeur à l’université Lyon 3, et Francesco BERETTA, chargé de recherches au CNRS.

Fouilles dans le corpus des données

Très tôt, furent menés sur les données des travaux qui relèveraient aujourd’hui de la fouille de données. Certains furent statistiques, d’autres, les plus poussés, concernèrent l’identification des individus, rendue problématique à cause des variantes patronymiques dans les documents. À l’époque, en effet, l'orthographe des patronymes n'est pas strictement fixée. Deux techniques furent expérimentées, l’une basée sur la squelettisation des patronymes, l’autre sur des règles de déduction mises en œuvre grâce au système-expert SNARK. S’attachent à ces travaux les noms de Marion SELZ (CNRS – Collège de France) et d’Arlette FAUGÈRES (IHMC – CNRS).

La base de données comme objet de mémoire historique

Dès le début, le projet comprenait la construction d’un objet de mémoire historique sur support électronique à propos du plus important mouvement migratoire de l’époque moderne. L’évolution des techniques, au premier rang desquelles la toile Internet, a donné à l’entreprise une réalité et une ampleur inattendues. Les données devenaient facilement accessibles. Cependant, ainsi que le note Rolando Minuti dans Internet et le métier d’historien (PUF 2002, p. 71), « Pour qu’un document puisse être considéré comme une source historique, […] il ne doit pas être sujet à des transformations qui ne soient dûment documentées ». Une exigence de cet ordre conduisit Claude DEL VIGNA et Michelle MAGDELAINE à écrire un document descriptif et explicatif très détaillé des données de la base. Cet outil renforce la pérennité de la base ; il est, par ailleurs, indispensable à quiconque souhaite mener une recherche en histoire en s’appuyant sur les données de la base.