AXE 2

Création de données & valorisation de corpus en Sciences humaines & sociales

Cet axe s’attelle à consolider l’ensemble des recherches menées dans le cadre de la création de corpus originaux et de données en sciences humaines et sociales. Plusieurs ANR hébergées et projets MSHL portant sur la création de bases de données et/ou de corpus animent cet axe. Cet axe a vocation à accueillir les recherches prochainement soutenues dans le cadre de la politique d’équipement de l’État et de la Région Grand Est (CPER Cov-D, 2021-2027).

Les évolutions récentes des Sciences Humaines et Sociales se caractérisent par une place de plus en plus grande accordée aux données empiriques, à la création de bases de données originales mais aussi à leur publicité, au respect de principe d’ouverture des données, de réplication et de valorisation. Certaines de ces disciplines sont vues profondément transformées par ce que certains appellent un « tournant empirique ». Or la production de ces données comme leur traitement s’accompagne d’une évolution des frontières entre les disciplines car bon nombre de travaux interdisciplinaires résident précisément dans la capacité des communautés scientifiques à créer ou traiter des données au croisement de plusieurs champs disciplinaires. Le premier sous-axe est donc principalement lié à la création de données en nombre suffisant pour être représentatives, réplicables, contrôlées.

La dimension quantitative revêt son importance comme, par exemple, des données comportementales ou des données de corpus (textes, images). Deux plate-formes en cours de développement soutiennent cet axe :
Cenhtor (hébergement, pérennisation et valorisation des données) également par la plate-forme Ortolang (Atilf/Huma-Num). La vocation de cet axe repose sur le développement des actions ciblées vers les chercheurs pour les sensibiliser aux évolutions récentes des humanités numériques d’une part et de la science ouverte d’autre part. Cet axe aide également les laboratoires à recenser leurs collections patrimoniales de données (données dormantes) afin de pouvoir les pérenniser et les valoriser.

Cependant, la création de données en SHS ne se résume pas à des données quantitatives. Une place est dédiée dans cet axe à la production de données originales de dimension plus réduite. Ceci peut concerner le commentaire et l’édition de textes originaux, le travail de philologie, les travaux de grande érudition (histoire, théologie, littérature …).