À l’occasion du lancement de la plateforme nationale TACTEO, la MSH Lorraine organise une journée d’étude explorant les enjeux de la transcription participative et ses liens avec les technologies de reconnaissance automatique de texte (ATR/HTR).
Les outils de transcription participatifs permettent de mobiliser largement les spécialistes comme le grand public pour rendre accessible des documents parfois difficilement lisibles ou en danger de conservation. Ainsi, le projet précurseur « Papers of the War Department 1784-1800 » a mobilisé outre-atlantique, une immense communauté d’inconnus pour reconstituer un fonds d’archives perdu à partir de fragments éparpillés dans plus de 200 lieux. Le développement récent des technologies connues sous les noms d’HTR (Handwritten Text Recognition) ou ATR (Automatic Text Recognition) ouvre de nouvelles portes à la reconnaissance massive de textes. L’écriture manuscrite, jusqu’alors impossible à reconnaître automatiquement, est maintenant à la portée d’un traitement automatisé.
Loin de s’opposer, les deux approches sont complémentaires. Les outils de reconnaissance automatique nécessitent en effet des données d’apprentissage de grande qualité, c’est-à-dire des transcriptions manuelles. Les projets de transcription participative peuvent de leur côté s’appuyer sur une reconnaissance automatisée comme point de départ à l’expertise humaine et à une éventuelle structuration du corpus.
Cette journée présentera plusieurs outils de transcription participative et automatique en interrogeant leurs potentielles relations. Une nouvelle plateforme nationale de transcription sera lancée, portée par la MSH Lorraine en collaboration avec le laboratoire Litt&Art (Grenoble). Celle-ci, appelée TACTEO (pour Transcription et Annotation de Corpus Textuels Et Oraux) permet une structuration des transcriptions en XML-TEI afin de constituer des éditions numériques de référence adaptées pour la préservation, la fouille et l’analyse de texte.
PROGRAMME
ccueil des participants
Modératrice de session : Christelle Balouzat-Loubet
9h00 :
Modératrice de session : Melissa Melo
- Sébastien Descotes-Genon, Délégué Régional Académique à la Recherche et à l’Innovation – Région Grand Est
3- L : théorie et pratique
14h00 :
- Matthias Gilles-Levenson
4- De la numérisation à l’édition en ligne
Modératrice de session : Catherine Angevelle-Mocellin
15h30 :
- Guillaume Porte
- Claire Cialone-Grégoire
- Zoé Navarrete Pierrefitte-sur-Seine
→ contact : pierre.willaime@univ-lorraine.fr