Plateforme AlimCorp – DeepCorp

Ce projet d’élaboration de plateformes s’inscrit dans la continuité du projet ESLO démarré en 2008. Son objectif est de fournir les outils nécessaires de la collecte des données jusqu’à leur exploitation. Le développement de ces plateformes a pu profiter du retour d’expérience du groupe ESLO et ASTN a essayé de traduire et de consolider toute la démarche qui doit accompagner le chercheur/doctorant dans ce type d’opération.

Projet AlimCorp et DeepCorp :

La plateforme AlimCorp permet l’approvisionnement simple, assisté et collaboratif de corpus à partir d’une solution web. Cette plateforme s’appuie sur le retour d’expérience des membres de l’équipe Eslo pour élaborer un ensemble fonctionnel dès plus intéressant. En effet, l’élaboration de cette plateforme s’est concentrée sur deux objectifs qui sont la mise en place et l’exploitation de la plateforme dans le cadre de l’alimentation du corpus Eslo et d’offrir un outil adapté aux autres membres du laboratoire dans la constitution de leur propre corpus. Dans ce développement nous avons essayé d’apporter une réponse à une problématique récurrente et commune à beaucoup de disciplines c’est la conservation et la capitalisation des données produites et collectées au cours d’activités de recherche aussi bien par les doctorant(e)s que par les EC d’une structure de recherche. A cette fin, nous avons opté pour une plateforme multi modèle qui doit permettre aux utilisateurs dans leur conception de corpus de choisir un modèle existant ou de définir leur propre modèle. Une fois cette étape réalisée, l’utilisateur peut définir les règles d’appariement entre son modèle et les modèles cibles institutionnels pour permettre de disposer à terme d’un archivage perenne. Une fois ces étapes franchies l’utilisateur peut se préoccuper de la collecte et de la saisie des informations nécessaires pour son activité de recherche. Une dernière fonctionnalité a été ajoutée et doit permettre de couvrir le suivi de la saisie des données dans la cadre d’un corpus. Cette fonctionnalité permet de garantir le caractère collaboratif que permet la plateforme dans le cadre d’une campagne de saisie au même titre que l’implémentation d’un échange de message interne et permettant de garder les différentes informations associées au données plutôt que d’utiliser les mails et de perdre les informations échangées.

D’où les quatre blocs fonctionnels suivants.

Premier bloc : permet de construire son propre modèle de corpus, associé à son propre workflow.

Deuxième bloc : permet de définir les appariements entre les modèles internes et les modèles institutionnels.

Troisième bloc : permet de saisir des enregistrements pour un corpus (son, transcriptions et métadonnées)

Quatrième bloc : permet le suivi des corpus

DeepCorp correspond à la partie exploitation et traitement de ces corpus. Dans cette reconstruction l’équipe proposera d’enrichir les possibilités de manipulation et de traitement de ces données reposant sur un mécanisme de soumission de jobs élaborés par les utilisateurs . En effet, un dispositif d’alimentation et de partage de codes (R, Python, Matlab, TXM et autres) devrait être mis en place (sur le principe de la plateforme ExecAndShare) pour permettre l’exécution de ces codes dans un espace conteneurisé (Docker et Kubernetes). Ce projet est élaboré en concertation régulière avec l’équipe Eslo du laboratoire. A suivre.