Accompagnement de Galla dans l’harmonisation des annotations de son Corpus à partir d’un lexique de référence.
Problématique :
Harmonisation des gloss utilisés dans les différentes annotations produites sous ElanPro sur les différents enregistrements dans la langue ngbugu.
Approche proposée par ASTN :
L’approche proposée par ASTN se déroule en plusieurs étapes :
Etape 1 : Faisabilité
vérification faisabilité après examen des fichiers sources eaf et eafl
Etape 2 : Développement des scripts d’extraction pour reconstruction du lexique implicite
Etape 3 : Chargement du lexique de référence à partir du fichier eafl
Etape 4 : Comparaison des deux lexiques et notification des différences
Etape 5 : Une fois harmonisé –> voir quelles sont les solutions de valorisation/diffusion.
Mise en oeuvre de l’approche :
Elaboration d’un document de travail contenant l’exposé du problème et la démarche d’analyse.
Résultat et Conclusion :
Solution réalisée : script python accessible sous github lien
Documentation de la réalisation (version provisoire) lien