Sophie Richard

Intervention sur son corpus.

Problématique :

Sophie dispose d’un ensemble d’enregistrement Anglais-Australien (une centaine d’enregistrements) transcrits partiellement. l’objectif est de compléter dans un premier temps ces transcriptions de la façon la moins chronophage et avec une bonne qualité.

Approche proposée par ASTN :

Actuellement, ASTN est entrain de mettre en place une solution sur la base de Whisper.ui d’un transcripteur automatique pour le projet FRAPéOR. Cette solution peut être utilisée de la même façon avec ces enregistrements et permettra d’obtenir sur l’ensemble du corpus une première transcription. Donc les étapes que l’on va suivre sont les suivantes:
Etape1 : évaluer à partir des différents modèles (Large, Medium et Base) la qualité de transcriptions sur des enregistrements spécifiques sélectionnés par Sophie.
Etape 2: en fonction du résultat, on procédera sur l’ensemble du corpus.
Etape 3: à partir de l’éditeur en cours de conception (projet FRAPéOR), prochainement accessible à partir de l’url https://frapeor.alimcorp.org, on pourra corriger et compléter cette transcription et éventuellement rajouter des annotations de différentes natures.
Etape 4 : valorisation du corpus dans son ensemble reste à définir avec Sophie.

Solution mise en oeuvre :

Une solution de whisper a été installé sous une machine dédiée (accessible via …..) est permet d’exécuter à l’aide des bibliothèque python les transcriptions.

Résultats et conclusion