FRAPéOR : Le Français parlé par les étrangers à Orléans.

Porteurs du projet : Baddredine Hamma (EC – Univ. Orléans) et Yvan Stroppa (IR-CNRS)

Constitution d’un corpus sonore dédié et analysé avec une finalité didactique.

Actions à mener :

ACT01 : OK : Récupération de l’ensemble des éléments sonores et textes associés à ce corpus

ACT02 : OK : Harmonisation des formats et conversion en mp3

Commandes pour conversion des formats aac –> mp3 et m4a –>mp3

#ffmpeg -i « Voix 011 alba.m4a » -c:v copy -c:a libmp3lame -q:a 4 Voix_011_alba.mp3

#ffmpeg -i ’18 mars, 18.35_ Ramzi.aac’ -acodec libmp3lame Ramzi.mp3

#ffmpeg -i ‘Entretien remédiation phon.mp4’ Entretien_remediation_phon.mp3

Suppression des espaces et codes accentués dans le nom des fichiers.

ACT03 : OK: Production de la transcription via whisper-ui pour une première version

OK : Installation de whisper-ui à partir du site : https://korben.info/whisper-interface.html

Passage des différents fichiers sonores dans le système de whisper pour transcription automatique

ACT04 : OK –> Elaboration d’un site web

Un premier prototype de site web a été élaboré pour mettre au point un éditeur de transcription. Cet éditeur, une fois mis au point, sera intégré également dans AlimCorp. Le site actuel en cours de validation est accessible à partir de l’URL suivante : https://frapeor.alimcorp.org (demande d’accès voir Badreddine). Il offre les fonctionnalités suivantes : exploration du Corpus Sonore produit dans le cadre du cours de M1 « Remédiation Phonétique », possibilité de corriger les transcriptions obtenue par Whisper, possibilité de définir les annotations phonétiques de remédiation.

ACT05 : ajout de fonctionnalités de manipulation des données.

ACT06: élaboration de la partir IA : système expert.

ACT07: développement de la partie utilisateur (grand public).