Vidéo

TEXT-TO-SPEECH SYSTEM ; ERHEL, Yvon ; POPESCU, Florin ; SLT GROSS, Laurent

  • Images animées
  • TEXT-TO-SPEECH SYSTEM ; ERHEL, Yvon ; POPESCU, Florin ; SLT GROSS, Laurent
  • Ecoles Militaires de Saint-Cyr Coëtquidan
  • Filière Scientifique - Option Mécanique Promotion Chef d'Escadron Francoville Date de soutenance : 01/01/2011
  • > Etude : PRESENTATION : Le logiciel MBROLA est un synthétiseur de voix. Il utilise des phonèmes, des échantillons de son, et des prosodies, la durée de ces phonèmes, pour synthétiser la voix. Cependant il n¹effectue pas la traduction d¹un texte brut en phonèmes, ceci doit être fait manuellement. Notre but est donc de développer un logiciel permettant de synthétiser de la voix directement à partir d¹un texte. L¹objectif est de traduire un texte en phonèmes, d¹y ajouter les prosodies utiles et de charger ces données avec MBROLA. CONTRAINTES : Le logiciel doit être codé avec le langage Python et le logiciel MBROLA est utilisé pour synthétiser la voix. De plus, le logiciel doit offrir différents moyens de saisi de texte; un texte doit pouvoir être entré manuellement, un fichier doit pouvoir être chargé et un texte doit pouvoir être extrait d¹une page internet. Cependant le logiciel est conçu pour travailler qu¹avec une seule langue qui est le français. DEMARCHE : Dans un premier temps, nous avons conçu l¹interface permettant la communication entre le logiciel et son utilisateur. Elle contient une zone de texte, pour écrire directement un texte, et un menu pour exécuter l¹action désirée, ouvrir un fichier ou entrer l¹adresse d¹une page internet pour en extraire le texte. Celle-ci doit être la plus sobre possible pour une utilisation facile du logiciel. Puis, nous avons créé le traitement du texte. Celui-ci a deux objectifs. D¹abord, il faut trouver les symboles, les nombres et les abréviations contenu dans le texte et les remplacer par du texte brut. C¹est la normalisation du texte. Puis, il faut traduire ce texte en un langage compris par le logiciel MBROLA. Et pour finir, ces données doivent être chargées par le logiciel MBROLA. RESULTATS OBTENUS : Grâce à l¹interface créée, il est possible d¹écrire un texte, d¹ouvrir un fichier texte ou d¹extraire du texte d¹une page internet. Le texte est ensuite normalisé et afficher pour pouvoir observer le résultat. Puis le texte est traduit en phonèmes et à nouveau affiché. L¹étape finale est l¹ajout des prosodies et le chargement des données par le logiciel MBROLA. Le logiciel permet donc de synthétiser de la voix et d¹écouter un texte en français. LIMITE La normalisation du texte ne respecte pas l¹ensemble des règles de la langue française. Le premier élément manquant est qu¹aucun test n¹est effectué pour connaitre la nature des mots. Ceci permettrait d¹interpréter correctement le mot « jean » dans la phrase « Jean porte un jean. ». Le deuxième élément réside dans les terminaisons des mots. Une même lettre peut, ou non, être muette à la fin d¹un mot. De plus, une terminaison muette peut être à l¹origine d¹une liaison entre deux mots. Pour résoudre ces problèmes des bases de données pourraient être créées pour déterminer la manière dont les mots doivent être traités.
Lien copié.
Build V.5.2.2 - 2ecb916194 (29/04/2026 07:35:08)