![]() |
gSpeech 2ème du nom ? - Version imprimable +- PrimTux, la distribution éducative (https://forum.primtux.fr) +-- Forum : PrimTux: LA DISTRIBUTION: présentation, aide et développement (https://forum.primtux.fr/forumdisplay.php?fid=5) +--- Forum : Demandes d'évolution - Tests des iso - Développement (https://forum.primtux.fr/forumdisplay.php?fid=10) +--- Sujet : gSpeech 2ème du nom ? (/showthread.php?tid=1717) |
gSpeech 2ème du nom ? - mothsart - 06-11-2022 Bonjour, Ça fait une petit moment que je réfléchit à faire évoluer gSpeech. Ma découverte récente du moteur de TTS mimic3 (https://github.com/MycroftAI/mimic3) me permet de voir l'avenir avec optimisme. Il fait tout ce qui est attendu par un TTS dans Primtux : - voix moins robotique (bcp de triche dans picovox : on est quasi au terme des possibilités) - moteur offline (nécessite une petite manip pour télécharger les voix mais je pense savoir comment les encapsuler dans un .deb) - plusieurs voix différentes possibles : homme et femme - pris en charge du SSML : là, on peut vraiment personnaliser une diction avec précision (pour un applicatif par exemple) - intégration de speech-dispatcher (gros point sombre avec gSpeech) - développé en Python : j'ai parcouru les sources et je comprend les grandes lignes, pourrait participer voir l'améliorer etc C'est loin d'être parfait car comme beaucoup d'outils, il n'a que des notions de prononciation sur des mots isolés de leur contexte. De plus, il manque des choses que j'avais traité (au moins partiellement dans gSpeech) et qu'il faudra adapter pour être pris en charge : - remplacement d'abréviations courantes - acronymes courants - termes anglais francisé - prénoms et noms courants - termes informatiques - mots familiers ou argot - etc. Intégrer mimic3 ne changera quasi pas l'interface de gSpeech (excepté le choix des voix) mais ça va m'obligé à faire bcp d'ajustements de fond, tant gSpeech n'était pensé que pour picoVox. Gérer les 2 me semble un peu présomptueux. Je me vois plutôt passer de l'un à l'autre. Pour le coup, je ne sais pas trop ce qui est le mieux : Faire une version 1.0 (on est à la version 0.11) par exemple qui se passera totalement de picovox ou carrément créer un nouveau projet avec un nouveau nom ? Merci d'avance de vos éclairages ! RE: gSpeech 2ème du nom ? - Steph - 06-11-2022 mycroft-pip install --upgrade pip => mycroft-pip commande introuvable => ? RE: gSpeech 2ème du nom ? - mothsart - 06-11-2022 Non, il faut te baser sur : Code : # Install system packages RE: gSpeech 2ème du nom ? - chti5933 - 06-11-2022 (06-11-2022, 17:50:09)mothsart a écrit : Non, il faut te baser sur : RE: gSpeech 2ème du nom ? - mothsart - 06-11-2022 @chti5933 : non, chaque ligne se lance indépendamment. Je t'explique le détail : 1. On crée un environnement python isolé (ça évite des soucis de compatibilité pour un test avec les dépendances de ta distribution) Code : python3 -m venv .venv 2. on active cet environnement isolé (toutes les installations de dépendances python se feront dans ce dossier et non de façon globale) Code : source .venv/bin/activate 3. On met à jour le gestionnaire de paquets de python dans cet environnement isolé Code : pip3 install --upgrade pip 4. On installe les programmes de TTS a proprement parlé (utilisable seulement dans cet environnement isolé) Code : pip3 install mycroft-mimic3-tts[all] Une fois que c'est fini, on peut jouer avec mimic3 ainsi : Code : mimic3 --voice fr_FR/m-ailabs_low#ezwa "mon texte" | aplay Le premier lancement sera assez lent car il va télécharger les données de langue. (comme dis, une fois packagé, ça ne sera pas le cas sous Primtux) RE: gSpeech 2ème du nom ? - chti5933 - 07-11-2022 Bonjour , j'ai du mal travaillé, en cours de travail j'ai suivi les instructions et respecté les remarques que le système m' a données. J'ai travaillé surlinuxmint 7 dernière version d'il y a quelques jours option polychrome voici par séquence ce que j'ai obtenu Code : administrateur@primtux:~$ sudo apt-get install libespeak-ng1 Code : administrateur@primtux:~$ sudo python3 -m venv .venv je suis perdu je respecte la première remarque Code : On Debian/Ubuntu systems, you need to install the python3-venv et cela donne Code : administrateur@primtux:~$ sudo apt install python3.8-venv Code : administrateur@primtux:~$ sudo python3 -m venv .venv instructions mal suivis, surement mais quoi?, RE: gSpeech 2ème du nom ? - mothsart - 07-11-2022 Alors, c'est normal. Pour les apt install, c'est avec sudo mais pour le reste, tu dois lancer en espace utilisateur. Donc déjà, tu es dans /home/administrateur/ Le mieux c'est de te créer un dossier pour tes tests et te mettre dedans : Code : mkdir tests_mimic3 && cd tests_mimic3 Puis : Code : python3 -m venv .venv et tu continues sans mettre de sudo et tu devrais arriver au bout. RE: gSpeech 2ème du nom ? - Steph - 12-11-2022 Chez moi je n'entends rien... RE: gSpeech 2ème du nom ? - mothsart - 14-11-2022 C'est peut-être ton aplay qui est mal config. Tu peux générer des fichiers .wav (et tu pourras les lire avec vlc ou autre) |