GitHub - Pallas1303/FestPB: FestPB é um projeto com objetivo de oferecer suporte ao Português Brasileiro ao software Text-to-Speech Festival Speech Synthesis. Com opções de baixar pacotes de vozes.

FestPB é um projeto com objetivo de oferecer suporte ao Português Brasileiro ao software Text-to-Speech Festival Speech Synthesis. Com opções de baixar vozes.

Conteúdo da página:

Tutorial
Sobre dicionário e fonemas usados.
Recados Importantes
To-Do
- Tokenização

Rescursos disponíveis no momento:

Script para construção de dicionário do idioma Português Brasileiro.
Scripts para construção de modelos LTS (Lettng to Sound - Letras para Som) para Festival Speech Synthesis.
PhoneSet com fonemas do Português Brasileiro.
Script para geração de pitchmarck usado REAPER
Script para construção desses seguintes programas (Festvox, Festival, Speech Tools e REAPER) e instalação de um G2P.
G2P usado Annotator
Arquivos para o suporte de fonemas do português brasileiro ao Festival Speech Synthesis.

Tutorial

Aqui tem um tutorial básico de como fazer o download do repositório e instalação das ferramentas.

Clone o repositório e entre em seu diretório:

git clone https://github.com/Pallas1303/FestPB
cd FestPB

Aviso: A instalação são para distribuições baseadas em Debian.

Executar instalação das ferramentas:

bash scripts/make_tts_utils.sh

Agora definar a variável FESTPB onde está armazenado o projeto e salve em arquivo. No caso o armazenamento é o caminho atual:

echo "FESTPB=$PWD" >> tts_utils/utils.source

Aviso: Caso a variável FESTPB não for definida corretamente todos os scripts do projeto não funcionaram.

Sobre dicionário e fonemas usados.

Dicionário fonético e fonemas são fornecidos pelo grupo Falabrasil com seu software G2P chamado annotator. Os fonemas estão em codificação UTF-8.

Para construção do Phoneset foi usado como base o seguinte artigo:

Síntese de Fala em Português Brasileiro Baseada em Modelos Ocultos de Markov" feito por Carlos Francisco Soares de Souza.

Houve algumas pesquisas, mas as suas fontes estão perdidas. As características fonéticas dos fonemas marcadas no Phoneset podem estar incorretas em algumas partes.

Caso houve erros, por favor faça uma contribuição

Recados Importantes

No seguinte momento não á:

Tutorial ou mesmo documentação para construir/instalar uma voz em português brasileiro. Sendo necessário conhecimento e familiaridade com Festival Speech Synthesis.
Conversão de números, emojis e símbolos.
Sem modelo POS Tagging em português brasileiro para Festival Speech Synthesis.
Scripts para construção automática de vozes.
Sem vozes de outros bancos de dados conhecidos.
Sem stress ao dicionário fonético.

As vozes disponíveis aqui para fazer o download foram construídas usado o método concatenativo "Unit Selection" para obter naturalidade na geração de fala mas em alguns casos podem existir falhas nas geração de algumas frases ou mesmo palavras.

No momento o meu ambiente de desenvolvimento não tem capacidade computacional para tarefas mais grandes como a construção de vozes com o método "Statistical Parametric Speech Synthesis" baseada em modelos HMM e construção de modelo LTS robusto.

Ficarei feliz em receber qualquer apoio disponível para esse projeto. Como correção de problemas, vozes robustas construídas a partir dos métodos citados acima, modelo LTS robusto já compilado ou mesmo financeira.

Os apoiadores terão seus nomes e suas ações mencionadas em novas atualizações.

Muito obrigada por ler até aqui!

To-Do

Aqui será uma lista com os recursos que irão ser implementados. Com o passar das atualizações, os itens serão marcados.

Isso pode sofrer mudanças ao decorrer do tempo.

Tokenização

Aviso: Infelizmente no momento não é possível fazer essas etapas de tokenizacão. Devido a complicações presentes no projeto. Qualquer contribuição referente a essa parte ou demais do projeto serão bem-vinda ao projeto.

Mais recursos serão colocados ao TO-DO com decorrer do tempo. Quando completo as etapas em desenvolvimento ex. Conversão de números em palavras, conversão de emoji em palavras e etc. serão feitas nas atualizações nas vozes presentes do repositório.

Name		Name	Last commit message	Last commit date
Latest commit History 11 Commits
dict		dict
original_files		original_files
scripts		scripts
voices/pieroni/samples		voices/pieroni/samples
vox_files		vox_files
LICENSE.txt		LICENSE.txt
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Tutorial

Sobre dicionário e fonemas usados.

Recados Importantes

To-Do

Tokenização

About

Releases

Languages

License

Pallas1303/FestPB

Folders and files

Latest commit

History

Repository files navigation

Tutorial

Sobre dicionário e fonemas usados.

Recados Importantes

To-Do

Tokenização

About

Topics

Resources

License

Stars

Watchers

Forks

Releases

Languages