Skip to content

Latest commit

 

History

History
60 lines (40 loc) · 2.51 KB

README.md

File metadata and controls

60 lines (40 loc) · 2.51 KB

Vosk_ReconocimientoDeVoz

Este proyecto se realizó como una prueba para evaluar el funcionamiento del modelo VOSK en el reconocimiento de voz. El modelo VOSK es una poderosa herramienta de código abierto que permite la transcripción de audio a texto en tiempo real.

VOSK

Grupo GEO.VOICE-TECH

Este proyecto está a cargo del grupo GEO.VOICE-TECH, que se enfoca en desarrollar aplicaciones y sistemas donde el reconocimiento de voz es fundamental para la toma de notas por parte de personas que no pueden escribir durante el trabajo de campo.

GEO

Instalación

Para ejecutar este código y probar el reconocimiento de voz con VOSK, sigue estos pasos:

  1. Clonar el repositorio

    git clone https://github.com/DiegoFernandoLojanTN/Vosk_ReconocimientoDeVoz.git
    cd Vosk_ReconocimientoDeVoz
  2. Crear un entorno virtual

    python -m venv venv
    source venv/bin/activate # En Windows usa venv\Scripts\activate
  3. Instalar las dependencias

    pip install -r requirements.txt
  4. Preparar el modelo VOSK

  • Crea en la raíz del proyecto una carpeta llamada ASSETS/Vosk.
  • Descarga el modelo de VOSK desde este enlace y extrae los archivos dentro de la carpeta ASSETS/Vosk.

Código

El proyecto consta de dos archivos principales:

  • vosk_recog.py: Este script configura el modelo de reconocimiento de voz y procesa el audio de entrada, transcribiéndolo a texto.
  • app.py: Este script es el punto de entrada del proyecto. Inicia el reconocimiento de voz y muestra las transcripciones en tiempo real.

Demostracion

Demostracion

Proyectos Relacionados

Además de este proyecto, estamos desarrollando una interfaz web que puede ser encontrada en el siguiente repositorio:

También estamos trabajando en una aplicación para Android que utiliza una versión más ligera del modelo VOSK, diseñada específicamente para dispositivos móviles: