Este proyecto es un transformador de video a texto que utiliza bibliotecas como moviepy
, SpeechRecognition
y pydub
para convertir un archivo de video en un archivo de texto. El flujo principal consiste en extraer el audio del video, dividir el audio en fragmentos de 60 segundos, y luego transcribir cada fragmento a texto.
- Extrae el audio de archivos de video utilizando
moviepy
. - Divide el audio en fragmentos de 60 segundos para ajustarse a las limitaciones de la API gratuita de
SpeechRecognition
. - Transcribe cada fragmento de audio a texto utilizando la API de Google.
- Guarda el texto transcrito en un archivo
.txt
.
Este proyecto utiliza las siguientes bibliotecas de Python:
- moviepy - Para extraer el audio de los archivos de video.
- SpeechRecognition - Para la transcripción del audio a texto.
- pydub - Para dividir el audio en fragmentos de 60 segundos.
Primero, clona este repositorio en tu máquina local:
git clone <https://github.com/jmatias2411/Video_to_Text_Transformer.git>
cd Video_to_Text_Transformer
Luego, instala las dependencias necesarias utilizando pip
:
pip install moviepy SpeechRecognition pydub
Nota: Asegúrate de tener instalado FFmpeg, ya que es necesario para que moviepy y pydub funcionen correctamente.
Para instalar FFmpeg
, puedes seguir las instrucciones de instalación del sitio web oficial o, en sistemas basados en Debian (como Ubuntu), puedes usar el siguiente comando:
sudo apt-get install ffmpeg
Si deseas contribuir a este proyecto, no dudes en hacer un fork y enviar una pull request. Cualquier contribución es bienvenida.
Este proyecto está bajo la licencia MIT. Consulta el archivo LICENSE para más detalles.