Skip to content

AI solution that analyses thousands of typewritten documents in order to solve forced disappearances in Mexico.

License

Notifications You must be signed in to change notification settings

andrea-liliana/gato-encerrado-Hackathon-RIIAA

 
 

Repository files navigation

Hackathon-RIIAA-2021 "JusticIA para los desaparecidos"

Extracción de texto

Nombre del equipo: Gato Encerrado

Integrantes

Rebeca Angulo Rojas Rebeca98

Javier Carrillo Martínez Javcm

Rolando Corona Jiménez rolandocj

María Andrea Liliana Gómez Herrera andrea-liliana

Tulio Pérez Ortega tulio2

Pipeline

  1. Obtener los datos (imágenes)
  2. Preprocesamiento de imágenes: segmentación, rotación y aplicación de filtros a la imagen
  3. Extracción y almacenamiento del texto generado
  4. Procesamiento de texto: extracción de entidades y almacenamiento de resultados

Cómo correr el código

  1. Instalación previa de paquetes necesarios para python requierements.txt
  2. Ejecutar el ipynb implementacion_preprocesamiento_extraccion.ipynb. Dentro del notebook vienen las instrucciones para importar las respectivas librerías.

Entregables por reto

Las bases de datos correspondientes al reto 2A y 2B se encuentran en este repositorio como reto_2A_extraccion.csv y reto_2b_entidades_identificadas.csv.

Notas

Esta actualización corresponde a la implementación final.

About

AI solution that analyses thousands of typewritten documents in order to solve forced disappearances in Mexico.

Topics

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages

  • Jupyter Notebook 96.9%
  • Python 3.1%