Skip to content

Detector Reconocedor de Patentes en tiempo real (Cámaras IP o videos) utilizando Redes Neuronales Convolucionales con soporte a MySQL

License

Notifications You must be signed in to change notification settings

PecceG2/ConvALPR-MySQL

 
 

Repository files navigation

ConvALPR (Con soporte MySQL/MariaDB)

Este proyecto es un fork del original de ankandrew para soportar bases de datos relacionales MySQL/MariaDB; todos los créditos a el autor original

Alt Text

ConvALPR es un Reconocedor Automatico de Patentes Vehiculares, que utiliza Redes Neuronales Convolucionales. A diferencia de metodos tradicionales, este approach puede reconocer patentes con obstrucciones/diferencia de brillo/letras borrosas, etc. ConvALPR consiste de dos procesos: localizar (detector de objetos) y reconocedor (Reconocimiento Optico de Caracteres). Ambas usan solamente Redes Convolucionales/ConvNets/CNNs.

Proceso ALPR

Localizador

Demo yolo v4 tiny

Para el localizador se usa yolo v4 tiny, para lograr que el detector corra en tiempo real. Este detector de objetos se entreno con patentes (ni una sola de Argentina) aun asino tiene problemas en localizarlas con alta precision. Mas detalles de entrenamiento del detector aca. Se convirtieron los parametros de framework Darknet a TensorFlow usando este repo.

En este repo se pueden encontrar 3 versiones del localizador de patentes, misma arquitectura (yolo v4 tiny sin spp), pero con distinta resolucion de entrada. Los modelos usan res. de entrada de {384x384, 512x512, 608x608}, donde a mayor la resolucion mayor es la precision (y puede detectar mejor patentes alejadas) pero mayor es el tiempo de inferencia (es mas lento). Estos modelos se encuentran alpr/models/detection

Reconocedor (ROC/OCR)

Demo yolo v4 tiny

Para el reconocedor de caracteres OCR de las patentes, se diseñaron unos modelos personalizados en TensorFlow Keras.

En este repositorio se pueden encontrar los mismos modelos que aca. Estos modelos se pueden encontrar tambien en alpr/models/ocr, y los modelos que tienen _CPU al final esta mejor optimizados para CPU y corren mas rapido en el procesador.

Como usarlo

Instalar dependencias

Con python 3.x:

pip install -r requirements.txt

Para correr con la placa de video/GPU y acelerar la inferencia, instalar estos requerimientos.

Visualizar solo localizador

Para probar el localizador/detector de patentes (sin OCR, solo los bounding boxes) y visualizar las predicciones se usa el comando:

python detector_demo.py --fuente-video /path/a/tu/video.mp4 --mostrar-resultados --input-size 608

Intenta con los distintos modelos {608, 512, 384} para ver cual se ajusta mejor a tu caso

Reconocedor Automatico

Config

La configuracion del ALPR se puede encontrar en config.yaml. Este contiene los ajustes del Reconocedor y Localizador. Las distintas opciones estan descriptas en el mismo archivo (que hacen). El modelo de OCR es independiente del detector de objetos, y cualquiera deberia funcionar bien con cualquiera. Ejemplo para correr en la CPU y priorizar velocidad, se puede elegir el modelo 3 o 4 y el detector 384. Si se prefiere mayor precision se puede elegir el detector con res. de entrada 608 y OCR 1 o 2.

Ejemplo visualizar ALPR

python reconocedor_automatico.py --cfg config.yaml --demo

Guarda en Base de Datos sin visualizar

python reconocedor_automatico.py --cfg config.yaml

Visualizar prediccion de imagen y mostras FPS

En el archivo de config en la fuente poner una imagen. Luego

python reconocedor_automatico.py --cfg config.yaml --imagen --benchmark

Python API

Para usarlo en tu proyecto podes leer de config o cread un dict, es lo mismo:

Forma #1 (cfg)

from alpr.alpr import ALPR
import cv2
import yaml

im = cv2.imread('imgs/prueba.jpg')
with open('config.yaml', 'r') as stream:
    cfg = yaml.safe_load(stream)
alpr = ALPR(cfg['modelo'], cfg['db'])
predicciones = alpr.predict(im)
print(predicciones)

Forma #2 (dict)

from alpr.alpr import ALPR
import cv2

im = cv2.imread('imgs/prueba.jpg')
alpr = ALPR(
    {
        'resolucion_detector': 512,
        'confianza_detector': 0.25,
        'numero_modelo_ocr': 2,
        'confianza_avg_ocr': .4,
        'confianza_low_ocr': .35
    },
    {
        'guardar': True,
        'insert_frequency': 5,
        'path': 'test_db/plates_asd.db'
    }
)
predicciones = alpr.predict(im)
print(predicciones)

Notas

  • Aclaracion: Si bien el localizador funciona para patentes de cualquier pais el reconocedor actual esta hecho especialmente para Argentina, si queres entrenar uno personalizado

  • Este trabajo forma parte de un proyecto integrador para la Universidad

  • Aclaración del fork MySQL: Mis conocimientos sobre Python es nulo, el soporte a MySQL se agregó sobre el proyecto original as-is. Mejoras sobre el código son totalmente bienvenidas. Con respecto a la solución de errores en caso de que surjan, intentaré hacer todo lo posible.

TODO

  • Ampliar modelos OCR
  • Compilar para EdgeTPU
  • Quantizar a FP16
  • Quantizar a INT8
  • Optimizar
  • Aumentar batch de OCR

About

Detector Reconocedor de Patentes en tiempo real (Cámaras IP o videos) utilizando Redes Neuronales Convolucionales con soporte a MySQL

Topics

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages

  • Python 100.0%