Neste projeto, utilizei técnicas de reconhecimento de texto para analisar imagens de borboletas geradas com o Microsoft Copilot no Bing. O objetivo foi criar um portfólio que demonstrasse a capacidade de extrair informações úteis de imagens utilizando ferramentas de OCR (Optical Character Recognition).
Para iniciar o projeto, criei quatro imagens decoradas e coloridas de borboletas utilizando o Microsoft Copilot. Essas imagens foram escolhidas por sua diversidade e riqueza visual.
As imagens criadas foram organizadas na pasta insumos
do repositório para facilitar o acesso e o processamento. Cada imagem foi cuidadosamente nomeada para responder aos arquivos de texto resultantes.
Utilizei o Tesseract OCR para extrair texto das imagens. O processo envolve:
-
Instalação e Configuração: Instalei o Tesseract OCR e a biblioteca
pytesseract
no meu ambiente Python, e configurei o caminho do Tesseract no sistema. -
Processamento das Imagens: Criei um script Python que carregou as imagens da pasta
inputs
, aplicou o Tesseract OCR para extrair o texto e salvou os resultados em arquivos de texto na pastaoutput
. -
Salvamento dos Resultados: Os arquivos de texto resultantes serão armazenados na pasta
output
, com cada arquivo correspondente ao texto extraído de uma imagem.
Atualizei o README.md
para documentar o processo completo. O README inclui proteção das imagens, do processo de reconhecimento de texto e links para os arquivos de texto na pasta output
.
-
Importância do Pré-processamento: O pré-processamento das imagens, como ajuste de contraste e conversão para tons de cinza, pode melhorar significativamente a precisão do OCR.
-
Desafios com Imagens Complexas: Imagens com detalhes complexos e variados núcleos podem apresentar desafios para o OCR, exigindo ajustes adicionais para obter melhores resultados.
-
Práticas Aplicações do OCR: O reconhecimento de texto em imagens é útil em diversas aplicações, como digitalização de documentos e remoção de dados para projetos de aprendizado de máquina.
- **
inputs/
** : Contém as imagens utilizadas no projeto. - **
output/
** : Contém os resultados do reconhecimento de texto, com cada arquivo de texto correspondendo a uma imagem.
- [ Microsoft Copilot ] ( https://www.bing.com/covid ) - Ferramenta usada para criar as imagens.
- [ Tesseract OCR ] ( https://github.com/tesseract-ocr/tesseract ) - Biblioteca de reconhecimento de texto utilizada.
Este texto fornece uma visão clara e organizada do projeto, descrevendo os passos que podem ser seguidos e os insights adquiridos.