Named Entity Recognition com BERT para Reconhecimento de Entidades nas Politicas Operacionais do BNDES
Esse repositório é o segundo de uma série de estudos onde tentaremos construir um modelo NER (Named Entity Recognition) para identificação de entidades relevantes nas circulares publicadas pelo BNDES para disponibilizar atualizações em suas Políticas Operacionais (PO).
A missão da segunda fase é preparar um dataset em português para treinamento (fine tunning) e teste, além de estudar e testar modelos BERT disponíveis em português sobre nosso dataset Harem.
Tópicos abordados nessa fase:
- Pré-processamento da base Harem.
- Estudo modelos BERT português.
- Fine tunning modelos para o dataset Harem.
Temos como objetivo criar um artigo na plataforma Medium a cada fase finalizada do projeto.