Skip to content

Segunda fase do projeto PO-NER. Treinaremos modelos para extração de entidades nos datasets Harem para aprender sobre extração de entidades na lingua portuguesa.

Notifications You must be signed in to change notification settings

gdutramartins/po-ner-2-portuguese-ner

Repository files navigation

Pós Graduação PUC/RJ BI-Master - Outubro de 2021

Named Entity Recognition com BERT para Reconhecimento de Entidades nas Politicas Operacionais do BNDES

Projeto Final de Curso - Entrega 2: Named Entity Reconigtion com BERT nos Datasets Harem

Esse repositório é o segundo de uma série de estudos onde tentaremos construir um modelo NER (Named Entity Recognition) para identificação de entidades relevantes nas circulares publicadas pelo BNDES para disponibilizar atualizações em suas Políticas Operacionais (PO).

A missão da segunda fase é preparar um dataset em português para treinamento (fine tunning) e teste, além de estudar e testar modelos BERT disponíveis em português sobre nosso dataset Harem.

Tópicos abordados nessa fase:

  • Pré-processamento da base Harem.
  • Estudo modelos BERT português.
  • Fine tunning modelos para o dataset Harem.

Temos como objetivo criar um artigo na plataforma Medium a cada fase finalizada do projeto.

Links

About

Segunda fase do projeto PO-NER. Treinaremos modelos para extração de entidades nos datasets Harem para aprender sobre extração de entidades na lingua portuguesa.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published