bert-ner-japanese

BERTによる日本語固有表現抽出のファインチューニング用プログラム

使用方法

パッケージのインストール

requirements.txtに書かれているパッケージをインストールします。

学習用データのダウンロード

stockmarkteam/ner-wikipedia-datasetから学習用データセット（ner.json）をダウンロードし、リポジトリ直下のdatasetディレクトリに保存します。

BERT入力データの作成

create_tagged_token.pyを実行して、ダウンロードした学習用データを、BERTの入力データの形式に変換します。作成されたデータは、dataset/ner_tagged.jsonに出力されます。

学習の実行

train.pyを実行して、ファインチューニングを行います。学習済みのモデルは、modelディレクトリに出力されます。

テスト

test.pyを実行して、固有表現が抽出できることを確認して下さい。

Name		Name	Last commit message	Last commit date
Latest commit History 6 Commits
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
create_tagged_token.py		create_tagged_token.py
label.py		label.py
requirements.txt		requirements.txt
test.py		test.py
train.py		train.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

bert-ner-japanese

使用方法

パッケージのインストール

学習用データのダウンロード

BERT入力データの作成

学習の実行

テスト

About

Releases

Packages

Languages

License

jurabiinc/bert-ner-japanese

Folders and files

Latest commit

History

Repository files navigation

bert-ner-japanese

使用方法

パッケージのインストール

学習用データのダウンロード

BERT入力データの作成

学習の実行

テスト

About

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages