単語分割を経由しない単語埋め込み手法 segmentation-free word embeddings (sembei) [1] の Python 実装. この実装では,行列分解に基づく単語埋め込み手法 eigenwords (OSCCA) [2] をベースにしている.
git clone https://github.com/shimo-lab/sembei
cd sembei
python setup.py build && python setup.py install
./sample_code/
のファイルを参照.
- anaconda3 (>=4.2.0)
- 押切 孝将, 下平 英寿. 単語分割を経由しない単語埋め込み. 言語処理学会第23回年次大会論文集, pp.258-261. 言語処理学会, 2017年3月.
- Dhillon, P. S., Foster, D. P., and Ungar, L. H. (2015). Eigenwords: Spectral word embeddings. Journal of Machine Learning Research, 16:3035–3078.