鸣谢

本项目基本参考@letiantian大神的Pinyin2Hanzi作品，详情可以点击查看

安装

安装和使用方法参考Pinyin2Hanzi

示例

from MHPinyin2Hanzi import DefaultHmmParams
from MHPinyin2Hanzi import viterbi

hmmparams = DefaultHmmParams()

# 2个候选
pinyin = (
   "si","dao","luan","le","ma","xiong","hai","zi")

result = viterbi(hmm_params=hmmparams, observations=pinyin,
                 path_num=2)

print(pinyin)
for item in result:
    print(item.score, item.path)

输出

('si', 'dao', 'luan', 'le', 'ma', 'xiong', 'hai', 'zi')
5.950955778865384e-20 ['是', '捣', '乱', '了', '吗', '熊', '孩', '子']
1.7656844345456464e-20 ['是', '捣', '乱', '了', '嘛', '熊', '孩', '子']

更多示例见example

训练

原始数据和训练代码在train目录下。数据来自jpinyin、pinyin、搜狗语料库-互联网词库等。处理数据时用到了汉字转拼音工具ChineseTone。

原理

在如何实现拼音与汉字的互相转换的基础上，我们将常见易发错的拼音作为多音字用于模型训练,见train下processTrain.py

License

MIT

Name		Name	Last commit message	Last commit date
Latest commit History 1 Commit
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

鸣谢

安装

示例

训练

原理

License

About

Releases

Packages

mokundong/MHPinYin2Hanzi

Folders and files

Latest commit

History

Repository files navigation

鸣谢

安装

示例

训练

原理

License

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Packages