Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

CJK编码区291字笔顺存疑 #16

Open
CNMan opened this issue Sep 29, 2018 · 5 comments
Open

CJK编码区291字笔顺存疑 #16

CNMan opened this issue Sep 29, 2018 · 5 comments

Comments

@CNMan
Copy link

CNMan commented Sep 29, 2018

详细列表见 CNMan/UnicodeCJK-WuBi#6

@leo-liu
Copy link
Owner

leo-liu commented Sep 30, 2018

我知道有这种问题。更进一步,甚至有 Unihan 的笔画数数据与海峰五笔不一致的。
一方面是有新旧字形造成的不一致(特别是笔画数不同);另一方面笔顺本身也有分歧,规范很难做;还有一部分是可以明显看出的错误。
目前暂时是按海峰五笔的数据做的。因此数据量比较大,我个人无力一一核对。

@CNMan
Copy link
Author

CNMan commented Sep 30, 2018

CJK 编码区前20902字国家有三个笔顺相关规范,这291个就是这里面的,其他字没有问题。扩展A/B目前无规范。
《GB13000.1字符集汉字笔顺规范》(GF3002-1999)
《GB13000.1字符集汉字字序(笔画序)规范》(GF3003-1999)
《GB13000.1字符集汉字部首归部规范》(GF0012-2009)

@leo-liu
Copy link
Owner

leo-liu commented Sep 30, 2018

有数据来源的话,我下一版就以 GF3002 的数据优先。

@CNMan
Copy link
Author

CNMan commented Sep 30, 2018

其实我不知道你这项目是干什么用的,找超大字符集笔顺发现Ctan仓库里的扩展A/B的数据,进而发现源在这里:)
数据可以直接用1楼链接里的第三列,那人是根据三个规范整理的,过程也比较仔细,应该没有什么问题。

@CNMan
Copy link
Author

CNMan commented Oct 31, 2018

C/D/E/F编码区的笔顺也加上了,由 华宇拼音输入法论坛xml00和sanwsw两位整理。

A/B 编码区的笔顺和原海峰版也做了下比对,记录如下:

CJK-A编码区两个来源笔顺数据不同的字
CNMan/UnicodeCJK-WuBi#9

CJK-B编码区两个来源笔顺数据不同的字
CNMan/UnicodeCJK-WuBi#8

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

2 participants