Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

请教怎么build转字不转词的版本 #4

Open
faajaudai opened this issue May 16, 2023 · 3 comments
Open

请教怎么build转字不转词的版本 #4

faajaudai opened this issue May 16, 2023 · 3 comments

Comments

@faajaudai
Copy link

你好!
现在需求是譬如原文“请你吃内存”,我想转成“請你吃內存”
目前的两个版本字体,非TW版本会转成“請你喫內存”,TW版本会转成“請你吃記憶體”
就是我想要TW或者HK版本的异体字标准,但是只针对字转,不转地域用词
issue

不会看python,硬着头看了一下感觉应该是要改setup.py那里,但想下手修改还是有点摸不准怎么引用opencc
只好过来提issues,看看能不能抽空帮忙改一下代码build一个?

@ayaka14732
Copy link
Owner

默认就是不转词的:
https://github.com/ayaka14732/OpenCCFontGenerator/blob/61bcf3ae90e1971aba86904269d8ac2387969eb9/src/OpenCCFontGenerator/__main__.py#LL19C1-L20C121

如果在命令行指定 --twp,就会转词,不指定就不会

@faajaudai
Copy link
Author

默认就是不转词的: https://github.com/ayaka14732/OpenCCFontGenerator/blob/61bcf3ae90e1971aba86904269d8ac2387969eb9/src/OpenCCFontGenerator/__main__.py#LL19C1-L20C121

如果在命令行指定 --twp,就会转词,不指定就不会

但是默认的情况下是用opencc的异体字习惯,比如“吃”会转成“喫”,如果是用TW习惯,就还是会保留作“吃”
事实也不是“保留”,我看了感觉大概opencc是一个中间层,就是s2t
再在t2tw的时候,在TWVariants里面,再二次转换把“喫”变回了“吃”

所以现在有一个问题,就是如果我不加—twp选项,转出来的异体字用字是比较古典用法,而不是现时比较通俗流行的用法
加了—twp选项,他的异体字用字是我想要的比较通俗流行的用法,但是他的用词也区域化,比如“内存”变成了“記憶體”

那能不能实现比如说一个—twv的选项,只进行variants的转换,不进行后面phrases的转换这样

@ayaka14732
Copy link
Owner

好像確實有這個問題,目前看來只能手動修改詞庫解決

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

2 participants