- debug.py 用来做一些简单的功能和测试。
- sep_and_combine.py 对大文件进行切分和聚合,减少每次执行的时间成本。
- correctness_check.py 文件正确性校验。由于某些不规范文本内会有
@xxx = ~ 111 222~ 333~
这种形式的句子,所以存在误报情况。 - merge_file.py 对将多个文件合并入 master 文件,并输出为新文件。
- ctnt_search.py 提供对目标内容的搜索功能,并将搜索结果导出文件。格式为:
filename | pattern | line_num | content
文件名 | 匹配字符串 | 行号 | 该行内容
ctnt_search 支持批量替换功能。在搜索结果的 output/search.txt 文件中,删除不想替换的行,保留想替换的行,执行命令 python3 ctnt_search.py -r "要替换的内容""
即可完成对这部分结果的替换。
如果要替换为 ''
,则需要命令 python3 ctnt_search.py -d
- compare_enzh.py 对搜索关键字的原文和译文进行比较。使用方法
python3 compare_enzh.py -s "关键字"
,搜索结果放在 output/compare.txt 中,格式为
原文文件路径
原文
译文
使用这个工具可以快速查找一个关键字在所有文件中的翻译是怎样的,进行比对,便于快速定位不同的翻译结果。
- collect_keywords.py 提取关键字,输出为
keyword.txt
文件 - multi_version_comp.py 文件版本对比,能够对比文件数量差异、文件实际行数差异、标注差异行、输出对比结果文件
version_comp.txt
。 - cfg.py 基于控制台直接对
appconf.ini
文件进行修改 - rg_replace.py 一个基于
ripgrep
搜索结果的替换程序。虽然ripgrep
本身自带替换功能,但是它无法做出精细的筛选。所以需要配合其他工具来完成选择和替换。将ripgrep
工具的搜索结果进行替换。 - takeout_sp_words.py 提取目录下所有文件的以大写字母开头的关键字,并对一些常用关键字进行过滤。
- sp_files_dispatch.py 多人协作时,基于公平原则的工作量统计和分配。其中系数保证了中文要折算成多少行英文。基于已经拆分好的文件进行分配。