Skip to content

Commit

Permalink
docs: update README.md
Browse files Browse the repository at this point in the history
  • Loading branch information
awxiaoxian2020 authored Nov 17, 2022
1 parent ec8ccdf commit da454c4
Showing 1 changed file with 10 additions and 1 deletion.
11 changes: 10 additions & 1 deletion README.md
Original file line number Diff line number Diff line change
@@ -1,6 +1,15 @@
# 考研词汇词频排序数据

经统计,在《2023年全国硕士研究生招生考试英语(一)考试大纲词汇表》中要求掌握的词汇共 5530个,根据四六级、考研英语、专四专八约200套试卷文本,按照出现的词频进行排序。单词释义来自百度翻译 API。前 2444 个单词出现 40 次以上,即平均每做 5 套试卷就能遇到一次的这些单词的词义经过了人工的粗略校对。其余单词的词义校对工作尚未有计划进行。异形词(即对考纲当中有多种写法的单词)由于数量庞大,尚未有意愿更新。
经统计,在《2023年全国硕士研究生招生考试英语(一)考试大纲词汇表》中要求掌握的词汇共 5530 个,根据四六级、考研英语、专四专八约 200 套试卷文本,按照出现的词频对词汇表进行排序。

排序使用了词形还原策略,所以与实际试卷呈现略有差异。

单词释义来自百度翻译 API。

前 2444 个单词出现 40 次以上,即平均每做 5 套试卷就能遇到一次的这些单词的词义经过了人工的粗略校对。其余单词的词义校对工作尚未有计划进行。

异形词(即对考纲当中有多种写法的单词)由于数量庞大,尚未有意愿更新。

[vocabulary.json](https://github.com/awxiaoxian2020/NETEMVocabulary/blob/master/vocabulary.json) 中的词义未经人工校对。

本仓库数据基于 [CC BY-NC-SA 4.0](https://creativecommons.org/licenses/by-nc-sa/4.0/) 共享,程序基于 [MIT License](https://github.com/awxiaoxian2020/NETEMVocabulary/blob/master/LICENSE).
Expand Down

0 comments on commit da454c4

Please sign in to comment.