百度aistudio 2020 事件抽取赛道

update on 2020.07.09 优化了gen_kfold_data.py，重构了代码，能够生成event type分类任务的数据index_type_fold_data_{}，以及role extraction阶段任务的数据verfify_neg_fold_data_{}，注意所有文件的对应路径要与自己在config中配置的相同。另外，neg_fold_data_{}为之前老版本的数据存储格式，与verify_neg_fold_data_{}是一样的，可以一样使用

依赖包：主要是tensorflow 1.12.0,另外使用了bojone的bert4keras，详见https://github.com/bojone/bert4keras

，其余见requirements.txt

目前主要集中使用机器阅读理解的方式来尝试解决事件抽取任务。主要分为两个阶段：

1、事件类型抽取

2、事件论元抽取，使用MRC的方式来做。

具体内容见知乎文章。

项目主体来自于本人另一个repo，使用MRC做实体识别，具体可参考https://github.com/qiufengyuyi/sequence_tagging

最终使用Retro-reader方法，在test1.json上的分数为0.856，使用了roberta-large-wwm.

对于roberta-wwm-base,分数为0.851.

生成k-fold训练数据：

根据不同阶段，生成两个阶段的k-fold训练数据，具体可参考gen_kfold_data.py

事件类型抽取：

bash run_event_classification.sh

baseline事件论元抽取：

bash run_event_role.sh

RetroReader-EAV问题是否可回答模块：

bash run_retro_eav.sh

RetroReader-精读模块：

bash run_retro_rolemrc.sh

Name		Name	Last commit message	Last commit date
Latest commit History 13 Commits
bert		bert
configs		configs
data/slot_pattern		data/slot_pattern
data_processing		data_processing
models		models
LICENSE		LICENSE
README.md		README.md
common_utils.py		common_utils.py
event_predict.py		event_predict.py
gen_kfold_data.py		gen_kfold_data.py
optimization.py		optimization.py
requirements.txt		requirements.txt
run_event.py		run_event.py
run_event_classification.sh		run_event_classification.sh
run_event_role.sh		run_event_role.sh
run_retro_eav.sh		run_retro_eav.sh
run_retro_rolemrc.sh		run_retro_rolemrc.sh
train_helper.py		train_helper.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

百度aistudio 2020 事件抽取赛道

生成k-fold训练数据：

事件类型抽取：

baseline事件论元抽取：

RetroReader-EAV问题是否可回答模块：

RetroReader-精读模块：

About

Releases

Packages

Languages

License

qiufengyuyi/event_extraction

Folders and files

Latest commit

History

Repository files navigation

百度aistudio 2020 事件抽取赛道

生成k-fold训练数据：

事件类型抽取：

baseline事件论元抽取：

RetroReader-EAV问题是否可回答模块：

RetroReader-精读模块：

About

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages