This repository has been archived by the owner on Sep 26, 2022. It is now read-only.

基于 SVM 的细粒度情感分析

项目背景(赛题内容)

官方给出的数据集共包含6大类20个细粒度要素的情感倾向。根据标注的细粒度要素的情感倾向建立算法，对用户评论进行情感挖掘。

说明

由于数据量较大, 在框架上采用 liblinear 而不是 libsvm, 通过预处理等操作后单模计算 marco F1 score, 验证集上的预测评分最高为 0.53274.

由于数据集文件较大, 不适合通过 git 提交, 部分数据集为内容截取. 因此直接执行时会报错, 补全训练集数据后才可正常执行.

配置环境

Intel Xeon E5-2680 v4
64 GB RAM

后续方向

SVM 调优
BERT
RNN+ATT
...