仅用于组内学习、交流
- 泰坦尼克号乘客生存预测
参考链接:sklearn- 数据预处理
- 使用SVM, LR, GBDT, DT, RF等机器算法完成预测
- 使用网格搜索法对相关参数调优
- 绘制ROC曲线,输出AUC, P, R, F值
- 十折交叉验证
- 词向量
参考链接:word2vec- 文本分词、去停用词
- 利用大规模领域文本训练skip-gram, CBOW词向量模型
- 利用训练好的词向量模型表示文本,并生成pickle文件保存
- 上下文词向量
参考链接:BERT-keras- 利用BERT表示用于分类的文本
- 参考文献
- BiLSTM情感预测
- 参数调优,包括:units,dropout,batch_size等
- 输出classification_report
- 训练过程中准确率和损失值的可视化图
- CNN情感预测
- 参数调优
- 输出classification_report
- 训练过程中准确率和损失值的可视化图
- BiLSTM-CNN情感预测
- 要求同上
- BiLSTM-Attention情感预测
- 应用的attention机制包括self-attention,multi-head attention
- 对应用的注意力机制的文本进行可视化(选做)
- BiLSTM-CRF情感预测
- 要求同BiLSTM
- 参考文献
- 图片分类
- 利用预训练VGG16/19对花卉种类进行分类
- 微调(fine-tune)网络
- 获取中间层输出
- 对不同的卷积层、池化层输出进行可视化
- 图片情感分析
- 参考文献
- 融合文本和图片进行情感识别
- 利用BiLSTM-CRF进行实体识别任务
- MOSI