掌握CV常见模型,实现简单的图像分类。
-
整理CV常用知识的说明文档:CNN、GAN、ResNet、ViT、Diffusion,Lora等(CV经典模型很多,适当了解一些即可)
-
图像分类项目 Leaf Disease Classification
- 基于pytorch设计一个方案并完成预测。
- 在比赛的提交方案中,阅读并总结三种不同的可行方案,以此熟悉常见的图像分类方法。
- 若完成难度较大,可换为手写字识别项目 MNIST。
-
多模态项目(NLP&CV) Product Matching
- (选做)基于pytorch设计一个方案并完成预测。
- 在比赛的提交方案中,阅读并总结一种可行方案,以此了解多模态情景下的模型构建。
此三周的项目都选于Kaggle比赛,旨在熟悉算法的思想和用例,不过多追求准确率。若数据量过多导致训练速度慢,可适当减少数据。