Skip to content

liangzihao8301/AI-programs

Repository files navigation

AI-programs

AI 小项目代码、笔记

包含:

1、基于 TFIDF 的 KMeans 的文本聚类:使用TFIDF进行Word2Vec,通过Kmeans算法进行非监督学习,对文本进行自动分类;使用手肘法选择聚类簇的数量。
2、使用kmeas 算法规划全国能源中心:根据各城市的经纬度坐标计算两点的地理距离,利用Kmeans原理,计算出N个质心位置作为能源中心的选址。
3、男女声音识别:男女声音采样的结构化数据,分别使用LR、SVM、XGB、deepfm进行识别学习,验证集准确率达97%以上;其中SVM、XGB效果较佳,准确率接近98%。
4、使用决策树对优惠券使用情况做出预测:预测用户领取的优惠价是否会被使用。数据集特征少、呈现不均衡分布,通过特征工程增加特征,设置样本权重,提高模型的性能,验证集准确率73%
5、Bagging-vs-Boosting:利用mnist数据集,试验Bagging、Boosting(AdaBoost)、RandomForest、GBDT的集成学习效果。对比了用LR、DecisionTree作为基础分类器的效果,逻辑回归相对来说泛化能力更好,决策树更容易过拟合。
6、CIFAR-10图像分类:基于Pytorch框架的CV 分类,使用多层神经网络,对图像进行多分类,效果一般,可以使用CNN改进。