使用 R 并运用探索性数据分析来探索一个变量或多个变量之间的关系,以及在一个选定的白葡萄酒数据集中探索分布、异常值和反常现象。
为完成项目,我将做以下操作:
1.了解变量的分布并检查异常和异常值
2.通过使用适当的图表如散点图、直方图、条形图和箱图学会量化和可视化数据集的各个变量
3.在构建预测模型之前,探究变量来辨别数据集中最重要的变量和关系,计算他们的相关性,并调查条件均值
4.运用ggplote2绘图方法和可视化手段来检查多个变量之间的关系,例如重新构造数据框架和使用通过颜色和形状来发现更多信息
该项目要做的事:
1、使用R语言对白葡萄酒数据集进行数据探索。
2、使用ggplot2探索一个变量或多个变量之间的关系,并将分析过程记录形成报告。