This repository has been archived by the owner on Jan 21, 2024. It is now read-only.
-
Notifications
You must be signed in to change notification settings - Fork 0
/
Copy pathLab5_CorrelationAnalysis.R
80 lines (56 loc) · 3.16 KB
/
Lab5_CorrelationAnalysis.R
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
x <- c(1, 2, 6, 8, 9, 7, 7.5, 10, 3, 4, 5.5)
y <- c(2, 4, 11, 15, 19, 16, 14, 23, 7, 6, 11)
plot(x, y) #диаграмма рассеяния
cor(x, y) #коэффициент корреляции
cor(x, y, use = "complete.obs") #коэффициент корреляции, если есть NA в выборке
cor(x, y, method = 'spearman') #коэффициент корреляции Спирмена
cor.test(x, y) #проверка гипотезы о значимости парного коэффициента корреляции
cor.test(x, y, method = 'spearman') #проверка гипотезы о значимости коэффициента корреляции Спирмена
cor.test(x, y, method='kendall') #проверка гипотезы о значимости коэффициента корреляции Кэнделла
install.packages("Hmisc")
library(Hmisc)
df <- read.csv(file.choose(), header = TRUE, sep = ",")
df <- na.omit(df)
d <- df[3:ncol(df)-1]
plot(d$mstat, d$econ, xlab = "Матстатиска", ylab = "Экономика") #диаграмма рассеяния более сложная
plot <- ggplot(d, aes(d$mstat, d$econ)) + geom_point(aes()) #диаграмма рассеяния ещё более сложная
rcorr(as.matrix(d)) #корреляционная матрица и значимость коэффициентов в ней
#коррелограмма
install.packages("ggplot2")
install.packages("car")
install.packages("gclus")
install.packages("corrplot")
install.packages("corrgram") #пакет с коррелограммами
install.packages("gplots")
install.packages("ggm")
install.packages("ellipse")
library(ggplot2)
library(car)
library(gclus)
library(corrplot)
library(corrgram)
library(gplots)
library(ggm)
library(ellipse)
scatterplotMatrix(d) #матрица диаграмм рассеяния (graph matrix), у которой на диагонали гистограммы для соответствующих переменных
require(corrgram)
corrgram(d, order=TRUE, lower.panel=panel.shade, upper.panel=panel.pie, text.panel=panel.txt)
corrplot(cor(d), "pie", "lower")
corrplot(cor(d))
corrplot(cor(d), method="color", diag=FALSE)
corrplot(cor(d), method="number", diag=FALSE)
plotcorr(cor(df))
#таблица сопряжённости и критерий Хи-квадрат
install.packages("descr")
library(descr)
guitar <- c(31, (100-31))
bag <- c(9, (100-9))
guitar_exp <- rbind(guitar, bag)
#проверка независимости двух переменных с помощью таблицы сопряженности
chisq.test(guitar_exp) #критерий Хи-квадрата
fisher.test(guitar_exp) #точный тест Фишера
mosaicplot(guitar_exp, shade = TRUE)#результат графически (таблица сопряженности)
#построение таблиц сопряженности из сырых данных
table(mtcars$cyl, mtcars$am)
table(Number_of_cylinders=mtcars$cyl, Transmission=mtcars$am)
crosstab(mtcars$cyl, mtcars$am, format = "SPSS", expected = TRUE)