산점도란?

다중변수 데이터에서 두 변수에 포함된 값들을 2차원 그래프상에 점으로 표현하여 분포를 관찰할 수 있도록 하는 도구이다. 데이터의 주제를 통계 용어로 변수(variable)라고 하는데, 이러한 변수(=열)들 간 분석을 지원하는 것이 산점도이다.

 

 

 

두 변수 사이의 산점도

wt <- mtcars$wt
mpg <- mtcars$mpg

plot(wt, mpg,
     main='중량-연비 그래프',
     xlab='중량',
     ylob='연비(MPG)',
     col='red',
     pch=19)

# pch
# point의 종류이다. 즉, 점의 모양을 지정한다.

 

 

 

여러 변수들 간의 산점도

vars <- c('mpg', 'disp', 'drat', 'wt')
target <- mtcars[,vars]
head(target)
plot(target, main='Multi plots')

 

 

 

그룹 정보가 있는 2개 변수의 산점도

iris.2 <- iris[,3:4]
levels(iris$Species)
group <- as.numeric(iris$Species)
group
color <- c('red', 'green', 'blue')

plot(iris.2,
     main='Iris plot',
     pch=c(group)
     col=color[group])

legend(x='bottomright',
       legend=levels(iris$Species),
       col=c('red', 'green', 'blue'),
       pch=c(1:3))

# legend() 함수
# 작성된 산점도 위에 범례를 겹쳐 출력할 때 사용한다.

# legend 옵션
# 범례에 표시할 항목을 지정한다.

# levels(iris$Species)
# 품종의 이름을 나타낸다.

+ Recent posts