데이터 크게
1) 명목형 data or 순서형 변수: categorical data => factor 형 data
예를 들면 (남, 여), 인종, 등등
예를 들면 (남, 여), 인종, 등등
2) 연속형 data : continuous data => 순서가 있는 순서형 요인(ordered factor) data
예를 들면 온도,
로 구분한다.
연속형 변수를 범주형 변수로 변환해야만 도수분포표, 교차분포표, 카이제곰 검정, 로지스틱회귀분석, 그래프(막대그래프)를 활용할 수 있다.
mydata$BMI_gr <- cut(mydata$BMI, breaks=c(0,18.5,25,Inf),
labels=c("저체중","정상","과체중"), right = FALSE)
# right =true : a<x<=b를 의미, right= false : a<=x<b를 의미.
#include.lowest =true라는 항목 또한 넣을 수 있다. 구성요소 값이 최소값이더라고 변환을 시키게 된다. 이게 햇갈려서
ifelse() 를 사용하게 된다.
mydata$BMI_gr <- transform(mydata$BMI,
labels=c("저체중","정상","과체중"), right = FALSE)
# right =true : a<x<=b를 의미, right= false : a<=x<b를 의미.
#include.lowest =true라는 항목 또한 넣을 수 있다. 구성요소 값이 최소값이더라고 변환을 시키게 된다. 이게 햇갈려서
ifelse() 를 사용하게 된다.
mydata$BMI_gr <- transform(mydata$BMI,
댓글
댓글 쓰기