기본 콘텐츠로 건너뛰기

t_test; in r

t-test의 종류
1. 독립표본 t-test : 서로다른 두개의 그룹간 평균 비교.
 : 남자와 여자간 소득 차이 비교

2. 대응표본 t-test : 하나의 집단에 대한 비교
 : 과외를 하기 전과 후의 반 학생들의 성적 변화

3. 단일 표본 t-test : 특정 집단의 평균이 어떤 숫자와 다른지, 같은지를 비교.


t-test를 실행하기 전 조건
 - 두개의 집단에 대한 t-test를 실시하기 위해서는 등분산성, 정규성이 만족되어야 합니다.
 - 정규성의 경우 일반적으로 관측갯수가 30개 이상일 때 만족한다.
 - 등분산성을 확인하기 위해서는 var.test 라는 함수를 사용해야한다.

예)
var.test(dbp1 ~ walk_yn, data=mydata)

# 다음과 같이 mydata에 있는 walk_yn에 의해서 그룹이 나누어진 dbp1의 인자들을 등분산성을 평가 한다.

F = 1.2665, num df = 241, denom df = 118, p-value = 0.1484 
# 으로 나왔다고 가정했을 때  p-value가 0.1484가 0.05 보다 크기 때문에 귀무가설을 만족하지 않은다. 따라서 두집단의 분산은 같다고 볼 수 있다. 따라서 t-test를 할 수 있는 조건을 만족한다.

독립표본 t-test(independent two sample t-test)


 1. data import, head,data.frame, tail,str등을 통해서 data가 잘 load되었는지 확인 할 것.
 2. 우선 등분산성 검증 : p-value가 0.05 보다 큰지 두 그룹간의 등분산성이 만족한지 확인.
  - var.test함수 사용.
 3. t.test를 활용하여 분석진행.
  - 유형 1 문법 : t.test(group1의 관측치, group2의 관측치, t-test의 유형, 신뢰범위)
  - 유형 2 문법 : t.test(관측치~집단구분의기준, 데이터프레임(main data),t-test의 유형, 신뢰범위 )
  유형1

  유형2
  t.test(dbp1 ~ walk_yn, alternative = "two.sided", mu=0,paired=FALSE, var.equal=TRUE, conf.level = 0.95, data=mydata)


대응표본 t-test(Paired sample t-test) 

: 동일 그룹 전 후 차이 비교
 주의점 : 대응 표본은 실험 전-후 비교하는 것이기 때문에 입력하는 관측치의 수가 반드시 같아야 한다.



단일표본 t-test(one sample t-test)


 단일 표본 t-test는 하나의 집단의 평균이 특정기준보다 유의미하게 나른지 큰지를 알아보는 것.
 문법 :  t.test(관측치, alternative = 판별 방향, mu=특정기준, conf.level = 신뢰수준)
 alternative는 "greater","less","two.sided"가 있다.






댓글

이 블로그의 인기 게시물

Kernel Density Estimation(커널밀도추정), Density plot in R

 Kernel Density Estimation(커널밀도추정) Density Estimation(밀도추정)  : 통계란, 데이터는 어떤변수가 가질 수 있는 다양한 가능성 중에 하나가 현실 세계에 구체화된 값이다. 그리고 우리는 그 변수의 성질을 파악하기위해서 부단히 노력을 한다. 하나의 데이터로 특성을 파악하기에는 어렵기 때문에 수많은 데이터를 이용해서 데이터의 특성을 파악하고자 노력을 한다. 이렇게 얻어진 데이터를 이용해서 데이터들의 분포로 부터 원래변수의 분포특성을 추정하고자 하는 것이 density estimation 이라고 한다.  - 밀도(density)는 수학적으로는 질량/부피 이지만,  밀도추정(density estimate), 기계학습, 확률, 통계 등에서 말하는 밀도(density)는 확률밀도(probagiltity density function)을 추정하는 것과 동일하다. f(a)는 x=a에서의 확률밀도(probability density)이다. 즉 x가 a라는 값을 가질 상대적인 가능성(relative likelihood)를 나타낸다.  즉 다시말하면 x=a 일 확률은 0이지만, x=a에서의 밀도는 0이 아니다. 또한 x가 a,b 사이의 값을 가질 확률은 그 구간의 확률밀도함수의 적분값으로 계산된다. 어떤 변수의 확률밀도함수(PDF)를 구할 수 있으면 그 변수가 가질 수 있는 값의 범위 및 확률, 기계학습 추정등에서 가장 핵심정인 요소중의 하나이다. Parametric vs Non-parametric 밀도추정. 밀도추정(density estimation)방법은 크게 parametric 방법과 non-parametric 방법으로 나뉜다. parametric density estimate는  확률밀도함수(PDF)에 대한 모델을 정해놓고 데이터들로부터 모델의 파라미터만 추정하는 방식이다.  즉 예를 들면 일일 교통량이 정규분포를 따른다고 가정해버리면...

python; cv2.cvtColor ;RGB 영상 이미지 처리 방법

디지털 영상  - 디지털 영상은 2차원 행렬의 형태로 표현되는데, 격자 하나를 하나의 픽셀이라고 부릅니다. 이를 3차원 영상처리에서는 복셀로 부르게 되는데요.  - 각자의 기준점에서 영상 좌표를 지정하고 그리고 변경함에 따라서 선택적으로 영상을 처리할 수 있게 됩니다. Digital Image의 유형은  Binary Image : 0 혹은 1로 나누어진 이미지를 의미하고,   Gray scale image :  color image - RGB color : - HSV color :   H(ue) : 0 : red, 120도 : Green, 240도 : Blue)   S(aturation) : 채도를 의미하고 색이 흐리다 , 진하다를 의미   V(alue) : 명도를 의미, 색이 어둡다 깊다를 의미 사용법 cv2.cvtColor(scr, code) parameter scr : input image code :  - grayscale을 BGR로 변환하기 위해서는 cv2.COLOR_BGR2GRAY를 사용하면 된다. 예제 aaa = cv2.cvtColor(img, cv2.COLOR_BGR2HSV) pl.imshow(aaa) -원래 이미지 결과 이미지

python; cv2.getStructuringElement

사용법 cv2.getStructutinElement(shape,ksize[,anchor]) parameter shape :  - MORPH_RET : 사각형  - MORPH_ELLIPSE : 타원형  - MORPH_CROSS : 십자 ksize => 커널의 사이즈를 의미 예제 :  element = cv2.getStructuringElement(cv2.MORPH_ELLIPSE,(7,7)) pl.imshow(element)