본문 바로가기

2023_2 통계

단순 회귀 분석 hw7

피어슨 상관계수는 선형적인 관계 설명만되고 비선형 관계는 상관관계가 있어도 0으로 나온다. 

따라서 비선형관계에서는 스피어만 상관계수를 사용한다. 

 

잔차가 제일 작은 값 == 최소 제곱법을 통해 잔차 제일 작은 베타 0, 베타1 을 찾는다 베타0과 베타1은 모수

최고제곱법을 찾는 코드 아래식

ols = ordinary least square 

 

말이 안되는 경우가 있다. 베타0이라는 게 

아빠의 키와 아들의 키의 상관관계를 볼 때  아빠의 키가 0이라는게 말이 안된다.

보통 베타 0보다 베타 1에 관심이 있다.  

최소제곱법 사용하면서 유의하게 봐야할 코드는 위의 두개

첫번째 컬럼은 베타값이고 두번째 컬럼은 표준오차

베타를 쓰는 이유는 중심극한정리처럼 베타의 추정치 기대값이 모수가 되기 때문이라는 좋은 성질 때문 

 

신뢰구간 구하기 

신뢰구간을 보면서 기울기에 0이 포함되어있는지 확인하자

0이 포함되면 영향을 주지 못한다. 

신뢰구간 구할 때 보통 신뢰도상수로 t값을 넣는데 여기에 왜 2를 넣었는가?

t 분포는 보통 절대값 2를 기준으로 꼬리가 넓어진다. 

대충 95%는 1.96이고 이는 대략적으로 2이다. 

신뢰구간 볼 때 아래 코드처럼 베타1값 +- 표준오차 *2로 신뢰구간 설정한다. 

결국 위 2 코드가 신뢰구간 고하는 공식 

하나는 수기로 하나는 코드로 

 

이제 t 값을 확인해보자 

 

t값은 beta1/ 표준오차  즉 0.1136/0.010  = 11.359 이다. 

t통계량을 구하는 이유는 귀무가설 검증을 하기 위해 

어떤 귀무가설?

#H0이 0이다. (beta1=0)    H1이 0이 아니다. (beta1!=0)

beta1이 0이면 아무 의미가 없다. 기울기가 0이라는 것 

이제 pvalue 확인하자 

 

pvalue가 매우 작아 귀무가설 기각 

이때 유의할 것은 상관관계가 있는 것이지 인과관계가 있는 것이 아니다