
피어슨 상관계수는 선형적인 관계 설명만되고 비선형 관계는 상관관계가 있어도 0으로 나온다.
따라서 비선형관계에서는 스피어만 상관계수를 사용한다.






잔차가 제일 작은 값 == 최소 제곱법을 통해 잔차 제일 작은 베타 0, 베타1 을 찾는다 베타0과 베타1은 모수
최고제곱법을 찾는 코드 아래식
ols = ordinary least square


말이 안되는 경우가 있다. 베타0이라는 게
아빠의 키와 아들의 키의 상관관계를 볼 때 아빠의 키가 0이라는게 말이 안된다.
보통 베타 0보다 베타 1에 관심이 있다.

최소제곱법 사용하면서 유의하게 봐야할 코드는 위의 두개
첫번째 컬럼은 베타값이고 두번째 컬럼은 표준오차
베타를 쓰는 이유는 중심극한정리처럼 베타의 추정치 기대값이 모수가 되기 때문이라는 좋은 성질 때문

신뢰구간 구하기

신뢰구간을 보면서 기울기에 0이 포함되어있는지 확인하자
0이 포함되면 영향을 주지 못한다.

신뢰구간 구할 때 보통 신뢰도상수로 t값을 넣는데 여기에 왜 2를 넣었는가?
t 분포는 보통 절대값 2를 기준으로 꼬리가 넓어진다.
대충 95%는 1.96이고 이는 대략적으로 2이다.
신뢰구간 볼 때 아래 코드처럼 베타1값 +- 표준오차 *2로 신뢰구간 설정한다.

결국 위 2 코드가 신뢰구간 고하는 공식
하나는 수기로 하나는 코드로
이제 t 값을 확인해보자

t값은 beta1/ 표준오차 즉 0.1136/0.010 = 11.359 이다.
t통계량을 구하는 이유는 귀무가설 검증을 하기 위해
어떤 귀무가설?
beta1이 0이면 아무 의미가 없다. 기울기가 0이라는 것
이제 pvalue 확인하자

pvalue가 매우 작아 귀무가설 기각
이때 유의할 것은 상관관계가 있는 것이지 인과관계가 있는 것이 아니다
'2023_2 통계' 카테고리의 다른 글
| 다중 회귀분석 ( 다중공선성 문제는 회귀분석에서만 유의하게 보자_ (1) | 2023.11.13 |
|---|---|
| 다중회귀분석_F 검정 (0) | 2023.11.05 |
| 독립표본 t검정 대응표본 t 검정 비율 (1) | 2023.10.15 |
| 검정통계량 tvalue (1) | 2023.10.12 |
| 정규화 하는 과정에서 어떨때는 표준오차로 나누고 어떨때는 표준편차로 나누는가? (0) | 2023.09.28 |