본문 바로가기

2023_2 통계

정규화 하는 과정에서 어떨때는 표준오차로 나누고 어떨때는 표준편차로 나누는가?

표준편차와 표준오차는 통계에서 사용되는 두 가지 다른 개념이며, 데이터 정규화에 사용될 때도 다르게 적용됩니다.

1. **표준편차 (Standard Deviation):** 표준편차는 데이터 집합 내의 데이터 포인트들이 평균으로부터 얼마나 퍼져 있는지를 측정하는 지표입니다. 표준편차가 크면 데이터 포인트들이 평균에서 멀리 흩어져 있고, 작으면 평균 주변에 모여 있음을 나타냅니다. 데이터를 정규화할 때, 주로 평균을 빼고 표준편차로 나눠주는데, 이것을 "표준화" 또는 "Z-스코어 정규화"라고 합니다.

    정규화된 값 = (x - 평균) / 표준편차

2. **표준오차 (Standard Error):** 표준오차는 통계적 실험에서 표본 평균의 변동성을 나타내는 지표입니다. 표준오차는 모집단의 평균을 추정하는 표본 평균의 변동성을 나타냅니다. 표준오차는 주로 표본 크기와 표준편차를 사용하여 계산됩니다. 표준오차가 작을수록 표본 평균이 모집단 평균에 더 가깝다고 볼 수 있습니다.

    표준오차 = 표준편차 / √(표본 크기)

따라서, 정규화 과정에서 표준편차로 나누는 경우 데이터의 분포를 단순히 표준화하고, 표준오차로 나누는 경우 주로 표본 평균을 모집단 평균에 대한 추정치로 사용할 때 사용됩니다. 두 지표는 목적과 의미가 다르므로 주의하여 사용해야 합니다.

'2023_2 통계' 카테고리의 다른 글

독립표본 t검정 대응표본 t 검정 비율  (1) 2023.10.15
검정통계량 tvalue  (1) 2023.10.12
4_표준편차 표준오차 ^p  (0) 2023.09.24
분산을 구할 때 n으로 나눈는 문제  (0) 2023.09.21
3_  (0) 2023.09.17