표준편차 (문단 편집)

== 개요 ==
{{{+1 [[標]][[準]][[偏]][[差]] / standard deviation(σ)}}}

자료의 관찰값들이 얼마나 흩어져 있는지 그 정도를 하나의 수치로 나타내는 방법은 여러 가지가 있는데 그중 가장 많이 사용하는 것이 표준편차이다.[* 이러한 의미(흩어져 있는 정도를 하나의 수로 나타낸 값)를 가진 단어를 [[산포도]](scatterplot)라고 한다.]

약어로는 SD 또는 StDev(또는 stdev)라고 쓰는데 [[Microsoft Excel]]의 함수 명칭과 동일하다.[* 참고로 [[MATLAB]]에서는 더 간단하게 std라고 쓴다.]

관찰값들이 얼마나 흩어져 있는지를 살피기 위해 각 관찰값과 ‘관찰값들의 평균’[* 혹은 중앙값]과의 차이인 편차를 생각해 볼 수 있다. [[편차]](deviation)는 [[관측값]]에서 [[평균]][* 또는 [[중앙값]]]을 뺀 것이다. '이렇게 구한 편차들의 평균을 구하면 자료 관찰값들이 얼마나 흩어져 있는지를 하나의 수치로 나타낼 수 있겠구나'하는 생각으로 직접 이들 편차들의 평균을 구해보면 필연적으로 항상 0이 되는 것을 확인할 수 있다. 이런 상황을 회피하기 위해 어쩔 수 없이 편차들의 '제곱'을 구한 뒤 그 편차들의 제곱의 평균을 구해서 나온 값([[분산]])에 다시 제곱근을 구하는 우회적인 방법을 써서 산포도 값을 구한 것이 바로 표준편차다.

[[분산]](variance)은 관측값에서 평균을 뺀 값을 [[제곱]]하고, 그것을 모두 더한 후 전체 수로 나눠서 구한다. 즉, 차이값의 제곱의 평균이다. 관측값에서 평균을 뺀 값인 편차를 모두 더하면 0이 나오므로 편차의 부호를 없애기 위해 제곱해서 더한다. 또한 분산은 표준편차의 제곱이다.

[[표준 편차]](standard deviation)는 분산을 [[제곱근]]한 것이다. 제곱해서 값이 뻥튀기 된 분산을 제곱근해서 다시 원래 크기로 만들어준다. 표준편차의 경우 후술될 표준오차(stand error)와 함께 통계학 공부에서 제일 먼저 접하게 되는 개념이다.  특히, 표준편차는 서술되는 방식에 따라 그 함의가 다양해서 이후 '''연구방법론의 핵심'''인 추론통계의 기초가 되는  모 표준 편차, 표본 표준 편차, 표준오차를 이해하는 데 --의외(?)로-- '''중요한 역할'''을 하게 된다. 이처럼 표준편차가 중요한 역할을 하는 데는 사실 표준편차는 [[https://www.youtube.com/watch?v=XrL2SbwAfhE|어떤 수의 크고 작음을 직관적으로 이야기해 줄 수 있기 때문]]이다. [* 통계량이 정규분포를 따를시 전체 값의 약 68%가 ±1표준편차, 약 95%가 ±2표준편차, 약 99.7%가 ±3표준편차 범위 내에 속한다. (이를 68-95-99.7 법칙or규칙 이라고 한다)]

[[모 표준 편차]](population standard deviation) σ는 모 집단의 표준 편차이다. 모 분산 σ^^2^^에 루트를 씌워서 구한다.

[[표본 표준 편차]](sample standard deviation) s는 표본의 표준 편차이다. 표본 분산 s^^2^^에 루트를 씌워서 구한다.[* 당연히 양수인 근으로 구해야 한다.]

저장 버튼을 클릭하면 당신이 기여한 내용을 CC-BY-NC-SA 2.0 KR으로 배포하고,
기여한 문서에 대한 하이퍼링크나 URL을 이용하여 저작자 표시를 하는 것으로 충분하다는 데 동의하는 것입니다.
이 동의는 철회할 수 없습니다.

표준편차 (문단 편집)

캡챠