문서의 임의 삭제는 제재 대상으로, 문서를 삭제하려면 삭제 토론을 진행해야 합니다. 문서 보기문서 삭제토론 대푯값 (문단 편집) === 중앙값 === 중앙값(median) 또는 중위수는 n개의 값을 크기 순으로 늘어놓았을 때 가장 가운데에 있는 값이다. n이 홀수일 때 중앙값은 '''(n+1)/2'''번째에 있는 값을, n이 짝수일 때는 '''n/2'''번째 값과 '''(n/2)+1'''번째 값의 평균을 중앙값으로 한다. 예컨대, 위 데이터에서는 (n+1)/2 번째 값인 8번째 있는 데이터 세 번째 5가 중앙값이다. n이 짝수일 경우 10,20,30,80의 중앙값은 20도 30도 아니고 25이다. 중앙값 개념은 각 표본들의 격차가 워낙 커서 평균값이 의미가 없고 그 순위(백분위)가 더 중요할 때 주로 쓴다. 예를 들어 국민소득을 대표할 수 있는 값을 구할 때 산술평균('''평균소득''')을 쓰게 되면 부유한 쪽으로 극단적인 값이 나타날 수 밖에 없다. 때문에 국민들이 생각하는 일반적인 소득보다 높은 값이 나타나게 된다. 따라서 모든 국민을 소득순으로 줄세우기하여 가운데에 있는 사람의 소득인 '''중위소득'''이 보다 합리적인 대푯값이 될 것이다. 더 쉬운 예시를 들어, 임직원이 100명인 A사에서 사장을 제외한 99명의 연봉이 일괄 5천만 원인데 사장의 연봉만 100억이라면, A사의 '평균' 연봉은 1억 4851만 원이 된다. 'A사 평균 연봉이 1억 4851만이래요.'라고 직원들에게 전한다면 직원들은 모두 '말도 안 된다'라는 반응을 보일 것이다. 즉, 이런 [[이상치]]가 존재하는 상황에서 평균은 대표성을 잃게 되고, 이것이 바로 '''평균의 함정'''이다. 이처럼 극단적인 값이 있는 경우에는 중앙값이 [[평균값]]보다 유용하다. 평균은 쉽게 변하지만 중앙값은 확률변수의 총 개수만 알면 거의 변하지 않는데, 이를 강고/강건하다(Robust)라고 하며, '''중앙값이 가진 대표적인 성질이다.''' 통계 관련 문제에 Robust라는 단어가 보이면 '''무조건 중앙값에 해당하는 설명'''이니까 참고하자. 중앙값은 극단의 관찰값이 확정되지 않았을 때, 또는 자료가 극단성을 포함할 여지가 있도록 개방된(open-ended) 경우에도 유용하게 사용할 수 있다. 예를 들어, 10명이 퍼즐을 푸는 평균 시간을 측정하는데, 9명은 12분 언저리에서 풀었지만 1명은 측정 한계시간 1시간을 훌쩍 넘기도록 여전히 끙끙거리는 바람에 '''측정이 중단된 경우.''' 이런 경우에는 애초에 평균을 낼 수도 없기 때문에 중앙값을 이용해야 한다.[* 마지막 한 사람의 기록을 60분으로 보고 평균을 내도 17분 정도가 나오기 때문에 평균값은 실제로 구하고자 하는 값과 많이 달라진다.]저장 버튼을 클릭하면 당신이 기여한 내용을 CC-BY-NC-SA 2.0 KR으로 배포하고,기여한 문서에 대한 하이퍼링크나 URL을 이용하여 저작자 표시를 하는 것으로 충분하다는 데 동의하는 것입니다.이 동의는 철회할 수 없습니다.캡챠저장미리보기