잔차

덤프버전 :

1. 의미
2. 상세
3. 오차와의 차이점
4. 가정
5. 한계



1. 의미[편집]


잔차(residual)는 회귀식과 관측값 사이에 나타나는 차이를 말한다.


2. 상세[편집]


현실에서 모집단, 즉 전체집단을 전부 조사하는 경우는 불가능한 경우가 대부분이다. 따라서 일부 표본만을 추출해서 그 표본들에서 나타나는 공통적인 특징들이 모집단에도 나타난다고 가정하고 통계적 모델을 만들게 된다.
한편 관측값들에서 나타나는 공통적인 특징들을 통해 관측값들이 가지는 상관관계에 대한 함수를 역으로 추정할 수도 있는데 이것을 회귀분석이라고 하고 이렇게 해서 얻어진 식을 회귀식이라고 한다.
이때 회귀식을 관측값과 비교해보면 회귀식이 관측값을 100% 예측해내지는 못하는데 이때 나타나는 오차를 잔차라고 한다.


3. 오차와의 차이점[편집]


오차는 모집단의 회귀식에 대한 편차값인데 반해 잔차는 표본집단의 회귀식에 대한 편차값이다.
즉, 오차는 관측값을 통해 예측한 가정이 실제와 얼마나 부합하는지의 정도를 말해준다면 잔차는 예측한 가정이 관측값을 얼마나 잘 반영하고 있는가를 의미한다고 할 수 있다.
현실에서는 모집단의 실제값을 전부 측정하기는 불가능한 경우가 많으므로 오차보다 잔차를 쓰는 경우가 많다.


4. 가정[편집]


잔차에 대해서는 대체로 다음과 같은 가정을 전제로 한다.

1. 잔차오 함수의 각 독립변수들 간의 상관관계는 0이다.

2. 잔차들 간의 상관관계는 0이다.


5. 한계[편집]


회귀분석을 할 때는 변수를 하나만 빼고 전부 고정시키고 변수를 변화시켜서 회귀식을 추정하는데 예를 들어
𝑓(𝑥₁, 𝑥₂)에서 𝑥₁에 대한 잔차와 𝑥₂에 대한 잔차가 서로 상관이 없다고 가정을 하지만 실제로는 잔차 간에 상관관계가 있는 경우가 많다. 만약에 그 상관관계가 유의미할 정도로 크다먄 회귀식 자체가 쓸모없어지는 문제점이 있다.


파일:크리에이티브 커먼즈 라이선스__CC.png 이 문서의 내용 중 전체 또는 일부는 2023-12-15 10:57:39에 나무위키 잔차 문서에서 가져왔습니다.