본문 바로가기
Stat

충분통계량

by 올뺴미 2023. 12. 10.

X1, X2, ..., Xn을 f(x;θ)로 부터의 확률표본이라 할 때, 모수 θ의 추론에 사용되는 통계량 Y = u(X1,X2,...,Xn)는 n개의 표본이  가지고 있는 θ에 대한 모든 정보와 동일한 정보력을 가지되(suffiiciency), 가능한 한 단순한 형태(minimal type)를 취하는 것이 바람직할 것이다. Y 의 θ에 대한 충분통계량이기 위한 필요충분조건은 임의통계량 T에 대해 Y = y일 때 T의 조건부분포가 θ에 의존하지 않는 것이다.

 

The concept of sufficiency is crucial in statistical inference, as it helps to simplify the process of estimation and hypothesis testing by focusing on a reduced set of information that retains all the relevant information about the parameter of interest. The Fisher-Neyman factorisation criterion is often used to determine whether a statistic is sufficient for a parameter.

통계적 추론에서 충분성의 개념은 관심 있는 모수에 대해 모든 관련 정보를 보유하고 있는 제한된 집합에 집중함으로서 가설 검정 과정을 단순화한다는 의미에서 중요하다. 피셔-네이먼 인수분해 정리가 충분성확인을 위해  주로 사용된다. 다음처럼 분해되는지를 확인해야 한다.

 

f(x1,x2,,xn;θ)=g(t(x1,x2,,xn);θ)h(x1,x2,,xn).

  • is a function that depends only on the parameter θ and the sufficient statistic t(x1,x2,…,xn).

-> g는 모수 θ와, 충분통계량 t에 대해 의존하는 함수

  • is a function that does not depend on the parameter θ, but may depend on the sample data.

-> h는 모수 θ에 의존하지 않는 함수

 

The factorization implies that once the value of the sufficient statistic T(X) is known, the remaining information about the parameter θ is contained in the function alone.

In summary, the Fisher-Neyman factorization criterion provides a way to identify sufficient statistics by examining the factorization of the joint probability distribution of the sample. If such a factorization exists, then the statistic is considered sufficient for the parameter of interest.