본문 바로가기

Stat5

Factor Analysis 요인분석 R로 해보기 R 빌트인 파일 state.x77이라고 잇는뎅 이걸로 요인분석을 해보겟다아니 님들 내가 25000파운드 내고 듣는 수업을 이렇게 공짜로 티스토리에 올려주면 개이득 아님?내가 이해한 바로는 요인 분석의 목적이 데이터의 dimensonality 를 줄이는 것이자 방대한 원 관측치에서 관측되지 않은 주요 기저 요인을 나타내는 변수들의 조합을 찾아내는 것이다. 그게 뭔소리냐? 비슷한것들끼리 조합을해서 공통인자로 묶어내는것  일단 적합에 필요한 최적의 요인 수는 pca를 통해서 혹은 상관관계행렬의 고유값을 통해서 알 수 있다.바쁜관계로 상관관계 행렬을 만들어보겟다fa.cor  이걸로 요인 수를 파악할 수 있는데  우선 고유값을 알아보자fa.eigen$valuessum(fa.eigen$values)cumsum(fa.. 2024. 10. 27.
충분통계량 X1, X2, ..., Xn을 f(x;θ)로 부터의 확률표본이라 할 때, 모수 θ의 추론에 사용되는 통계량 Y = u(X1,X2,...,Xn)는 n개의 표본이 가지고 있는 θ에 대한 모든 정보와 동일한 정보력을 가지되(suffiiciency), 가능한 한 단순한 형태(minimal type)를 취하는 것이 바람직할 것이다. Y 의 θ에 대한 충분통계량이기 위한 필요충분조건은 임의통계량 T에 대해 Y = y일 때 T의 조건부분포가 θ에 의존하지 않는 것이다. The concept of sufficiency is crucial in statistical inference, as it helps to simplify the process of estimation and hypothesis testing by .. 2023. 12. 10.
Exponential Family 지수족 (정규분포, 이항분포 증명) 지수족은 다음과 같은 형태의 확률 분포를 말한다. 지수족의 원소로는 정규분포, 베르누이 분포, 지수분포, 베타분포, 감마분포, 푸아송분포, 카이제곱분포 등등 우리가 알고 있는 대부분의 분포 그러나 student-T분포는 지수족이 아니다. 또한, 시행횟수 N이 고정된 이항분포들의 집합은 지수족의 원소가 된다. n이 고정되어야 하고 n과 p가 모두 모수이면 exponential family가 안 된다. https://youtu.be/3ZFNo43Bt-o?si=WZZCIO3DYua5vx6h 이항분포 이항분포가 지수족에 속하는지를 증명해보자. \[f(x) = (nCx) p^{x}\times (1-p)^{n-x}\] 1)take the log of both sides \[ \log{f(x)} = \log(nCx).. 2023. 12. 3.
Efficient Estimator 유효추정량 B^보다 B~이 더 효율적이다. (또한, 비편향성을 만족한다) B~이 실제 모수에 가까울 확률이 더 높다. 더 효율적이라도, 편향적일수는 있다. 2023. 11. 28.
Unbiased Estimator 불편추정량 2023. 11. 28.