1. 통계와 수학

고유값과 고유벡터란?


샘플링(Sampling)과 리샘플링(Resampling)이란?


확률 모형과 확률 변수란?


누적 분포 함수와 확률 밀도 함수의 정의와 수식


조건부 확률


공분산과 상관계수


신뢰 구간

Pasted image 20250227145228.png

모집단: 연구나 조사에서 관심 있는 전체 대상 집합을 의미
모수: 모집단의 평균, 분산, 비율 등이 모수에 해당


P-value


R square의 의미


평균(mean)과 중앙값(median)의 사용기준


중심극한정리가 유용한 이유


엔트로피(Entrophy)와, 정보 이득(Information Gain)


모수적 방법론과 비모수적 방법론을 사용하는 경우

“모수(parameter)”란 분포나 모델을 규정짓는 데 필요한 ‘고정된 수의 척도값(평균, 분산 등)’을 뜻함


Likelihood(가능도)와 Probability(확률)의 차이

1. 확률 (Probability)

2. 가능도 (Likelihood)

요약


통계에서 사용되는 bootstrap의 의미


모수가 매우 적은 케이스의 경우 예측 모델 수립 방법

= 데이터가 적은 경우


Bayesian(베이지안)과 Frequentist(프리퀀티스트)


검정력(Statistical power)

귀무가설 H0 참 귀무가설 H0 거짓
귀무가설 H0 채택 옳은 결정(1-α) 제 2종 오류(β)
귀무가설 H0 기각 제 1종 오류(α) 옳은 결정(1-β), 검정력

Missing Value가 있을 경우 채울지 말지, 그 이유


이상치를 판단하는 기준


필요한 표본의 크기를 계산하는 방법


Bias를 통제하는 방법

Pasted image 20250227164928.png


로그함수를 사용하는 경우