상관분석 (Correlation Analysis)
두 변수 간의 선형적 관계가 있는지 확인하는 분석.
보통 피어슨(Pearson) 상관계수를 사용하며, 결과값은 -1에서 1 사이.
- 특징: 인과관계(원인과 결과)가 아닌, 한쪽이 변할 때 다른 쪽이 어떻게 변하는지 '경향성'만 봄.
- 주요 라이브러리: pandas, scipy, seaborn (시각화)
- 파이썬 핵심 함수: df.corr(method), stats.pearsonr(x,y), stats.pearsonr(x,y), pg.pairwise_corr(df,method)
분산분석 (ANOVA)
3개 이상의 집단 간 평균 차이가 통계적으로 유의미한지 비교할 때 사용.
- 특징: 집단 내의 분산(차이)보다 집단 간의 분산이 충분히 큰지(F-value)를 확인.
- 종류: 일원 분산분석(One-way), 이원 분산분석(Two-way) 등
- 주요 라이브러리: scipy.stats (간단한 분석), statsmodels (상세한 리포트)
- 파이썬 핵심 함수: stats.f_oneway(a,b,c), pg.anova(dv,between,data), pg.welch_anova(dv,between,data), stats.kruskal(a,b,c)
A/B 테스트 (t-test 중심)
두 집단(대조군과 실험군)을 비교하여 새로운 기능이나 디자인이 효과가 있었는지 검증.
주로 t-test를 사용.
- 특징: 무작위로 나뉜 두 집단의 평균 차이를 확인. 비즈니스 의사결정에 매우 강력한 도구.
- 주요 라이브러리: scipy.stats
- 파이썬 핵심 함수: proportions_ztest(count,nobs), proportions_effectsize(p1,p2), proportion_confint(count,nobs), confint_proportions_2indep(c1,n1,c2,n2), NomalIndPower().solve_power(. . .)
'내일배움캠프' 카테고리의 다른 글
| [내일배움캠프] TIL 32일차 26.02.19(목) (0) | 2026.02.19 |
|---|---|
| [내일배움캠프] TIL 31일차 26.02.13(금) (0) | 2026.02.13 |
| [내일배움캠프] TIL 30일차 26.02.11(수) (0) | 2026.02.11 |
| [내일배움캠프] TIL 29일차 26.02.10(화) (0) | 2026.02.10 |
| [내일배움캠프] TIL 28일차 26.02.09(월) (0) | 2026.02.09 |