내일배움캠프

[내일배움캠프] TIL 31일차 26.02.12(목)

nom_de_plume 2026. 2. 12. 20:45

상관분석 (Correlation Analysis)

두 변수 간의 선형적 관계가 있는지 확인하는 분석.

보통 피어슨(Pearson) 상관계수를 사용하며, 결과값은 -1에서 1 사이.

  • 특징: 인과관계(원인과 결과)가 아닌, 한쪽이 변할 때 다른 쪽이 어떻게 변하는지 '경향성'만 봄.
  • 주요 라이브러리: pandas, scipy, seaborn (시각화)
  • 파이썬 핵심 함수: df.corr(method), stats.pearsonr(x,y), stats.pearsonr(x,y), pg.pairwise_corr(df,method)

 

분산분석 (ANOVA)

3개 이상의 집단 간 평균 차이가 통계적으로 유의미한지 비교할 때 사용.

  • 특징: 집단 내의 분산(차이)보다 집단 간의 분산이 충분히 큰지(F-value)를 확인.
  • 종류: 일원 분산분석(One-way), 이원 분산분석(Two-way) 등
  • 주요 라이브러리: scipy.stats (간단한 분석), statsmodels (상세한 리포트)
  • 파이썬 핵심 함수: stats.f_oneway(a,b,c), pg.anova(dv,between,data), pg.welch_anova(dv,between,data), stats.kruskal(a,b,c)

A/B 테스트 (t-test 중심)

두 집단(대조군과 실험군)을 비교하여 새로운 기능이나 디자인이 효과가 있었는지 검증.

주로 t-test를 사용.

  • 특징: 무작위로 나뉜 두 집단의 평균 차이를 확인. 비즈니스 의사결정에 매우 강력한 도구.
  • 주요 라이브러리: scipy.stats
  • 파이썬 핵심 함수: proportions_ztest(count,nobs), proportions_effectsize(p1,p2), proportion_confint(count,nobs), confint_proportions_2indep(c1,n1,c2,n2), NomalIndPower().solve_power(. . .)