[빅데이터 분석기사] 실기 - 3유형 모평균 검정(모집단 3개) F-검정, ANOVA 분석

🏆 자격증, 어학

[빅데이터 분석기사] 실기 - 3유형 모평균 검정(모집단 3개) F-검정, ANOVA 분석

데이터팍스 2024. 8. 20. 17:58

import	pandas	as	pd
import	numpy	as	np
import	scipy.stats	as	stats
from	scipy.stats	import	shapiro

shaprio 일단 불러오고!

#	1.	가설설정
#	H0	:	세	그룹	성적의	평균값이	같다.	(	A(평균)	=	B(평균)	=	C(평균)	)	
#	H1	:	세	그룹의	성적	평균값이	적어도	하나는	같지	않다.	(not	H0)

#	2.	유의수준	확인	:	유의수준	5%로	확인

#	3.	정규성	검정
print(stats.shapiro(df['A']))
print(stats.shapiro(df['B']))
print(stats.shapiro(df['C']))
#	statistic,	pvalue	=	stats.shapiro(df['A'])
#	print(round(statistic,4),	round(pvalue,4))

ANOVA 검정은 각 칼럼에 대해 모두 stats.shapiro를 구한다

만약 하나라도 정규분포를 따르지 않는다면 비모수 검정방법(윌콕슨)을 써야 함 >> 근데 비모수는 시험에 출제될 확률이 적음

#	4.	등분산성	검정
#	H0(귀무가설)	:	등분산	한다.
#	H1(대립가설)	:	등분산	하지	않는다.
print(stats.bartlett(df['A'],	df['B'],	df['C'])	)

등분산성 검정할땐 stats.barlett()

#	5.1	(정규성O,	등분산성	O)	분산분석(F_oneway)
import	scipy.stats	as	stats
statistic,	pvalue	=	stats.f_oneway(df['A'],	df['B'],df['C'])
#	주의	:	데이터가	각각	들어가야	함
print(round(statistic,4),	round(pvalue,4)	)

모평균 검정 - 모집단 3개 - 정규성 O - 등분산성 O

stats.f_oneway() 함수 사용

#	5.3	(정규성X)	크루스칼	왈리스	검정
import	scipy.stats	as	stats
statistic,	pvalue	=	stats.kruskal(df['A'],	df['B'],	df['C'])
print(round(statistic,4),	round(pvalue,4)	)

모평균 검정 - 모집단 3개 - 정규성 X

stats.kruskal() 함수 사용