import scipy.stats as stats
from scipy.stats import shapiro
import pandas as pd
import numpy as np
์ผ๋จ 3์ ํ์์ ํ์ํ๊ฑด ์ ๊ท์ฑ ๊ฒ์ ์ ์ํด shapiro๋ฅผ ๋ถ๋ฌ์ค์
# 1. ๊ฐ์ค์ค์
# H0 : mpg ์ด์ ํ๊ท ์ด 20๊ณผ ๊ฐ๋ค.
# H1 : mpg ์ด์ ํ๊ท ์ด 20๊ณผ ๊ฐ์ง ์๋ค.
# 2. ์ ์์์ค ํ์ธ : ์ ์์์ค 5%๋ก ํ์ธ
# 3. ์ ๊ท์ฑ ๊ฒ์
# H0(๊ท๋ฌด๊ฐ์ค) : ์ ๊ท๋ถํฌ๋ฅผ ๋ฐ๋ฅธ๋ค.
# H1(๋๋ฆฝ๊ฐ์ค) : ์ ๊ท๋ถํฌ๋ฅผ ๋ฐ๋ฅด์ง ์๋๋ค.
statistic, pvalue = stats.shapiro(df['mpg'])
print(round(statistic,4), round(pvalue,4))
result = stats.shapiro(df['mpg'])
print(result)
# 4.1 (์ ๊ท์ฑ๋ง์กฑ O) t-๊ฒ์ ์ค์
statistic, pvalue = stats.ttest_1samp(df['mpg'], popmean= 20, alternative='two-sided') # H1 : ์ผ์ชฝ๊ฐ์ด ์ค๋ฅธ์ชฝ ๊ฐ
print(round(statistic,4), round(pvalue,4) )
# alternative (๋๋ฆฝ๊ฐ์ค H1) ์ต์
: 'two-sided', 'greater', 'less'
๋ชจํ๊ท ๊ฒ์ - ๋ชจ์ง๋จ 1๊ฐ - ์ ๊ท์ฑ ๋ง์กฑO - T test
statas.ttest_1samp ํจ์ ์ฌ์ฉ
๋น๊ตํ ๊ฐ = popmean
# 4.2 (์ ๊ท์ฑ๋ง์กฑ X) wilcoxon ๋ถํธ์์ ๊ฒ์
statistic, pvalue = stats.wilcoxon(df['mpg']-20, alternative='two-sided')
print(round(statistic,4), round(pvalue,4) )
๋ชจํ๊ท ๊ฒ์ - ๋ชจ์ง๋จ 1๊ฐ - ์ ๊ท์ฑ ๋ง์กฑX - wilcoxon
stats.wilcoxon ํจ์ ์ฌ์ฉ
df['์นผ๋ผ๋ช ']-๋น๊ตํ ๊ฐ