๐ ์๊ฒฉ์ฆ, ์ดํ
[๋น ๋ฐ์ดํฐ ๋ถ์๊ธฐ์ฌ] ์ค๊ธฐ - 3์ ํ ๋ ๋ฆฝ๊ฒ์ (๋ชจ์ง๋จ 2๊ฐ) ์์
๋ฐ์ดํฐํ์ค
2024. 8. 20. 18:00
import pandas as pd
import numpy as np
import scipy.stats as stats
import scipy.stats as shaprio
#์ ๊ท์ฑ ๊ฒ์
sA, pA = stats.shapiro(df['A'])
sB, pB = stats.shapiro(df['B'])
print(sA,pA)
print(sB,pB)
๋์ ํ๋ณธ์ ์ ๊ท์ฑ ๊ฒ์ : ๋ ์ง๋จ์ ์ฐจ์ด๋ฅผ shapiro
๋ ๋ฆฝ ํ๋ณธ์ ์ ๊ท์ฑ ๊ฒ์ : ์ง๋จ์ ๊ฐ๊ฐ shapiro > ๋ชจ๋ ๋ง์กฑํด์ผ ์ ๊ท์ฑ O
#๋ฑ๋ถ์ฐ์ฑ ๊ฒ์
statistic, pvalue = stats.bartlett(df['A'],df['B'])
print(statistic,pvalue)
๋ ๋ฆฝ๊ฒ์ ์ ๋ฑ๋ถ์ฐ์ฑ๋ ๊ฒ์ ํด์ค์ผ ํ๋ค
๋ฑ๋ถ์ฐ์ฑ ๊ฒ์ ํจ์ bartlett
statistic, pvalue = stats.ttest_ind(df['A'],df['B'],equal_var=True, alternative='greater')
print(pvalue)
๋ฑ๋ถ์ฐ์ฑ ๋ง์กฑ ์ฌ๋ถ equal_var์ ์์ง ๋ง๊ฒ
๋์ํ๋ณธ์์๋ stats.ttest_rel ํจ์
๋ ๋ฆฝํ๋ณธ์์๋ stats.ttest_ind ํจ์
statistic, pvalue = stats.ranksums(df['A'],df['B'],alternative='greater')
print(pvalue)
์ ๊ท์ฑ ๋ง์กฑ ๋ชป ํ ๋๋ ranksums()