Blair  - Soul Eater 2. 데이터 분석을 위한 기초 수학/통계(이동훈 강사님)_09

• 패스트캠퍼스 데이터분석 부트캠프 12기

2. 데이터 분석을 위한 기초 수학/통계(이동훈 강사님)_09

oujin 2023. 12. 29. 10:18
728x90

대립가설이 맞다고 주장 할 수는 없다

단 귀무가설을 기각시킴으로써 귀무가설과 반대되는 대립가설이 맞다고 하는 것

 

귀무 가설이 맞다는 전제하에, 내가 뽑았던 표본이나 실험에서 일어나면 안되는 일이 일어난다면 귀무가설을 기각 할 수 있음(이때 이런 일이 발생할 확률 = 유의확률 = p-value)(귀무가설을 기각하기위한 기준)

 

귀무가설이 평균 무게 100키로 라고 하면,  표본의 평균 무게도 100키로여야함. 그러나 표본의 평균무게가 30키로 였다면 평균무게가 100키로라는 귀무가설을 기각 할 수 있다는 것임.


 

두 집단(또는 한집단의 전,후)의 평균에 유의미한 차이가 있는지 (t-test)

두 환자의 간수치는 모두 100이다,

a환자는 약을 복용하지 않고 b환자는 약을 복용한다.

b환자는 80으로 간수치가 줄어들었다.

이때 100에서 80으로 줄어든게 약에 의한 효과인지, 줄어든 20이 유의미한 효과인지 확인하기

또한 이때 a환자와 b환자의 간수치를 비교하는 것도 가능하고, b환자의 복용 전후를 비교해도된다.

 


 

두 집단의 분산에 통계적으로 유의미한 차이가 있는지 (F-검정)

두 집단의 분산 차이를 검정해 각 상황에 맞는 t-test 방법을 사용

평균은 비슷하더라도 극단적으로 높은 데이터와 극단적으로 낮은 데이터가 섞여져 있다면

분산이 달라졌다는 것을 인지 한 상태로 평균을 비교해야하기 때문에 F-검정을 해야함

p가 0.05보다 크면 두 집단의 분산에 유의미한 차이가 없고

p가 0.05보다 작으면 두 집단의 분산에 유의미한 차이가 있다

 

귀무가설: 두 집단의 분산에 유의미한 차이가 없다 (p>유의수준)

p값이 0.05보다 크므로 두 집단의 분산에 유의미한 차이가 없음

이때 등분산 가정 t-test 해야함

대립가설: 두 집단의 분산에 유의미한 차이가 있다  (p<유의수준)

p값이 0.05보다 작음므로 두 집단의 분산에 유의미한 차이가 있음

이때 이분산 가정 t-test해야함

 

양측검정 단측검정?


t 테스트 전에 f 테스트 진행해야함

 

f - 테스트에서 p값이 0.05보다 작으므로 이분산가정 t - 테스트 진행한다.

 

양측검정과 단측검정을 보는 기준

양측검정: 피밸류가 양측검정을 한다는 뜻은 종모양의 면적이 1일때 평균과 가까운 쪽은 확률이 크다. 그러나 양 극단으로 갈 수록 확률이 줄어든다. 양측검정은 평균보다 큰경우가 있고 평균보다 작은 경우가 있는데 크거나 작거나 상관없이 이 부분에 속하면 귀무가설을 기각하는 것임

단측검정: 극단적인 한 방향에 속한 경우.

 

 

 

그러나 매출액을 보면 변경 전보다 후가 더 적다. 따라서 패키지 변경하기로 결정하면 안됨.

 

 

 

 

 

728x90