본문 바로가기
통계학 한 발자국

통계분석 시 핵심개념 - 유의확률

by 상미미 2024. 5. 13.
반응형

1. 가설

1) 좋은 가설

가설도 단순명료해야 합니다. 주제나 추후에 시행할 통계적 방법에 대해 애매모호한 점이 없고, 필요한 내용만 간단명료하게 정리해야 합니다.

 

 

2) 귀무가설과 대립가설

대립가설은 연구에서 입증하고자 하는 가설이며, 귀무가설은 대립가설의 반대되는 가설입니다. 대충 공부하거나 암기하다 보면 귀무가설은 무조건 '두 변수 간의 차이점이 없다.'라고 생각할 수 없습니다. 하지만 정확한 개념은 위에서 서술한 대로 대립가설은 연구자의 주장, 귀무가설은 대립가설의 반대되는 가설이라고 생각해야 합니다.

독립변수와 종속변수 간에 관련성을 입증하는 연구의 경우 대립가설은 '두 변수 간에 관련이 있다.' 또는 '두 변수 간에 차이가 있다.'라고 설정됩니다. 하지만 독립변수와 종속변수 간에 관련성이 없음을 입증하는 연구, 즉 비열등성 혹은 동등성 임상시험의 경우 대립가설은 '두 변수 간에 관련이 없다.' 또는 '두 변수 간에 차이가 없다.'라고 설정됩니다.

 

3) 검정

통계학적 검정에서 귀무가설은 이를 기각함으로써 차이가 있음을 반증적으로 지지하기 위하여 설정되는 가설입니다. 가설검정의 결과는 p-값으로 요약되어 표현되는데, p값은 연구자가 주장하는 바가 틀릴 확률입니다.

 

2. p

1) 유의확률과 신뢰확률

유의확률을 p-value 또는 p값이라고 합니다. 위에서도 언급했듯이 p값은 연구자가 주장한 가설이 틀릴 확률이라고 생각하면 됩니다. 보통 위처럼 0.05, 0.01, 0.001보다 p값이 작을 경우 연구자의 가설을 채택합니다. 왜냐하면 연구자의 주장이 틀릴 확률이 0.05, 0.01, 0.001, 즉, 5%, 1%, 0.1%보다 작다면 연구자의 주장을 수용할만하다고 통계학적으로 설정하였기 때문입니다.

유의확률과 신뢰확률은 반대되는 개념이라고 생각하면 됩니다. 즉 유의확률이 5%라면 신뢰확률은 95%라고 생각하면 됩니다. 만약 p값이 0.03이라면, 유의확률은 3%, 신뢰확률은 97%입니다. 연구자가 주장한 가설이 틀릴 확률이 5%보다 낮은 3%이고, 가설이 맞을 확률이 97%이므로 연구자의 가설을 채택할 수 있습니다.

 

2) 예시

위의 교차분석 결과에서 유의확률이 .000인 것을 알 수 있습니다. 이때 .000은 정확하게 0.000이라는 수치를 나타내는 것이 아니라 0.000보다 낮은 수치이지만 소수점 3번째 짜리까지만 출력한 것입니다. 그러므로 0.001보다 낮다고 해야지, 0.000이라고 말할 수는 없습니다.

결론적으로 p값이 0.001보다 낮으므로 연구자가 주장한 가설이 틀릴 확률은 0.1%보다 낮기 때문에 연구자의 주장을 채택할 수 있습니다.

반응형

댓글