본문 바로가기
통계학 한 발자국

[SPSS통계분석 기초] 로지스틱 회귀분석

by 상미미 2024. 5. 9.
반응형

1. 로지스틱 회귀분석(Logistic regression analysis)

1) 정의

회귀(regression)란 19세기 영국의 유전학자 Francis Galton이 키 큰 선대 부모들이 낳은 자식들의 키가 점점 더 커지지 않고, 다시 평균 키로 회귀하는 경향을 보고 발견한 개념으로, 보통 평균으로의 회귀(regression toward mean)의 뜻으로 쓰입니다. 로지스틱 회귀분석(Logistic regression analysis)은 연속형 독립변수가 범주형 종속변수에 미치는 영향을 검증하는 분석 방법입니다. 독립변수의 변화에 의해 종속변수가 어떻게 변화하는지를 검증하는 분석 방법입니다.

 

2) 가설 설정

간호전문직관과 또래지지가 전공만족도에 영향을 미치는지 검정하고자 한다면, 독립변수인 간호전문직관과 또래지지는 연속형 자료, 종속변수인 전공만족도는 범주형 자료이기 때문에 로지스틱 회귀분석을 합니다. 전공만족도는 만족과 불만족으로 구성된 이분형 자료입니다.

 

① 가설 : 독립변수가 종속변수에 유의한 영향을 미칠 것이다.

②-1 귀무가설 : 간호전문직관은 전공만족도에 유의한 영향을 미치지 않을 것이다.

②-2 귀무가설 : 또래지지는 전공만족도에 유의한 영향을 미치지 않을 것이다.

③-1 대립가설 : 간호전문직관은 전공만족도에 유의한 영향을 미칠 것이다.

③-2 대립가설 : 또래지지는 전공만족도에 유의한 영향을 미칠 것이다.

3) 로지스틱 회귀분석

① 메뉴를 선택합니다.

 

② '공병랸' 입력칸에 독립변수인 '간호전문직관', '또래지지'를, '종속변수' 입력칸에 종속변수인 '전공만족도'를 지정합니다.

③ '옵션'을 클릭합니다.

④ 통계량 및 도표'에서 'Hosmer-Lemeshow 적합도', 'exp(B)에 대한 신뢰구간'를 지정하고, '계속'을 클릭합니다.

 

⑤ '확인'을 클릭합니다.

⑥ 모형의 적합도를 확인합니다. '-2 로그 우도'는 적합도 수치를 의미하며, 수치가 낮을수록 좋습니다. '모형 계수의 총괄 검정'에서 모형의 유의확률은 독립변수가 투입되지 않은 모형과 비교했을 때 -2 로그 우도가 유의한 수준으로 감소했는지를 의미합니다. 즉, 유의확률이 .05 미만이라는 것은 -2 로그 우도가 유의하게 감소됨을 의미하고, 이는 적합도가 좋다는 것을 의미합니다.

'모형 요약'에서 'Cos와 Snell의 R-제곱'과 'Nagelkerke R-제곱'은 모형의 설명력인데, 종속변수가 범주형 자료이므로 일반적으로 낮게 나타납니다.

'Josmer와 Lemeshow 검정'에서 예측 모형과 실제 모형 사이에 유의한 차이가 있는지 검증합니다. 예측이 실제와 유사해야 하므로 두 모형 사이에는 유의한 차이가 없는 것으로 나타나야 합니다. 즉, Hosmer와 Lemeshow 검정에서의 유의확률은 .05보다 커야 모형이 예측을 잘한다고 판단할 수 있습니다. 왜냐하면 유의확률이 .05보다 크다는 것은 통계적으로 유의한 차이가 없다는 것을 의미하고, 이는 예측 모형과 실제 모형 사이의 유의한 차이가 없기 때문에 그만큼 예측을 잘했다고 해석할 수 있기 때문입니다.

⑦ 결과표를 보면 간호전문직관은 유의확률이 .05보다 작으므로 통계적으로 유의하다고 할 수 있고, 또래지지는 통계적으로 유의하지 않은 것으로 나타났습니다. 간호전문직관의 영향력은 2.444로 부(+)의 영향을 나타내므로 간호전문직관이 증가할 때 전공만족도가 만족할 경우가 높아진다고 나타났습니다.

Exp(B)가 1보다 클 경우 독립변수가 증가할 때 종속변수가 발생할 가능성이 높아지고, 1보다 작을 경우 독립변수가 증가할 때 종속변수가 발생할 가능성이 낮아진다고 판단할 수 있습니다. 논문에서는 Odds ratio(오즈비)를 줄여서 대개 OR로 표현합니다. OR을 독립변수가 한 단계 증가할수록 종속변수 발생 가능성이 몇 배 증감하는지를 의미합니다. 간호전문직관의 Exp(B)는 11.516으로 간호전문직관이 한 단계 증가하면 전공만족도가 만족일 가능성이 11.516배 높아진다고 할 수 있습니다.

EXP(B)에 대한 95% 신뢰구간에서 신뢰구간은 Confidence Interval로 대개 CI로 줄여서 표현합니다. 유의한 결과가 나왔다면 95% 신뢰구간에 1이 포함되지 않고, 유의하지 않은 결과가 나왔다면 95% 신뢰구간에 1이 포함됩니다. 간호전문직관은 95% 신뢰구간 사이에 1이 포함되지 않으며, 유의확률은 .05 미만인 것을 알 수 있으며, 또래지지는 95% 신뢰구간 사이에 1이 포함되며, 유의확률이 .05보다 큰 것을 알 수 있습니다.

반응형

댓글