본문 바로가기
통계학 한 발자국

[SPSS통계분석 기초] 상관분석(피어슨 상관관계분석)

by 상미미 2024. 4. 30.
반응형

1. 상관분석

1) 정의

연속형 변수들 간의 상관성을 검증하기 위해 피어슨의 상관관계 분석(Pearson's correlation analysis)을 실시합니다. 변수 간 강도와 방향은 의미를 가지지만, 실질적인 영향력과는 거리가 있습니다. 즉, 영향력을 검증하는 분석 방법(회귀분석 등) 이전에 변수들 간의 특성을 파악하기 위해 실행하는 분석 방법입니다.

위의 그림을 보면 독립변수와 종속변수로 구분되어 있고, 화살표의 방향은 표시되어 있지 않습니다. 인과관계를 분석할 수 없기에 화살표의 방향은 표시할 수 없습니다. 또한 상관분석에서는 독립변수와 종속변수로 나눌 수 없지만, 분석에 사용될 변수들이 이미 독립변수, 종속변수, 매개변수, 조절변수 등으로 구분되어져 있기 때문에 편의상 위와 같이 작성하였습니다. 상관분석은 인과관계를 알 수 없으며, 회귀분석 전 상관관계를 알고 싶은 연속형 변수들을 모두 분석에 이용하면 됩니다.

 

2) 상관계수(Coefficient of correlation, r)

r값이 1에 가까울수록 상관관계가 강하다고 할 수 있으며, 0에 가까울수록 약하다고 할 수 있습니다. 즉, 1에 가까우면 정(+)적 상관관계가 강하다고 할 수 있으며, -1에 가까우면 부(-)적 상관관계가 강하다고 할 수 있습니다. 0이라면 상관관계가 없다고 할 수 있습니다.

상관계수 r이 직선의 기울기를 의미하는 것은 아닙니다. r 값이 1이라면 100%의 상관성으로 x 변수와 y 변수가 서로를 100% 설명할 수 있다는 것을 의미하지만, r 값이 1이더라도 실제 기울기가 작으면, x 변수와 y 변수에 대해 큰 영향을 미친다고 볼 수 없습니다. 이러한 기울기의 추정은 회귀분석의 영역입니다.

 

3) 인과관계

상관분석은 두 변수 간 선형관계의 분석일 뿐 인과관계를 파악할 수 없습니다. 백화점 내의 남성복 판매량과 여성복 판매량으로 비유해 보겠습니다. 왼쪽부터 r값이 0.9, 0.3, 0인데 r값을 0.9라고 해보겠습니다. 즉, 남성복 판매량과 여성복 판매량의 상관관계가 0.9라는 것을 알 수 있을 뿐, 남성복 판매량이 증가하기 때문에 여성복 판매량이 증가하는지, 여성복 판매량이 증가하기 때문에 남성복 판매량이 증가하는지 알 수 없습니다.

 

4) 편상관계수(Partial correlation coefficient)

 

편상관분석이란 교란변수를 제외한 두 변수 사이의 순수한 상관성의 정도를 평가합니다. 위의 경우, 제 3의 변수인 나이가 두 변수 간(허리둘레와 혈압)의 관계에 영향을 미치는 것을 통제한 후의 두 변수 간의 관계를 파악하는 것입니다. 즉 제일 마지막 그림을 보면 제 3의 변수인 나이에 해당하는 파란색을 제외한 허리둘레와 혈압 변수의 교차 부분이 편상관계수입니다.

2. 분석

1) 가설 설정

대학생활 스트레스가 우울을 매개하여 대학생활 적응에 미치는 영향을 알아보기 위해 회귀분석을 시행하기 전 상관분석을 시행합니다.

 

① 가설 : 변수들(연속형) 간에 유의한 상관관계가 있다.

② 귀무가설 : 대학생활 스트레스, 우울, 대학생활 적응 간에는 유의한 관계가 없다.

③ 대립가설 : 대학생활 스트레스, 우울, 대학생활 적응 간에는 유의한 관계가 있다.

 

2) 독립표본 t-test

① 메뉴를 선택합니다.

② '변수' 입력칸에 대학생활 스트레스, 우울, 대학생활 적응 변수를 지정합니다.

 

③ 각 변수들의 기술통계량도 함께 파악하고 싶다면, '옵션'을 클릭해서 '평균과 표준편차'를 선택한 후 '계속'을 클릭합니다.

④ '확인'을 클릭합니다.

⑤ 변수의 순서는 변수 입력칸의 변수의 순서대로 나옵니다. 종속변수를 가장 마지막에 넣어주면 표를 해석할 때 가독성이 좋습니다. 분석 결과를 보면 대학생활 적응과 대학생활 스트레스 간 상관계수는 -.581이고, 유의확률은 .001보다 낮습니다. 대학생활 적응과 우울 간 상관계수는 -.662이고, 유의확률은 .001보다 낮습니다. 즉, 대학생활 적응은 대학생활 스트레스와 우울과 부(-)적으로 상관관계가 있는 것을 알 수 있습니다.

⑥ 위의 표에서 유의확률이 .000으로 나타남에도 불구하고, *는 2개밖에 표기되어 있지 않습니다. 그러므로 *가 2개밖에 없더라도 꼭 유의확률 칸의 수치를 확인해야 합니다.

 
반응형

댓글