/ 위계적 회귀분석과 단계선택법의 차이 [SPSS 기초통계] 위계적 회귀분석

 본고에서는 위계적 회귀분석이란 무엇이며, SPSS 상에서 위계적 회귀분석을 실시하는 방법에 대해 논의할 것이다. 또한 추가적으로 위계적 회귀 분석과 단계 선택(스텝 와이즈)을 혼동하고 있는 분들을 위해 개념의 차이에 대해 논의한다.위계 회귀 분석이란 무엇인가?위계적 회귀 분석은 학제적 회귀 분석이라고도 하고 계층적 회귀 분석이라고도 한다. 그러나 가장 많이 사용되는 단어가 위계적 회귀 분석이기 때문에 본고에서도 위계적 회귀 분석이라 할 수 있다. 위계적 회귀 분석은 용이하게 표현하면 변수를 추가해 회귀 분석을 2회 이상 한 것이다. 위계 회귀 분석의 목적은 독립변수를 단계적으로 투입함으로써 종속변수에 대한 정도를 파악하는 것이다. 전 단계에 비해 새롭게 투입된 변수에 의한 F 값의 증가분이 유의미한지 파악하고, 모형의 적합성을 판단할 수 있다. 주로 독립변수의 특성이 다를 때 특성별로 구분하고 위계적 회귀 분석을 실시하면 변화량(설명력)을 측정할 수 있다.SPSS 상에서 위계적 회귀 분석을 실시하는 방법 SPSS에서 위계적 회귀 분석을 실시할 때 가장 중요한 것은 설명력의 변화이다. 통상 R제곱 변화량으로 측정한다. 분석→회귀분석→선형을 클릭해 회귀분석을 실시하는 방식과 마찬가지로 위계적 회귀분석을 실시할 수 있다. 단지, 차이가 있다면, 블록을 구분하는 것이다. 본고에서는 또는 자몽의 판매 가격에 관한 위계적 회귀 분석을 실시한다.

먼저 자몽 판매가격에 간접적인 영향을 주는 변수(, 공정처리, 유럽산, 교배 여부)를 넣은 다음 블록란에 있는 다음을 클릭한다. 이후 자몽 판매가에 직접적인 영향을 미치는 자몽의 크기와 숙성개월을 넣는다. 그 후 버튼을 클릭하고 R제곱 변화량을 반드시 클릭한다. 위계 회귀 분석의 주요 목표는 R승의 변화량을 측정하는 것이다.

그 후 버튼을 누르면 SPSS 상에서 다음과 같은 결과표가 표시된다. 해당 표의 방법은 다음과 같다. 주로 모형의 요약과 계수를 많이 본다. 모형의 요약에서 보면 처음 모형에서는 R제곱이.309이고 두 번째 모형은 세논R2승이 917이다. 즉, R승이 상당히 증가하였음을 확인할 수 있다. 유의수준 F 변화량도 마찬가지로 0.000으로, 매우 R승의 변화량이 매우 유의미하다고 생각된다. 이것을 해석하면 첫 번째 변수 집단만 넣는 것보다 두 번째 집단까지 넣는 것이

위위계적 회귀분석과 단계선택법(스텝와이즈)의 차이점처음처음 통계를 배우면 위계적 회귀분석과 스텝와이즈의 차이를 잘 이해하지 못할 수 있다. 둘은 변수를 조작한다는 점에서 비슷한 개념이나 위계적 회귀분석(분석 방법)이 단계선택법(변수 투입 기준)보다 상위 개념이다. 단계선택법은 회귀분석 중에서 어떤 방식으로 변수를 투입할지를 결정할 뿐 분석방법은 아니며, 한편으로 위계적 회귀분석은 R승의 변화량을 측정할 목적으로 의도적으로 연구자의 판단에 따라 블록을 구분한 것이다. 위계 회귀 분석을 하면서 변수의 투입을 스텝와이즈로 하는 경우를 생각하면, 두 개념의 차이를 확실히 구분할 수 있게 된다. 그러면 위계적 회귀 분석에 스텝와이즈를 적용해 본다. 위에서 활용한 데이터를 엔터방식이 아닌 단계 선택법 중 전진을 활용하여 실시해 보면 다음과 같은 결과가 나온다. 스텝와이즈를 하면 결과가 다르다는 것을 알 수 있다. 상기 방식과 동일한 데이터에 동일한 블록으로 위계적 회귀 분석을 행하고, 단계 선택만 엔터에서 전진(포워드)으로 전환했다.

총 4개의 모형이 나와 있는 것을 확인할 수 있으며 많은 변수가 제외되어 있음을 확인할 수 있다. 첫 번째 블록에서 가장 유의미한 유럽산과 범_지역 변수만 포함되었고, 이후 두 번째 모형에서 범_지역이라는 변수가 포함되었으며, 이후 단계 선택에 따라 나머지 변수가 포함되지 않았다. 그 후 두 번째 블록에서 의미 있는 두 변수가 모두 추가되었음을 확인할 수 있다.