내가 논문에서 CB-SEM 대신 PLS-SEM을 사용한 이유 > PLS-SEM 길라잡이

내가 논문에서 CB-SEM 대신 PLS-SEM을 사용한 이유

페이지 정보

작성자 전박사
댓글 0건 조회 68회 작성일 24-04-11 00:32

본문

연구자들은 종종 구조방정식 모델링(SEM) 방법론 선택에 있어 공분산 기반 SEM(CB-SEM)과 부분최소제곱 SEM(PLS-SEM) 사이에서 결정을 내려야 합니다. 이 내용은 논문의 방법론 선택이 단순한 선호가 아닌, 연구의 목적과 데이터의 특성을 깊이 고려한 결과임을 강조하는 데 중요합니다. 본 문서를 통해 심사자와의 소통을 강화하고, 연구 방법론에 대한 신중한 선택이 연구의 질을 높이는 데 어떻게 기여하는지를 보여줄 수 있습니다.

케이스 #1. 선행연구의 이론적 틀을 확장하거나 수정한 새로운 모델을 개발할 경우

PLS-SEM은 이론적 발전과 이론의 초기 단계에서의 탐색에 특히 유용한 방법론입니다. 선행 연구에서 아직 완전히 검증되지 않았거나, 새롭게 개발된 이론을 토대로 한 연구 모델을 검토할 때, PLS-SEM은 연구자에게 탐색적인 분석을 통해 이론적 가설을 형성하고 검증할 수 있는 유연성을 제공합니다.

예를 들어, 대부분의 연구자들이 시도하는 바와 같이 논문에서 선행연구에서 사용되지 않은 새로운 연구 모델을 제시하고 있다면, 이러한 새로운 모델이나 개념을 검증하려고 할때, PLS-SEM은 이론적 가정을 설정하고 초기 단계의 가설을 검증하는 데 적합한 도구로 작용합니다. 이는 PLS-SEM은 복잡한 모델에서도 변수 간의 관계를 유연하게 탐색하고, 이론적 구조를 발전시키는 데 도움을 주기 때문입니다.

즉, PLS-SEM은 선행 연구에서 확립된 이론적 틀을 확장하거나 수정할 필요가 있는 경우에 매우 유용합니다. 연구자가 새로운 맥락이나 다른 샘플에서 이론을 적용하고자 할 때, PLS-SEM을 사용하여 이론적 가설의 적합성과 예측력을 탐색할 수 있습니다.

따라서, 연구에서 PLS-SEM을 선택한 결정은 선행 연구 이론의 토대 위에 구축된 새로운 연구 모델을 탐색하고, 이론적 발전에 기여하고자 하는 연구 목적에 적합합니다.

Hair, J.F., Hult, G.T.M., Ringle, C., and Sarstedt, M. (2017). A Primer on Partial Least Squares Structural Equation Modeling (PLS-SEM). Sage Publications.

Sarstedt, M., Ringle, C. M., & Hair, J. F. (2021). Partial least squares structural equation modeling. In Handbook of market research (pp. 587-632). Cham: Springer International Publishing.

케이스 #2. 데이터의 정규성이 완벽하지 않을 경우

데이터 분석 과정 초기에, 변수 평균값 및 개별 문항들의 분포를 면밀히 검토합니다. 이 과정에서, 연구모델에 적용된 주요 변수들 중 일부가 정규 분포를 완전히 따르지 않는 것으로 나타날 수 있습니다. 조사된 데이터가 정규분포를 따르지 않음을 알아내는 방법은 (1) 히스토그램이나 Q-Q(Quantile-Quantile) 플롯의 시각적 검토, (2) 콜모고로프-스미르노프(Kolmogorov-Smirnov) 검정, 샤피로-윌크(Shapiro-Wilk) 검정 등 통계적 정규성 검정, (3) 데이터의 왜도(Skewness)와 첨도(Kurtosis)를 계산 하는 등 3가지 방법이 있습니다. 또한, 설문조사 데이터의 정규분포를 따르는지 여부를 판단하기 위한 접근 방식은 (1) 설문 개별 문항 검토 방식과 (2) 평균 값 계산 후 검토하는 방식으로 검토할 수 있습니다.

이 과정에서, 데이터의 정규분포를 검토한 결과, 수집된 데이터는 대체로 정규분포를 완벽히 따르지 않는 경향이 있습니다. 즉, 데이터의 왜도(Skewness)와 첨도(Kurtosis) 분석, 그리고 샤피로-윌크(Shapiro-Wilk) 검정 등을 통해 정규성 가정을 충족시키지 못하는 변수들이 있을 수 있습니다.

그런데, CB-SEM 방법론은 다변량 정규 분포 가정에 의존하는 반면, PLS-SEM은 이러한 가정에 덜 엄격합니다. 이는 PLS-SEM이 변수들의 비정규성에 더 강건(Robust)하게 대응할 수 있음을 의미합니다. 실제로, PLS-SEM은 예측 정확도와 모델의 복잡한 관계를 분석하는 데 있어, 데이터의 정규성이 완벽하지 않을 경우에도 유용하게 사용될 수 있습니다.

이는 PLS-SEM의 다음과 같은 특징 때문입니다.

1) 비모수적 접근 : PLS-SEM은 비모수적 방법론입니다. 즉, 데이터가 특정 분포(예: 정규 분포)를 따른다는 가정을 하지 않습니다. 이는 데이터의 정규성 가정에 의존하는 CB-SEM (Covariance-Based Structural Equation Modeling)과 대비됩니다. CB-SEM은 모델 추정과 결과의 유효성이 데이터의 정규 분포 가정에 크게 의존하지만, PLS-SEM은 이러한 가정 없이도 변수 간의 관계를 추정할 수 있어 비정규성 데이터에 대해 더 강건합니다.

2) 부트스트랩 방법 사용 : PLS-SEM에서는 통계적 유의성을 평가하기 위해 주로 부트스트랩(Bootstrap) 방법을 사용합니다. 부트스트랩은 재표본 추출을 통해 통계량의 분포를 추정하는 비모수적 방법으로, 데이터의 원래 분포에 의존하지 않습니다. 이로 인해, PLS-SEM은 정규성 가정이 충족되지 않는 경우에도 신뢰구간과 유의성 검정을 제공할 수 있으며, 이는 비정규성 데이터에 강건한 추정과 분석을 가능하게 합니다.

이러한 이유로, 데이터의 분포 가정에 대한 유연성, 변수들의 비정규성에 대한 강건성, 그리고 연구 목적과의 일치성을 고려하여 PLS-SEM을 선택하게 되었습니다.

Henseler, J., Ringle, C. M., & Sinkovics, R. R. (2009). The use of partial least squares path modeling in international marketing. In New challenges to international marketing (Vol. 20, pp. 277-319). Emerald Group Publishing Limited.

케이스 #3. 형성적 변수의 측정 모델을 처리해야할 경우

측정도구, 즉 변수의 구성개념은 대체로 반영적 측정 모델이거나 형성적 측정 모델을 포함합니다.

반영적 측정 모델은 구성 개념(변수)이 해당 변수를 반영하는 여러 항목(지표)에 영향을 미칩니다. 즉, 구성 개념의 변화가 모든 항목에 영향을 미치게 됩니다. 예를 들어, <고객 만족도> 변수가 "제품에 만족한다. / 다시 구매할 의향이 있다. / 친구에게 추천할 것이다."로 측정되었다면, 이 경우, <고객 만족도>라는 구성 개념은 이를 반영하는 세 가지 지표에 영향을 미치게 된다. 즉, 만족도가 높을수록 모든 질문에 대한 긍정적인 응답이 증가할 것으로 기대가 된다.

반면, 형성적 측정 모델에서는 여러 항목(지표)이 구성 개념(변수)을 형성합니다. 즉, 각 항목이 구성 개념에 기여하며, 항목의 변화가 구성 개념을 형성합니다. 예를 들어, <생활 만족도>를 측정한 변수(구성 개념)가 "주거 환경의 만족도 / 직장 환경의 만족도 / 사회적 관계의 만족도"로 측정되었다면, 이 경우, 각 지표는 생활 만족도라는 구성 개념을 형성하는 데 기여한다. 즉, 각각의 지표는 서로 독립적으로 생활 만족도에 영향을 미치며, 하나의 지표가 변해도 다른 지표에 직접적인 영향을 미치지 않습니다.

대부분의 연구모델은 형성적 측정 모델을 포함할 수 있습니다. 그러므로, PLS-SEM은 이러한 형성적 유형의 변수를 다루는 데 더 적합한 방법론입니다. CB-SEM은 주로 반영적 측정 모델에 초점을 맞추는 반면, PLS-SEM은 형성적 측정 모델을 포함한 복잡한 모델 구조를 쉽게 다룰 수 있기 때문이다.

PLS-SEM이 형성적 측정 모델을 더 효과적으로 다루는 이유는 다음과 같습니다.

- 가중치 추정: PLS-SEM은 형성적 지표들의 가중치를 추정하여 잠재 변수를 구성합니다. 이 과정에서 각 지표의 상대적 중요성이 평가되며, 이는 잠재 변수를 형성하는 데 각 지표가 얼마나 기여하는지를 보여줍니다. 이러한 가중치 추정은 형성적 모델에서 핵심적인 역할을 하며, PLS-SEM은 이를 효율적으로 수행할 수 있는 알고리즘을 제공합니다.

- 모델의 유연성: PLS-SEM은 형성적 측정 모델과 반영적 측정 모델을 동시에 포함하는 복합적인 모델 구조를 다루는 데 매우 유연합니다. 이는 형성적 지표들과 함께 반영적 지표들을 포함하는 복잡한 연구 모델을 설계하고 분석하는 데 유용합니다.

- 형성적 변수 간의 관계 분석: PLS-SEM은 형성적 변수 간의 복잡한 관계를 분석할 수 있습니다. 예를 들어, 여러 형성적 변수들이 서로를 어떻게 형성하는지, 혹은 어떤 형성적 변수가 다른 잠재 변수에 어떤 영향을 미치는지 등을 탐색할 수 있습니다.

- 측정 오류의 유연한 처리: PLS-SEM은 측정 오류를 모델의 일부로 포함시키는 방식이 아니라, 각 지표의 기여도를 통해 잠재 변수를 직접 형성합니다. 이는 형성적 측정 모델에서 측정 오류를 다루는 데 더 적합한 접근법을 제공합니다.

이처럼, 반영적 측정 모델과 형성적 측정 모델은 구성 개념과 항목 간의 관계에 대한 기본적인 가정이 다르며, 이를 이해하는 것은 적절한 측정 모델을 선택하고 연구 설계를 구성하는 데 중요합니다.

이러한 이유로, 연구 모델에서 형성적 측정 모델을 포함하고 있다면, PLS-SEM은 이러한 유형의 변수를 다루는 데 더 적합한 방법론입니다.

Diamantopoulos, A., & Winklhofer, H. M. (2001). Index construction with formative indicators: An alternative to scale development. Journal of Marketing Research, 38(2), 269-277.

케이스 #4. 매개변수, 조절변수, 그리고 상호작용 효과를 효율적으로 분석해야할 경우

연구의 분석 모델이 매개 효과와 조절 효과를 포함하는 복잡한 구조를 가지고 있을 경우, 이러한 다중 매개변수와 조절변수, 그리고 기타 상호작용 효과(다중 조절효과, 순차적 매개효과, 다중 경로 상호작용효과, 다차원 상호작용 효과)를 포함하는 복잡한 모델 구조를 효율적으로 분석하고 해석하는 데 있어, PLS-SEM은 특히 적합한 방법론으로 판단됩니다.

그런데, 이러한 상호작용 효과를 포함하는 모델을 분석할 때, CB-SEM은 PLS-SEM에 비해 몇 가지 측면에서 상대적으로 더 어려움을 겪을 수 있습니다. 이는 CB-SEM과 PLS-SEM의 기본적인 접근 방식과 계산 과정에서 비롯되는 차이 때문입니다.

즉, CB-SEM은 변수 간의 관계를 공분산 구조로 정의함으로써, 모델 사양이 복잡하다는 특징이 있습니다. 그래서, 상호작용 효과를 모델링하려면 추가적인 상호작용 변수를 생성하고, 이를 모델에 명시적으로 포함시켜야 하는데, 이 과정은 모델의 복잡성을 증가시키며, 모델 사양 및 식별성이 문제가 될 수 있습니다.

또한, 계산의 복잡성도 문제점으로 고려될 수 있습니다. CB-SEM은 모델 추정을 위해 대규모의 행렬 연산을 수행하며, 특히 복잡한 모델에서는 계산 비용이 높아질 수 있습니다. 그러므로, 모델의 식별성을 확보하고, 적합한 추정 결과를 얻기 위해 충분히 큰 표본 크기가 요구됩니다.

PLS-SEM이 매개변수, 조절변수, 그리고 상호작용 효과를 포함하는 복잡한 모델 구조를 다루는 데 제공하는 특별한 이점은 다음과 같습니다.

- 모델링 유연성 : PLS-SEM은 매개 효과와 조절 효과를 포함한 복잡한 상호작용을 쉽게 모델링할 수 있습니다. 이는 PLS-SEM이 경로 모델 내에서 직접적으로 매개변수와 조절변수를 통합할 수 있는 알고리즘을 제공하기 때문입니다. 예를 들어, PLS-SEM은 변수 간의 상호작용 효과를 계산하기 위해 별도의 상호작용 항목을 생성하고 이를 모델에 직접 포함시킬 수 있으며, 이 과정은 사용자에게 큰 계산적 부담을 주지 않습니다.

- 계산 효율성 : PLS-SEM은 계산상의 효율성이 뛰어나며, 복잡한 모델 구조에서도 빠르게 추정 결과를 제공합니다. 이는 PLS 알고리즘이 반복적으로 부분적 최소 제곱을 계산하여 모델 파라미터를 추정하기 때문입니다. 이 방법은 계산상 부담이 큰 대규모 행렬 연산을 최소화하며, 따라서 상대적으로 큰 데이터 세트와 복잡한 모델에서도 높은 계산 효율을 보입니다.

- 상호작용 효과의 통합 : PLS-SEM을 사용하면 사용자가 모델 내에서 직접적인 상호작용 변수를 정의하고, 이러한 상호작용을 통한 효과를 분석할 수 있습니다. 이는 변수 간의 복잡한 관계를 탐색하고, 특정 조건 하에서의 효과 변화를 관찰하는 데 유용합니다. 반면, CB-SEM에서는 상호작용 효과를 모델링하기 위해 더 복잡한 절차와 추가적인 모델 수정이 필요할 수 있습니다.

- 소프트웨어와 도구의 지원 : PLS-SEM을 위한 소프트웨어(예: SmartPLS)는 사용자 친화적 인터페이스를 제공하며, 매개변수, 조절변수, 그리고 상호작용 효과를 포함한 복잡한 모델을 쉽게 설정하고 분석할 수 있는 다양한 도구를 제공합니다. 이러한 도구는 연구자가 복잡한 모델 구조를 효과적으로 구현하고 분석 결과를 해석하는 데 도움을 줍니다.

이러한 이유로, 연구의 분석 모델이 매개 효과, 조절 효과, 그리고 상호작용 효과를 포함하는 복잡한 구조를 가지고 있을 경우, PLS-SEM은 해당 복잡성을 더 효율적으로 다룰 수 있는 방법론으로 판단됩니다.

Chin, W. W., Marcolin, B. L., & Newsted, P. R. (2003). A partial least squares latent variable modeling approach for measuring interaction effects: Results from a Monte Carlo simulation study and an electronic-mail emotion/adoption study. Information

Systems Research, 14(2), 189-217.

케이스 #5. 소규모 크기의 표본을 분석할 경우

PLS-SEM은 상대적으로 작은 표본 크기로도 안정적인 추정치를 제공할 수 있는 강력한 분석 도구입니다. 이는 특히 표본 크기가 제한된 연구 상황에서 유용하며, PLS-SEM의 이러한 유연성은 이론적 연구를 소규모 표본으로도 효과적으로 수행할 수 있게 합니다.

"소규모 표본 크기"의 기준은 연구의 복잡성, 모델의 구조, 그리고 사용된 지표의 수 등 여러 요인에 의해 결정됩니다. 일반적으로, PLS-SEM은 CB-SEM과 비교하여 적은 수의 표본으로도 뛰어난 성능을 보입니다.

PLS-SEM에서는 '최소 10배 규칙'을 기준으로 삼는 경우가 많습니다. 이 규칙에 따르면, 모델 내에서 예측 변수가 가장 많은 구성 개념에 대해 적어도 10배 이상의 표본이 필요합니다. 예를 들어, 어떤 구성 개념이 3개의 예측 변수를 가지고 있다면, 최소 30개의 표본이 요구됩니다. 이러한 기준은 PLS-SEM을 사용하기에 적합한 표본 크기를 결정하는 데 도움을 줍니다. 실제로, PLS-SEM은 30개 이하의 표본에서도 사용되는 경우가 있으며, 이는 CB-SEM에서 요구되는 수백 개의 표본에 비해 상당히 낮은 수치입니다.

PLS-SEM의 효과적인 사용을 위한 표본 크기는 또한 연구의 복잡성과 목적에 따라 달라집니다. 단순한 모델 구조나 탐색적 연구의 경우, 30에서 100개 사이의 표본이 적절할 수 있습니다. 반면, 더 복잡한 모델이나 높은 예측 정확도를 요구하는 연구에서는 최소 200개 이상의 표본이 필요할 수 있습니다. 그럼에도 불구하고, PLS-SEM은 이러한 상황에서도 CB-SEM에 비해 적은 표본 크기를 허용하는 장점을 가집니다.

결론적으로, PLS-SEM을 활용하는 경우, 표본 크기의 결정은 연구의 구체적인 조건과 목적을 고려해야 합니다. PLS-SEM의 이러한 유연성은 다양한 연구 맥락에서의 적용 가능성을 확장하며, 소규모 표본에서도 신뢰할 수 있는 분석 결과를 얻을 수 있도록 합니다.

Sarstedt, M., Ringle, C. M., & Hair, J. F. (2021). Partial least squares structural equation modeling. In Handbook of market research (pp. 587-632). Cham: Springer International Publishing.

Hair, J. F., Ringle, C. M., & Sarstedt, M. (2011). PLS-SEM: Indeed a silver bullet. Journal of Marketing theory and Practice, 19(2), 139-152.

Wong, K. K. K. (2013). Partial least squares structural equation modeling (PLS-SEM) techniques using SmartPLS. Marketing bulletin, 24(1), 1-32.

Henseler, J., Ringle, C. M., & Sarstedt, M. (2015). A new criterion for assessing discriminant validity in variance-based structural equation modeling. Journal of the academy of marketing science, 43, 115-135.

연사모 논문컨설팅 (dataprizm.net) 제공

다음글CB-SEM vs. PLS-SEM 비교 [가이드라인] 24.04.10

댓글목록

등록된 댓글이 없습니다.

인기검색어

PLS-SEM 길라잡이