Trong phân tích nhân tố khám phá (EFA), việc loại bỏ các biến (còn gọi là items) “xấu” là một bước quan trọng để đảm bảo cấu trúc nhân tố được trích xuất là hợp lý, đáng tin cậy và có ý nghĩa lý thuyết. Các quy tắc này không phải là tuyệt đối mà mang tính hướng dẫn, và thường cần sự kết hợp giữa các chỉ số thống kê và lập luận lý thuyết của nhà nghiên cứu.
Các quy tắc chính để loại biến xấu trong EFA
Bạn sẽ thường phải chạy EFA nhiều lần, loại bỏ từng biến (hoặc một nhóm biến) sau mỗi lần chạy cho đến khi đạt được một cấu trúc nhân tố tối ưu và các chỉ số phù hợp.
1. Hệ số tải nhân tố (Factor Loading) quá thấp
Quy tắc: Một biến quan sát được coi là “tải” lên một nhân tố nếu nó có mối tương quan mạnh với nhân tố đó. Hệ số tải nhân tố (Factor Loading) thể hiện mức độ mối quan hệ này.
Tiêu chí:
Tối thiểu: Hệ số tải tuyệt đối thường phải ≥ 0.3 để được giữ lại. Đây là ngưỡng tối thiểu.
Chấp nhận được: ≥ 0.5 thường được coi là tốt.
Rất tốt: ≥ 0.7 được coi là rất tốt.
Hành động: Nếu một biến có hệ số tải thấp hơn ngưỡng quy định (thường là 0.5 hoặc 0.4 tùy nghiên cứu và kích thước mẫu), hãy loại bỏ biến đó và chạy lại EFA.
2. Tải chéo (Cross-Loadings)
Quy tắc: Một biến lý tưởng chỉ nên tải mạnh lên một nhân tố duy nhất. Khi một biến tải mạnh lên hai hoặc nhiều nhân tố cùng một lúc (hệ số tải cao trên nhiều nhân tố), nó được gọi là tải chéo.
Tiêu chí:
Nếu một biến có hệ số tải ≥ 0.4 (hoặc 0.5) trên hai hoặc nhiều nhân tố, và sự chênh lệch giữa các hệ số tải lớn nhất không đủ lớn (ví dụ: chênh lệch < 0.1 hoặc < 0.2 tùy theo quy tắc bạn chọn).
Hành động:
Ưu tiên loại bỏ: Biến có tải chéo thường là ứng cử viên hàng đầu để loại bỏ, vì nó gây mơ hồ về việc biến đó thuộc về nhân tố nào.
Quy tắc loại bỏ: Thường loại bỏ biến có tải chéo có sự chênh lệch nhỏ nhất giữa các hệ số tải trên các nhân tố.
Xem xét lý thuyết: Đôi khi, một biến có tải chéo có thể được giữ lại nếu có lý do lý thuyết mạnh mẽ hoặc nếu nó cần thiết cho phạm vi của thang đo và bạn có thể điều chỉnh mô hình sau này trong CFA.
3. Communalities (Hệ số trích) thấp
Quy tắc: Communality của một biến quan sát thể hiện tỷ lệ phương sai của biến đó được giải thích bởi các nhân tố chung được trích xuất.
Tiêu chí: Communalities thường nên ≥ 0.4 (hoặc 0.5). Một số trường hợp có thể chấp nhận thấp hơn với mẫu lớn.
Hành động: Nếu một biến có communality quá thấp, điều đó có nghĩa là các nhân tố được trích xuất không giải thích được nhiều sự biến động của biến đó. Biến này có thể không phù hợp với cấu trúc nhân tố và nên được loại bỏ.
4. Vấn đề về ý nghĩa lý thuyết của nhân tố
Quy tắc: Sau khi trích xuất các nhân tố và loại bỏ biến, các nhân tố còn lại phải có ý nghĩa về mặt lý thuyết và có thể được đặt tên một cách hợp lý.
Hành động: Nếu một nhân tố chỉ còn lại một hoặc hai biến quan sát sau khi loại bỏ các biến xấu (thường cần ít nhất 3 biến cho mỗi nhân tố để đảm bảo tính ổn định và khái quát hóa), hoặc nếu các biến trong một nhân tố không có sự liên kết lý thuyết rõ ràng, bạn có thể cân nhắc:
Loại bỏ toàn bộ nhân tố đó.
Xem xét lại thang đo hoặc cách đặt câu hỏi ban đầu.
5. Eigenvalue và tổng phương sai trích (Total Variance Explained)
Quy tắc:
Eigenvalue: Thường thì các nhân tố được giữ lại phải có Eigenvalue ≥ 1. Quy tắc này (Kaiser’s criterion) là một điểm khởi đầu phổ biến.
Tổng phương sai trích: Tổng phương sai được giải thích bởi tất cả các nhân tố được giữ lại thường nên ≥ 50% (hoặc 60%).
Hành động:
Nếu các chỉ số này không đạt, bạn có thể cần điều chỉnh số lượng nhân tố được trích xuất (ví dụ: dựa trên biểu đồ Scree plot) hoặc xem xét lại chất lượng biến quan sát. Mặc dù đây không phải là tiêu chí trực tiếp để loại bỏ biến, nhưng nó giúp đánh giá liệu EFA có thành công trong việc giảm chiều dữ liệu hay không.
6. Bartlett’s Test of Sphericity và KMO (Kaiser-Meyer-Olkin)
Quy tắc: Đây là các kiểm định sự phù hợp của dữ liệu để thực hiện EFA.
Bartlett’s Test of Sphericity: p-value phải < 0.05.
KMO: Giá trị KMO phải ≥ 0.5 (mức chấp nhận tối thiểu). Giá trị tốt hơn là > 0.7, rất tốt > 0.8.
Hành động: Nếu các chỉ số này không đạt, dữ liệu của bạn có thể không phù hợp để thực hiện EFA ngay từ đầu. Điều này không trực tiếp chỉ ra biến nào để loại, nhưng nó báo hiệu rằng bạn có thể cần xem xét lại dữ liệu hoặc thiết kế thang đo.
Quy trình loại biến lặp đi lặp lại
Khi loại biến, hãy tuân thủ quy trình lặp đi lặp lại:
Chạy EFA lần đầu.
Xem xét kết quả:
Tìm biến có hệ số tải thấp nhất hoặc biến có tải chéo nghiêm trọng nhất.
Ưu tiên loại từng biến một: Loại bỏ một biến xấu nhất mỗi lần và sau đó chạy lại EFA. Việc loại bỏ nhiều biến cùng lúc có thể làm thay đổi đáng kể cấu trúc nhân tố và khó kiểm soát.
Tiếp tục lặp lại quá trình này cho đến khi tất cả các biến còn lại đáp ứng các tiêu chí trên và cấu trúc nhân tố là hợp lý về mặt lý thuyết.
Lập luận lý thuyết: Luôn kết hợp các tiêu chí thống kê với lý thuyết của bạn. Đôi khi, một biến có thể không đạt ngưỡng hoàn hảo nhưng lại quan trọng về mặt lý thuyết và bạn quyết định giữ nó lại (có ghi chú trong báo cáo). Ngược lại, một biến có vẻ tốt về mặt thống kê nhưng không phù hợp về mặt lý thuyết cũng nên được xem xét loại bỏ.