Kiểm định Independent Samples T-Test trong SPSS: So sánh 2 giá trị trung bình

Mở đầu:

Kiểm định Independent Sample T-test là một phương pháp thống kê dùng để so sánh trung bình của hai nhóm độc lập khác nhau. Nó kiểm tra xem có sự khác biệt ý nghĩa giữa trung bình của hai nhóm dữ liệu hay không dựa trên giả định rằng dữ liệu trong mỗi nhóm đều tuân theo phân phối chuẩn và có phương sai bằng nhau.

Trong quá trình thực hiện kiểm định này, ta tính toán giá trị T-score dựa trên sự khác biệt giữa hai trung bình mẫu cùng với sự biến động của dữ liệu. Kết quả của kiểm định là giá trị T-score và giá trị p-value, một chỉ số quan trọng để đánh giá sự khác biệt giữa hai nhóm dữ liệu. Nếu giá trị p-value nhỏ hơn mức ý nghĩa đã đặt trước (thường là 0.05), chúng ta có thể kết luận rằng có sự khác biệt ý nghĩa giữa hai trung bình mẫu.

 

Video hướng dẫn chạy Independent sample t test trên SPSS

So sánh 2 giá trị trung bình trong SPSS là một phương pháp phân tích dữ liệu thống kê để so sánh hai nhóm và xác định sự khác biệt về giá trị trung bình của chúng. Qua việc sử dụng SPSS, bạn có thể dễ dàng tiến hành phân tích này và thu được kết quả chính xác, từ đó giúp bạn hiểu rõ hơn về sự khác biệt giữa các nhóm.

Nội dung chính VIDEO
0:00 Giới thiệu kiểm định
0:40 1 số giả định
3:55 Kiểm tra các giả định số 4 và 5: Điểm ngoại lệ và tính phân phối chuẩn
10:40 Thao tác kiểm định Independent sample t test trên SPSS
14:30 Liên hệ và so sánh kết quả với phân tích hồi quy tuyến tính

Chú ý: Nểu giả định phân phối chuẩn của biến phụ thuộc không thỏa mãn hãy chuyển đến bài Kiểm định Mann-Whitney

Trung bình

Khái niệm

Trung bình là một chỉ số thống kê dùng để biểu diễn giá trị trung tâm của một tập hợp các con số. Trung bình được tính bằng cách cộng tất cả các giá trị trong tập hợp rồi chia cho số lượng các giá trị đó.

Ví dụ

Ví dụ, trong một nghiên cứu về điểm số của sinh viên trong một bài kiểm tra, chúng ta có thể tính trung bình điểm số của toàn bộ sinh viên để biết được điểm trung bình của lớp. Trung bình là một chỉ số quan trọng để đánh giá sự phân phối và khái quát hóa thông tin về dữ liệu.

So sánh trung bình 2 mẫu độc lập

So sánh trung bình là một phương pháp thống kê được sử dụng để so sánh giá trị trung bình của hai nhóm hoặc nhiều nhóm khác nhau. Phương pháp này thường được áp dụng khi chúng ta muốn biết liệu có sự khác biệt đáng kể giữa các nhóm hay không. So sánh trung bình có thể được áp dụng cho cả biến liên tục và biến rời rạc.

Để thực hiện so sánh trung bình, chúng ta cần xác định các nhóm mà chúng ta muốn so sánh. Các nhóm này có thể là các nhóm ngẫu nhiên hoặc các nhóm đã được xác định từ trước. Sau đó, chúng ta thu thập dữ liệu từ mỗi nhóm và tính giá trị trung bình của mỗi nhóm. Cuối cùng, chúng ta sử dụng các phương pháp thống kê để kiểm tra xem có sự khác biệt đáng kể giữa các giá trị trung bình hay không.

Phương pháp t-test

Một trong những phương pháp thống kê thông dụng để so sánh trung bình là t-test. T-test được sử dụng khi chúng ta chỉ có hai nhóm để so sánh. Có hai loại t-test: t-test độc lập và t-test phụ thuộc.

T-test độc lập được sử dụng khi chúng ta muốn so sánh trung bình của hai nhóm độc lập. Ví dụ, chúng ta có thể muốn biết liệu có sự khác biệt giữa điểm số toán của nam và nữ trong một lớp học. Trong trường hợp này, chúng ta có thể sử dụng t-test độc lập để kiểm tra xem có sự khác biệt đáng kể giữa hai nhóm hay không.

Giả định phương sai bằng nhau

Một trong các giả định quan trọng khi sử dụng t-test là giả định về phương sai. Giả định này cho rằng phương sai của hai nhóm là bằng nhau. Nếu giả định này không được thoả mãn, chúng ta cần sử dụng một phiên bản khác của t-test gọi là t-test không đồng nhất.

Để kiểm tra xem giả định về phương sai bằng nhau có thoả mãn hay không, chúng ta có thể sử dụng một số phương pháp thống kê như Levene’s test hay Bartlett’s test. Nếu giả định này không thoả mãn, chúng ta có thể sử dụng t-test không đồng nhất để so sánh trung bình của hai nhóm.

So sánh trung bình

Phân tích so sánh trung bình

Trong phân tích thống kê, so sánh trung bình là một phương pháp được sử dụng để xác định sự khác biệt giữa hai hoặc nhiều nhóm trong một biến số liên tục. Phương pháp này thường được áp dụng khi chúng ta muốn biết liệu có sự khác biệt ý nghĩa giữa các nhóm hay không. Để thực hiện phân tích so sánh trung bình, chúng ta cần xác định các giả định và sử dụng các phương pháp thống kê như t-test hoặc ANOVA.

Giả định về phân phối chuẩn

Một trong những giả định quan trọng khi áp dụng phân tích so sánh trung bình là giả định về phân phối chuẩn của dữ liệu. Nếu dữ liệu không tuân theo phân phối chuẩn, chúng ta cần áp dụng các biến đổi hoặc các phương pháp thống kê phi tham số để xử lý.

Dưới đây là một số bước cơ bản để thực hiện so sánh trung bình:
1. Thu thập dữ liệu từ các nhóm cần so sánh.
2. Kiểm tra giả định về phân phối chuẩn của dữ liệu.
3. Xác định giả định về phương sai (có giả định phương sai bằng nhau hoặc không).
4. Áp dụng phương pháp thống kê thích hợp như t-test hoặc ANOVA để tính toán giá trị p-value và xác định sự khác biệt ý nghĩa giữa các nhóm.

Biến kiểm tra

Khái niệm biến kiểm tra

Trong thống kê, biến kiểm tra là một biến số được sử dụng để xác định sự khác biệt ý nghĩa giữa các nhóm trong một nghiên cứu. Biến kiểm tra có thể là một biến số liên tục hoặc rời rạc, và được chọn dựa trên mục tiêu của nghiên cứu.

Ví dụ về biến kiểm tra

Giả sử chúng ta muốn xem xét sự khác biệt về chỉ số IQ giữa nam và nữ trong một nhóm sinh viên. Trong trường hợp này, “giới tính” là một biến kiểm tra, vì chúng ta quan tâm đến sự khác biệt giữa hai nhóm nam và nữ.

Các bước để thực hiện phân tích với biến kiểm tra:
1. Xác định biến kiểm tra dựa trên mục tiêu của nghiên cứu.
2. Thu thập dữ liệu từ các nhóm cần so sánh.
3. Áp dụng phương pháp thống kê thích hợp như t-test hoặc chi-square để xác định sự khác biệt ý nghĩa giữa các nhóm.

Biến phân nhóm

Khái niệm

Biến phân nhóm là một quy trình trong thống kê dùng để phân loại các cá thể hoặc đối tượng vào các nhóm khác nhau dựa trên các đặc điểm chung. Quá trình này giúp chúng ta hiểu rõ hơn về sự khác biệt và tương quan giữa các nhóm, từ đó đưa ra các kết luận và quyết định có ý nghĩa.

Ví dụ

Ví dụ, trong một nghiên cứu về hiệu quả của một loại thuốc mới, chúng ta có thể phân loại các bệnh nhân thành hai nhóm: một nhóm được điều trị bằng thuốc mới và một nhóm được điều trị bằng thuốc thông thường. Sau đó, chúng ta so sánh kết quả điều trị của hai nhóm để xem liệu có sự khác biệt đáng kể hay không.

Xác định các nhóm

Quy trình xác định

Để xác định các nhóm trong nghiên cứu, chúng ta cần xem xét các yếu tố quan trọng và tiêu chuẩn để phân loại. Có thể sử dụng các tiêu chí như độ tuổi, giới tính, vị trí địa lý, hoặc bất kỳ yếu tố nào khác có liên quan đến mục tiêu của nghiên cứu.

Ví dụ

Ví dụ, trong một nghiên cứu về tình hình kinh doanh của các công ty trong một ngành công nghiệp, chúng ta có thể xác định các nhóm dựa trên doanh thu hàng năm. Các công ty có doanh thu cao hơn mức trung bình sẽ được phân vào nhóm “cao” và các công ty có doanh thu thấp hơn mức trung bình sẽ được phân vào nhóm “thấp”.

Giả định phương sai bằng nhau không được thỏa mãn

Khái niệm

Giả định phương sai bằng nhau là giả định rằng các nhóm so sánh trong một nghiên cứu có phương sai (độ biến thiên) tương tự. Tuy nhiên, trong một số trường hợp, giả định này không được thoả mãn và chúng ta cần xem xét các phương pháp thống kê thay thế để xử lý việc này.

Ví dụ

Ví dụ, trong một nghiên cứu về hiệu quả của hai phương pháp giảm cân khác nhau, chúng ta có thể so sánh trung bình cân nặng giữa hai nhóm. Tuy nhiên, nếu phương sai của các nhóm này không tương đồng, việc so sánh trung bình mà không xem xét đến sự khác biệt về phương sai có thể dẫn đến kết quả sai lệch.

Giả định phương sai bằng nhau được giả định

Khái niệm

Giả định phương sai bằng nhau được giả định là giả định rằng các nhóm so sánh trong một nghiên cứu có phương sai (độ biến thiên) tương tự. Khi giả định này thoả mãn, chúng ta có thể sử dụng các phương pháp thống kê thông thường để so sánh trung bình hoặc hiệu ứng của các nhóm.

Ví dụ

Ví dụ, trong một nghiên cứu về hiệu quả của hai loại thuốc điều trị căn bệnh, chúng ta có thể so sánh trung bình kết quả điều trị giữa hai nhóm. Nếu giả định rằng phương sai của hai nhóm này tương đồng, chúng ta có thể sử dụng các phương pháp thống kê như kiểm định t hoặc phân tích phương sai (ANOVA) để xác định sự khác biệt giữa các nhóm.

Sig- α (mức ý nghĩa)

Ý nghĩa của Sig.

Sig. là viết tắt của “significance” trong tiếng Anh, có nghĩa là ý nghĩa thống kê. Trong các bài báo khoa học và nghiên cứu, Sig. thường được sử dụng để chỉ ra mức ý nghĩa thống kê của một kết quả hoặc mối liên hệ giữa các biến.

Ví dụ

Ví dụ, khi chúng ta tiến hành một kiểm định thống kê để so sánh trung bình hai nhóm, Sig. được hiển thị trong bảng kết quả để cho biết liệu sự khác biệt giữa hai nhóm có ý nghĩa từ một góc nhìn thống kê hay không. Nếu Sig. < 0.05, chúng ta có thể kết luận rằng sự khác biệt giữa hai nhóm là có ý nghĩa từ một góc nhìn thống kê.

 

Quy trình đọc kết quả kiểm định Independent Samples T-Test trong SPSS

Trước khi xem minh hoạ thực hành, các bạn lướt qua xem quy tắc đọc kết quả của kiểm định này trên SPSS nhé

Bước Nội dung Kết quả (nếu có) Chuyển đến
Bước 1 Kiểm định sự bằng nhau của phương sai giữa các nhóm: Levenne’s Test sig >0.05, kết luận phương sai giữa 2 nhóm  đồng nhất Bước 2
sig <0.05, kết luận phương sai giữa 2 nhóm  không đồng nhất Bước 3
Bước 2 Kiểm định sự bằng nhau của giá trị trung bình, xem sig ở DÒNG TRÊN của  kiểm định t-test for Equality of Means sig >0.05, kết luận không có sự khác biệt về giá trị trung bình giữa 2 nhóm Kết thúc bài kiểm tra
sig <0.05, kết luận có sự khác biệt về giá trị trung bình giữa 2 nhóm Bước 4
Bước 3 Kiểm định sự bằng nhau của giá trị trung bình, xem sig ở DÒNG DƯỚI của  kiểm định t-test for Equality of Means sig >0.05, kết luận không có sự khác biệt về giá trị trung bình giữa 2 nhóm Kết thúc bài kiểm tra
sig <0.05, kết luận có sự khác biệt về giá trị trung bình giữa 2 nhóm Bước 4
Bước 4 So sánh cao- thấp giữa các nhóm Căn cứ bảng Group Statistics hoặc giá trị Mean Deffirent để đưa ra kết luận Kết thúc bài kiểm tra

 

Trở lại với bộ dữ liệu data22.sav. Để so sánh sự hài lòng tháng 6 của khách hàng nam và nữ

Thực hành Independent sample t test trên SPSS

Bước 1: Analyze > Compare means > Independent sample t test

Bước 2:

Đưa các biến phụ thuộc cần test vào (có thể đưa nhiều biến vào cùng lúc). Ở đây chỉ xét biến HAILONG_T6

Đưa biến phân loại vào ô Grouping variable, ở đây là gioitinh

Tại lựa chọn Define Groups bên dưới đưa giá trị đại diện cho các nhóm cần test vào , ở đay nam=1, nữ=2

Sau đó nhấn continuce > ok thu được kết quả

 

Đọc kết quả

Sig của kiểm đinh Levene =0.740 >0.05 nên phương sai biến phụ thuộc giữa các nhóm là đồng nhất (vậy t test sẽ dùng sig dòng trên)

Sig của kiểm đinh t test=0.022<0.05 nên giữa 2 nhóm có sự khác biệt (về giá trị trung bình)

Căn cứ vào giá trị trung bình có thể thấy sự hài lòng của nam thấp hơn của nữ

Đó là cách đọc kết quả. Còn khi trình bày vào bài thì các bạn cứ tuỳ nghi trích dẫn kết quả hợp lý là được