PHÂN TÍCH PHƯƠNG SAI MỘT YẾU TỐ (ANOVA)

Dùng để kiểm định giả thuyết trung bình bằng nhau của các nhóm mẫu với khả năng phạm sai lầm chỉ là 5%.
Ví dụ: Phân tích sự khác biệt giữa các thuộc tính khách hàng (giới tính, tuổi, nghề nghiệp, thu nhập…) đối với 1 vấn đề nào đó (thường chọn là nhân tố phụ thuộc, vd: sự hài lòng).
Một số giả định khi phân tích ANOVA:
– Các nhóm so sánh phải độc lập và được chọn một cách ngẫu nhiên.
– Các nhóm so sánh phải có phân phối chuẩn or cỡ mẫu phải đủ lớn để được xem như tiệm cận phân phối chuẩn.
– Phương sai của các nhóm so sánh phải đồng nhất.
Lưu ý: nếu giả định tổng thể có phân phối chuẩn với phương sai bằng nhau không đáp ứng được thì bạn có thể dùng kiểm định phi tham số Kruskal-Wallis sẽ để thay thế cho ANOVA.

====

* Levene test: Ho: “Phương sai bằng nhau”
– Sig < 0.05: bác bỏ Ho
– Sig >=0.05: chấp nhận Ho -> đủ điều kiện để phân tích tiếp anova
* ANOVA test: Ho: “Trung bình bằng nhau”
– Sig >0.05: chấp nhận Ho -> chưa đủ điều kiện để khẳng định có sự khác biệt…
– Sig <=0.05: bác bỏ Ho -> đủ điều kiện để khẳng định có sự khác biệt…
* Khi có sự khác biệt thì có thể phân tích sâu hơn để tìm ra sự khác biệt như thế nào giữa các nhóm quan sát.

===

PHÂN TÍCH SÂU ANOVA
Để phân tích ANOVA có ý nghĩa hơn, người ta thường tiến hành phân tích sâu ANOVA sau bước phân tích ANOVA cơ bản.

Có 2 phương pháp, đó là  kiểm định “sau” (Post-Hoc test) và kiểm định “trước” (Priori Contrasts).

Phương pháp gần với phương pháp nghiên cứu thực là Post-Hoc test . Do đó trên thực tế người ta thường dùng Post-Hoc test để thực hiện phân tích sâu ANOVA nhằm tìm ra chỗ khác biệt. Một số phương pháp Post-Hoc test thường sử dụng là:
* LSD: dùng kiểm định t lần lượt cho từng cặp trung bình nhóm. Nhược điểm của nó là độ tin cậy không cao vì làm gia tăng mức độ phạm sai lầm tương ứng với việc so sánh nhiều nhóm cùng một lúc.
* Bonferroni: giống quy tắc của LSD nhưng điều chỉnh được mức ý nghĩa khi tiến hành so sánh bội dựa trên số lần tiến hành so sánh. Đây là thủ tục đơn giản và thường được sử dụng.
* Tukey: cũng được sử dụng phổ biến cho việc tìm kiếm các trung bình các nhóm khác biệt. Nó sử dụng bảng phân phối Studentizze range distribution. Tukey hiệu quả hơn Bonferroni khi số lượng các cặp trung bình cần so sánh khá nhiều.
* Scheffe: phương pháp này kém nhạy hơn trong việc so sánh các trị trung bình của các cặp, nó đòi hỏi phải có sự khác biệt lớn giữa các trị trung bình so với các thủ tục so sánh bội khác để bảo đảm có sự khác biệt thực sự, nhưng vì thế nó đưa ra kết quả thận trọng hơn.
* R-E-G-W: thực hiện 2 bước kiểm định, đầu tiên nó tiến hành kiểm định lại toàn bộ các trị trung bình nhóm xem có bằng nhau không; nếu không bằng thì bước kế tiếp nó sẽ kiểm định để tìm các nhóm nào khác biệt thực sự với nhau về trị trung bình. Nhưng kiểm định này không phù hợp khi kích cỡ các nhóm mẫu không bằng nhau.
* Dunnett: là thủ tục cho phép chọn so sánh các trị trung bình của các nhóm mẫu còn lại với một trị trung bình của một nhóm mẫu cụ thể nào đó được chọn ra so sánh (nhóm điều khiển), SPSS mặc định chọn nhóm cuối (Last) để làm nhóm điều khiển.
** Trong TH phương sai giữa các đối tượng cần so sánh khác nhau, người ta hay chọn Tamhane’s T2 (kiểm định t từng cặp trường hợp phương sai khác nhau)
Lưu ý: việc sử dụng kiểm định nào là tùy thuộc vào mục đích của nhà nghiên cứu và tình hình thực tế của nghiên cứu.