HỒI QUY VÀ TƯƠNG QUAN

Hồi quy và tương quan khác nhau về mục đích và kỹ thuật. Phân tích tương quan trước hết là đo mức độ kết hợp tuyến tính giữa các biến. Ví dụ: mức độ quan hệ giữa nghiện thuốc là và ung thư phổi, giữa kết quả thi môn Lý và môn Toán… Nhưng phân tích hồi quy lại ước lượng hoặc dự báo một biến (biến phụ thuộc) trên cơ sở giá trị đã cho của các biến khác (biến độc lập). Về kỹ thuật, trong phân tích hồi quy các biến không có tính chất đối xứng. Biến phụ thuộc là đại lượng ngẫu nhiên. Các biến giải thích giá trị của chúng (biến độc lập) đã được xác định. Trong phân tích tương quan không có sự phân biệt giữa các biến, chúng có tính chất đối xứng.
Tóm lại, hồi quy thì tương quan (hay nói cách khác đk để hồi quy thì trước hết phải tương quan), còn tương quan thì chưa chắc đã hồi quy.

(st)

CÁCH TÍNH NHÂN SỐ ĐẠI DIỆN CHO NHÂN TỐ

Sau khi chạy Cronbach’s alpha để kiểm tra độ tin cậy thang đo xong, bạn sẽ phân tích nhân tố EFA để khẳng định lại mô hình nghiên cứu của bạn có bao nhiêu nhân tố.
Nếu bạn tiếp tục chạy tương quan và hồi quy đa biến… trong SPSS thì bước tiếp theo là phải tính được nhân số đại diện cho các nhân tố này. Thường có 2 cách:
C1. Bạn có thể dùng hàm mean để tính trung bình cộng các biến quan sát thuộc nhân tố để làm nhân số đại diện (cách này được áp dụng khá phổ biến vì dễ giải thích).
C2. Khi phân tích EFA trong SPSS, bạn chọn nút Scores để lưu lại nhân số đại diện của nhân tố một cách tự động (SPSS sẽ tính giúp bạn). Nhân số tính theo cách này đã được SPSS chuẩn hóa. Theo kinh nghiệm thì cách này phù hợp khi bạn sử dụng các nhân số này để phân tích hồi quy, kiểm định mối quan hệ ảnh hưởng của các biến độc lập lên biến phụ thuộc… và đặc biệt thích hợp trong TH các biến quan sát có đơn vị tính khác nhau. Còn nếu bạn dùng để thống kê mô tả, t-test or ANOVA… thì không nên vì khi đó sẽ khó giải thích kết quả.

(st)

PHÂN TÍCH NHÂN TỐ KHÁM KHÁ EFA & PHÂN TÍCH NHÂN TỐ KHẲNG ĐỊNH CFA

PHÂN TÍCH NHÂN TỐ KHÁM PHÁ EFA
EFA được dùng đến trong trường hợp mối quan hệ giữa các biến quan sát và biến tiềm ẩn là không rõ ràng hay không chắc chắn. Phân tích EFA theo đó được tiến hành theo kiểu khám phá để xác định xem phạm vi, mức độ quan hệ giữa các biến quan sát và các nhân tố cơ sở như thế nào, làm nền tảng cho một tập hợp các phép đo để rút gọn hay giảm bớt số biến quan sát tải lên các nhân tố cơ sở. Số lượng các nhân tố cơ sở tùy thuộc vào mô hình nghiên cứu, trong đó chúng ràng buộc nhau bằng cách xoay các vector trực giao nhau để không xảy ra hiện tượng tương quan. Phân tích nhân tố khám phá EFA rất hữu dụng trong bước thực nghiệm ban đầu hay mở rộng kiểm định
PHÂN TÍCH NHÂN TỐ KHẲNG ĐỊNH CFA
CFA sử dụng thích hợp khi nhà nghiên cứu có sẵn một số kiến thức về cấu trúc biến tiềm ẩn cơ sở. Trong đó mối quan hệ hay giả thuyết (có được từ lý thuyết hay thực nghiệm) giữa biến quan sát và nhân tố cơ sở thì được các nhà nghiên cứu mặc nhiên thừa nhận khi tiến hành kiểm định thống kê. Như vậy CFA là bước tiếp theo của EFA nhằm kiểm định xem có một mô hình lý thuyết có trước làm nền tảng cho một tập hợp các quan sát không. CFA cũng là một dạng của SEM. Khi xây dựng CFA, các biến quan sát cũng là các biến chỉ báo trong mô hình đo lường, bởi vì chúng cùng “tải” lên khái niệm lý thuyết cơ sở. Phương pháp phân tích nhân tố khẳng định CFA chấp nhận các giả thuyết của các nhà nghiên cứu, được xác định căn cứ theo quan hệ giữa mỗi biến và một ha nhiều hơn một nhân tố.
(st)

FACTOR LOADING trong Phân tích nhân tố khám phá EFA

Theo Hair & ctg (1998,111), Factor loading là chỉ tiêu để đảm bảo mức ý nghĩa thiết thực của EFA (ensuring practical significance).

  • Factor loading >0.3 được xem là đạt được mức tối thiểu,
  • >0.4 được xem là quan trọng ,
  • >=0.5 được xem là có ý nghĩa thực tiễn.

Hair & ctg (1998,111) cũng khuyên như sau:

  • nếu chọn tiêu chuẩn Factor loading >0.3 thì cỡ mẫu của bạn ít nhất phải là 350,
  • nếu cỡ mẫu của bạn khoảng 100 thì nên chọn tiêu chuẩn Factor loading >0.55 (thường có thể chọn 0.5),
  • nếu cỡ mẫu của bạn khoảng 50 thì Factor loading phải >0.75

Lỗi khi chạy EFA không hiện bảng KMO

Lỗi khi chạy EFA không hiện bảng KMO mặc dù có chọn: “This matrix is not positive definite” (như hình mô tả).

Lỗi này thường là do trong dữ liệu của các bạn có những biến (items) tương quan rất mạnh với nhau, có thể biến này là tổ hợp của các biến khác chẳng hạn. Và câu báo lỗi đưa ra của SPSS “This matrix is not positive definite” cũng chẳng ăn nhập gì với ND lỗi nên thường làm các bạn bối rối, khó hiểu
Cách khắc phục là bạn tìm loại bớt các biến có tương quan mạnh với nhau như thế, vì đây gần như là có sự trùng lắp dữ liệu. Nếu bạn qua được bước này thì về sau bạn cũng sẽ đối mặt với vấn đề đa cộng tuyến khi chạy hồi quy áh.
Bạn có thể chạy tương quan cho các biến này để tìm ra các biến có tương quan mạnh với nhau nhé

EFA TRƯỚC HAY CRONBACH’S ALPHA TRƯỚC

Một số bạn hay hỏi vấn đề này nên mình trả lời chung luôn nhé
Thông thường khi chạy dữ liệu mình sẽ thực hiện chạy cronbach’s alpha cho từng thang đo để đánh giá độ tin cậy của từng thang đo, sau đó sẽ bỏ chung tất cả các thang đo (tất cả các biến độc lập) vào chạy EFA để xem các biến gom lại or tách ra thành những nhân tố nào (or có thể chúng sẽ giữ nguyên như ban đầu nếu thiết kế bảng câu hỏi tốt). Bạn cũng cần chạy EFA riêng cho biến phụ thuộc nữa.
Tuy nhiên, nếu bạn kỹ hơn, bước đầu tiên bạn sẽ chạy EFA cho từng thang đo để kiểm tra tính đơn hướng của thang đo với đk như sau:
– kết quả phân tích ra 1 nhân tố duy nhất
– Giải thích được hơn 50% biến thiên của tập dữ liệu (% of Variance)
– Các biến có hệ số tải >0.5
Sau bước kiểm tra tính đơn hướng này bạn sẽ tiếp tục chạy cronbach’s alpha cho từng thang đo. Sau đó bỏ hết các biến độc lập vào chạy EFA như bình thường.

source: MBA BK HCM.

PHÂN TÍCH EFA – KIỂM TRA GIÁ TRỊ HỘI TỤ & GIÁ TRỊ PHÂN BIỆT

Như các bạn đã biết khi phân tích nhân tố khám phá EFA (Exploratory Factor Analysis) thì ngoài việc phải đảm bảo “Giá trị hội tụ” (các items hội tụ về cùng 1 nhân tố) thì còn phải đảm bảo “Giá trị phân biệt” (thuộc về nhân tố này và phải phân biệt với nhân tố khác).
Như trong hình minh họa, khi 1 items load đồng thời cùng lúc lên 2 or nhiều nhân tố, để đảm bảo “giá trị phân biệt” thì các hệ số tải của cùng 1 items đó khi load lên các nhân tố phải chênh nhau 0.3 thì lúc đó bạn mới giữ lại item này và nó sẽ thuộc về nhân tố mà nó tải lên cao nhất (đương nhiên là phải thỏa điều kiện hệ số tải >0.5). Trường hợp ngược lại thì bạn cân nhắc loại item này vì nó không thỏa việc đảm bảo “giá trị phân biệt”.
Lưu ý: khi có nhiều items vi phạm các điều kiện khi chạy EFA thì nguyên tắc là bạn sẽ loại từng item một, item nào xấu nhất sẽ bị loại trước.
Các bạn có thể tham khảo nguồn như sau nhé: “Tại mỗi Item, chênh lệch |Factor Loading| lớn nhất và |Factor Loading| bất kỳ phải >=0.3 (Jabnoun & Al-Tamimi, 2003)”

Source: MBA BK HCM

TỔNG QUAN PHÂN TÍCH NHÂN TỐ KHÁM PHÁ EFA

Trước khi kiểm định lý thuyết khoa học thì cần phải đánh giá độ tin cậy và giá trị của thang đo. Phương pháp Cronbach Alpha dùng để đánh giá độ tin cậy của thang đo. Còn phương pháp phân tích nhân tố khám phá EFA (Exploratory Factor Analysis, gọi tắt là phương pháp EFA) giúp chúng ta đánh giá hai loại giá trị quan trọng của thang đo là giá trị hội tụ và giá trị phân biệt.
Phương pháp phân tích nhân tố EFA thuộc nhóm phân tích đa biến phụ thuộc lẫn nhau (interdependence techniques), nghĩa là không có biến phụ thuộc và biến độc lập mà nó dựa vào mối tương quan giữa các biến với nhau (interrelationships). EFA dùng để rút gọn một tập k biến quan sát thành một tập F (F<k) các nhân tố có ý nghĩa hơn. Cơ sở của việc rút gọn này dựa vào mối quan hệ tuyến tính của các nhân tố với các biến nguyên thủy (biến quan sát).
Các tác giả Mayers, L.S., Gamst, G., Guarino A.J. (2000) đề cập rằng: Trong phân tích nhân tố, phương pháp trích Pricipal Components Analysis đi cùng với phép xoay Varimax là cách thức được sử dụng phổ biến nhất.
Theo Hair & ctg (1998, 111), Factor loading (hệ số tải nhân tố hay trọng số nhân tố) là chỉ tiêu để đảm bảo mức ý nghĩa thiết thực của EFA:
• Factor loading > 0.3 được xem là đạt mức tối thiểu
• Factor loading > 0.4 được xem là quan trọng
• Factor loading > 0.5 được xem là có ý nghĩa thực tiễn
Điều kiện để phân tích nhân tố khám phá là phải thỏa mãn các yêu cầu:
Hệ số tải nhân tố (Factor loading ) > 0.5
0.5 ≤ KMO ≤ 1: Hệ số KMO (Kaiser-Meyer-Olkin) là chỉ số được dùng để xem xét sự thích hợp của phân tích nhân tố. Trị số KMO lớn có ý nghĩa phân tích nhân tố là thích hợp.
Kiểm định Bartlett có ý nghĩa thống kê (Sig. < 0.05): Đây là một đại lượng thống kê dùng để xem xét giả thuyết các biến không có tương quan trong tổng thể. Nếu kiểm định này có ý nghĩa thống kê (Sig. < 0.05) thì các biến quan sát có mối tương quan với nhau trong tổng thể.
Phần trăm phương sai toàn bộ (Percentage of variance) > 50%: Thể hiện phần trăm biến thiên của các biến quan sát. Nghĩa là xem biến thiên là 100% thì giá trị này cho biết phân tích nhân tố giải thích được bao nhiêu %.

PHÂN TÍCH CRONBACH’S ALPHA – HỆ SỐ TƯƠNG QUAN BIẾN TỔNG & HỆ SỐ CRONBACH’S ALPHA KHI DELETE BIẾN

Đây là 1 vấn đề tương đối đơn giản khi phân tích độ tin cậy thang đo sử dụng phương pháp Cronbach’s alpha. Tuy nhiên nhiều bạn vẫn “loay hoay” và tương đối mất thời gian cho vấn đề này. Vì vậy hôm nay Ad post bài viết này hỗ trợ các bạn hiểu rõ hơn về các giá trị: hệ số tương quan biến – tổng (Corrected Item-Total Correlation) và Hệ số Cronbach’s alpha khi delete biến (Cronbach’s Alpha if Item Deleted)


Như các bạn đã biết người ta thường dùng phương pháp hệ số tin cậy Cronbach’s Alpha trước khi phân tích nhân tố khám phá EFA để loại các biến không phù hợp vì các biến rác này có thể tạo ra các nhân tố giả khi phân tích EFA (Nguyễn Đình Thọ & Nguyễn Thị Mai Trang, 2009).
Điều kiện khi chạy Cronbach’s alpha như sau:
– Hệ số cronbach’s alpha tổng (chung) > 0.6
– Hệ số tương quan biến – tổng > 0.3 (có nghĩa là loại các item có hệ số tương quan biến tống <0.3)
Cột hệ số tương quan biến tổng (cột gần cuối) (Corrected Item-Total Correlation) thì chắc các bạn đã biết rõ. Cột này cho biết item hiện tại có đóng góp nhiều hay ít cho thang đo chung hay không. Item nào không đóng góp nhiều thì hệ số tương quan biến – tổng thấp, nếu nhỏ hơn 0.3 thì phải loại ra vì có khả năng item này sẽ tạo thành những “biến rác” nếu đưa vào phân tích ở các bước sau.
Cột cuối cùng Cronbach’s Alpha if Item Deleted, thể hiện giá trị của hệ số cronbach’s alpha tổng (chung) khi item tương ứng bị loại. Các bạn lưu ý là các items “xấu”, không đóng góp nhiều cho thang đo chung thì khi delete đi sẽ làm tăng hệ số alpha tổng. Ví dụ như trong Hình 1, item INN1có hệ số tương quan biến – tổng 0.281 < 0.3 nên items này không đóng góp nhiều cho thang đo, quan sát cột cuối Cronbach’s Alpha if Item Deleted thấy rằng khi loại item này thì hệ số alpha tổng sẽ tăng từ 0.801 lên 0.893 (một con số đáng kể), do đó việc loại item này là hoàn toàn hợp lý, vì item này khá “xấu”.
Có 1 tình huống phát sinh cũng hay làm các bạn “bối rối” khi phân tích ở bước này được Ad mô tả như trong Hình 2. Đó là item CON2 có hệ số tương quan khá lớn 0.553 (>0.3) nhưng khi delete item này thì hệ số alpha tổng tăng từ 0.797 lên 0.811. Lúc này các bạn có 2 option: loại hay không loại item CON2? Các bạn có thể loại item này nếu muốn, vì đúng là item này đang làm “xấu” thang đo chung. Nhưng trong 1 số tình huống các bạn vẫn muốn giữ lại item này để phân tích ở các bước sau thì có thể lý luận như sau: hệ số tương quan biến – tổng của item CON2 khá lớn (thỏa điều kiện hệ số tương quan biến – tổng >0.3); đồng ý là khi delete item này thì hệ số alpha tổng tăng lên nhưng tăng không đáng kể; hơn nữa các items (câu hỏi) trong mô hình phải trải qua một quá trình tìm tòi, nghiên cứu… chứ không dễ dàng có được => Vì những lý do trên nên “tác giả” vẫn giữ lại item này để phân tích ở các bước sau.
(Nhóm Hỗ trợ SPSS – MBA ĐH Bách Khoa TPHCM)