Làm luận văn cao học UEH luôn phải chạy SPSS?

Làm luận văn cao học UEH luôn phải chạy SPSS?

 

Như các bạn đã biết việc làm luận văn cao học QTKD ở UEH từ khóa K22 có chuyện phân chia hướng nghề nghiệp hay nghiên cứu, chính điều này khiến cho các bạn hay so sánh việc của của bên mình với bên kia, bên nào hay hơn, bên nào đc trọng dụng hơn…. Thật tiếc chúng ta ko quan tâm đến việc học cái nào phù hợp chúng ta hơn. Continue reading “Làm luận văn cao học UEH luôn phải chạy SPSS?”

Tổng hợp các bài về SPSS

(Bài tổng hợp từ nhóm MBA BK HCM. Kevin xin note để học hỏi dần 😀 )

1/ TỔNG QUAN VỀ SPSS

  1. GIỚI THIỆU CHUNG VỀ SPSS
  2. 3 chương trình xử lý và phân tích thống kê
  3. 4 tính năng chính của SPSS
  4. Quy trình nghiên cứu cơ bản cho một đề tài luận văn NGHIÊN CỨU
  5. 7 bước cơ bản thực hiện 1 luận văn định lượng
  6. CÁCH IMPORT DATA TỪ EXCEL VÀO SPSS

2- DỮ LIỆU VÀ THANG ĐO TRONG SPSS

  1. Phân loại dữ liệu: định tính và định lượng
  2. Dữ liệu thứ cấp
  3. Phân tích dữ liệu định tính
  4. Các loại thang đo
  5. Thang đo đa biến
  6. Ý nghĩa giá trị trung bình trong thang đo khoảng

3- PHƯƠNG PHÁP NGHIÊN CỨU

  1. Nghiên cứu định tính và định lượng
  2. Tổng quát về nghiên cứu định tính
  3. Kỹ thuật phỏng vấn sâu
  4. Kỹ thuật thảo luận nhóm (focus group discussion)

4- CÁC VẤN ĐỀ VỀ MẪU

  1. Cách chọn mẫu trong nghiên cứu marketing
  2. Hiểu lầm về cỡ mẫu trong nghiên cứu khoa học

5- TỔNG HỢP CÁC PHƯƠNG PHÁP PHÂN TÍCH (ĐƠN BIẾN, NHỊ BIẾN, ĐA BIẾN)

  1. Phân tích đơn biến
  2. Phân tích nhị biến
  3. Phân tích đa biến
  4. Phân tích đa biến – Các phương pháp phân tích phụ thuộc

6- ĐỘ TIN CẬY THANG ĐO

  1. Đánh giá độ tin cậy thang đo
  2. Phân tích cronbach’s alpha với nhân tố có 2 items
  3. Trường hợp hệ số cronbach’s alpha tổng quá lớn (>0.95)
  4. Hệ số tương quan biến – tổng và hệ số cronbach’s alpha khi delete biến

7- PHÂN TÍCH NHÂN TỐ KHÁM PHÁ

  1. Tổng quan phân tích nhân tố khám phá EFA
  2. Kiểm tra Giá trị hội tụ và Giá trị phân biệt
  3. EFA trước hay cronbach’s alpha trước
  4. Lỗi khi chạy EFA không hiện bảng KMO
  5. Lỗi khi chạy EFA: “Rotation failed to converge in 25 iterations…”
  6. FACTOR LOADING trong Phân tích nhân tố khám phá EFA
  7. Phân tích nhân tố khám phá EFA vs Phân tích nhân tố khẳng định CFA

8- NHÂN SỐ ĐẠI DIỆN

  1. Cách tính nhân số đại diện cho nhân tố

9- PHÂN TÍCH TƯƠNG QUAN

  1. Hồi quy vs tương quan
  2. Phân tích tương quan Pearson

10- PHÂN TÍCH HỒI QUY

  1. Ý nghĩa R bình phương (hiệu chỉnh)
  2. Độ phù hợp của mô hình hồi quy binary logistic
  3. Vấn đề đa cộng tuyến (Multicolinearity)
  4. So sánh phân tích ANOVA, hồi quy đa biến, hồi quy binary logistic

11- PHÂN TÍCH ANOVA

  1. Kiểm định trung bình tổng thể
  2. Phân tích phương sai một yếu tố ANOVA

12- CÁC NỘI DUNG KHÁC

  1. Chia sẻ kinh nghiệm thực hiện đề tài luận văn nghiên cứu

 

CHIA SẺ VỀ KINH NGHIỆM THỰC HIỆN ĐỀ TÀI LUẬN VĂN NGHIÊN CỨU

Hôm qua Ad có dịp cafe’ trao đổi và “tâm sự” với 1 bạn sinh viên. Phải nói là các bạn SV ngày nay rất giỏi và năng động (hơn Ad ngày xưa rất nhiều). Các bạn vừa học giỏi kiến thức nhưng đồng thời cũng tự trao dồi thêm những kỹ năng mềm cũng như tham gia sinh hoạt trong nhiều các CLB đội nhóm, CTXH… Ngoài ra các bạn còn phải đi làm thêm kiếm tiền lo cho cuộc sống…
Tuy nhiên các bạn cũng nên lưu ý một điều là trong suốt quãng đời sinh viên (4-5 năm) thì các bạn chỉ làm LV có 1 lần (và cũng có khi đó là lần duy nhất trong đời, nếu các bạn ko tiếp tục học nữa) và thực tế thì LV đóng 1 vai trò quan trọng góp phần đánh giá quá trình học tập của các bạn và xa hơn nữa nó còn có thể định hướng nghề nghiệp tương lai cho các bạn… Do đó dù có bận rộn hay vì lý do gì đi nữa thì các bạn cũng phải có kế hoạch cụ thể và quan tâm đúng mức việc thực hiện đề tài LV của mình.
Trong quá trình học tập các bạn phải định hướng được là mình sẽ chuyên theo hướng nào: có bạn thích marketing, bạn chọn tài chính, bạn khác lại quan tâm văn hóa tổ chức v.v… để đến các học kỳ cuối các bạn tăng cường học thêm các môn bổ sung (tự chọn) or các chuyên đề chuyên sâu để chuẩn bị thật tốt những kiến thức cần thiết cho lĩnh vực mà bạn chọn để thực hiện đề tài. Trên cơ sở những kiến thức cơ bản đó các bạn tìm đọc thêm trong sách vở, bài báo or các LV trước đó xem người ta đã làm những gì (ở nước ngoài và cả ở VN) để xem có những khía cạnh nào các bạn có thể thực hiện được, từ đó hình thành nên ý tưởng đề tài. Giai đoạn này các bạn cần phải đọc nhiều thật nhiều (nhất là các bài báo nước ngoài) để có được những ý tưởng hay và có ý nghĩa thực tiễn áp dụng vào VN or cụ thể trong lĩnh vực mà bạn quan tâm.
Sau khi có được ý tưởng đề tài thì bạn tiếp tục tìm hiểu các cơ sở lý thuyết để đưa ra mô hình nghiên cứu cho đề tài của bạn. Và sau nhiều lần chỉnh sửa bạn sẽ fix được mô hình và các giả thuyết của bạn.
Bước tiếp theo là bạn sẽ chọn phương pháp nghiên cứu (định tính or định lượng) để phù hợp với đề tài mà bạn đưa ra. Xu hướng ngày nay các bạn chọn phương pháp định lượng rất nhiều. Nghĩa là từ mô hình n/c đã fix bạn sẽ đi xây dựng thang đo và hình thành bảng câu hỏi khảo sát để đi thu thập dữ liệu về chạy định lượng: thống kê mô tả, kiểm tra độ tin cậy (vd cronbach’s alpha), phân tích nhân tố khám phá EFA, chạy tương quan, chạy hồi quy đa biến, phân tích sự khác biệt: T-test or anova… (những bước này các bạn có thể hoàn toàn chạy trong SPSS). Một số bạn có thời gian, khả năng cũng như từ y/c của mô hình mà có thể chọn các bước phức tạp hơn như CFA, SEM… (thường chạy bằng AMOS). Kết quả của việc chạy này là bạn có được các bảng dữ liệu.
Tuy nhiên các bạn cũng đừng tập trung vào dữ liệu quá mà quên mất 1 vấn đề rất quan trọng: đó là từ dữ liệu đó các bạn nói lên được điều gì (thảo luận kết quả, đưa ra kết luận, kiến nghị…). Và thường đây là bước mà các giáo viên rất quan tâm và đánh giá cao nên các bạn phải dành thời gian tương xứng cho nó, chứ ko nên viết qua loa, đại khái cho có mà cần phải đầu tư thật kỹ.
Ngoài ra các bạn cũng cần chú ý đến vấn đề trình bày: bố cục bài viết, cách dùng câu, chữ và đặc biệt là lỗi chính tả…
Kỹ năng thuyết trình sẽ giúp ích cho bạn rất nhiều trong buổi bảo vệ LV, cách trình bày Slides cũng quan trọng không kém.
Đôi điều chia sẻ, hi vọng phần nào giúp ích cho các bạn (sinh viên or MBA) đang và sẽ thực hiện LV cũng như các đề tài nghiên cứu khoa học.
Chúc các bạn thành công!
([email protected])

PHÂN TÍCH PHƯƠNG SAI MỘT YẾU TỐ (ANOVA)

Dùng để kiểm định giả thuyết trung bình bằng nhau của các nhóm mẫu với khả năng phạm sai lầm chỉ là 5%.
Ví dụ: Phân tích sự khác biệt giữa các thuộc tính khách hàng (giới tính, tuổi, nghề nghiệp, thu nhập…) đối với 1 vấn đề nào đó (thường chọn là nhân tố phụ thuộc, vd: sự hài lòng).
Một số giả định khi phân tích ANOVA:
– Các nhóm so sánh phải độc lập và được chọn một cách ngẫu nhiên.
– Các nhóm so sánh phải có phân phối chuẩn or cỡ mẫu phải đủ lớn để được xem như tiệm cận phân phối chuẩn.
– Phương sai của các nhóm so sánh phải đồng nhất.
Lưu ý: nếu giả định tổng thể có phân phối chuẩn với phương sai bằng nhau không đáp ứng được thì bạn có thể dùng kiểm định phi tham số Kruskal-Wallis sẽ để thay thế cho ANOVA.

====

* Levene test: Ho: “Phương sai bằng nhau”
– Sig < 0.05: bác bỏ Ho
– Sig >=0.05: chấp nhận Ho -> đủ điều kiện để phân tích tiếp anova
* ANOVA test: Ho: “Trung bình bằng nhau”
– Sig >0.05: chấp nhận Ho -> chưa đủ điều kiện để khẳng định có sự khác biệt…
– Sig <=0.05: bác bỏ Ho -> đủ điều kiện để khẳng định có sự khác biệt…
* Khi có sự khác biệt thì có thể phân tích sâu hơn để tìm ra sự khác biệt như thế nào giữa các nhóm quan sát.

===

PHÂN TÍCH SÂU ANOVA
Để phân tích ANOVA có ý nghĩa hơn, người ta thường tiến hành phân tích sâu ANOVA sau bước phân tích ANOVA cơ bản.

Có 2 phương pháp, đó là  kiểm định “sau” (Post-Hoc test) và kiểm định “trước” (Priori Contrasts).

Phương pháp gần với phương pháp nghiên cứu thực là Post-Hoc test . Do đó trên thực tế người ta thường dùng Post-Hoc test để thực hiện phân tích sâu ANOVA nhằm tìm ra chỗ khác biệt. Một số phương pháp Post-Hoc test thường sử dụng là:
* LSD: dùng kiểm định t lần lượt cho từng cặp trung bình nhóm. Nhược điểm của nó là độ tin cậy không cao vì làm gia tăng mức độ phạm sai lầm tương ứng với việc so sánh nhiều nhóm cùng một lúc.
* Bonferroni: giống quy tắc của LSD nhưng điều chỉnh được mức ý nghĩa khi tiến hành so sánh bội dựa trên số lần tiến hành so sánh. Đây là thủ tục đơn giản và thường được sử dụng.
* Tukey: cũng được sử dụng phổ biến cho việc tìm kiếm các trung bình các nhóm khác biệt. Nó sử dụng bảng phân phối Studentizze range distribution. Tukey hiệu quả hơn Bonferroni khi số lượng các cặp trung bình cần so sánh khá nhiều.
* Scheffe: phương pháp này kém nhạy hơn trong việc so sánh các trị trung bình của các cặp, nó đòi hỏi phải có sự khác biệt lớn giữa các trị trung bình so với các thủ tục so sánh bội khác để bảo đảm có sự khác biệt thực sự, nhưng vì thế nó đưa ra kết quả thận trọng hơn.
* R-E-G-W: thực hiện 2 bước kiểm định, đầu tiên nó tiến hành kiểm định lại toàn bộ các trị trung bình nhóm xem có bằng nhau không; nếu không bằng thì bước kế tiếp nó sẽ kiểm định để tìm các nhóm nào khác biệt thực sự với nhau về trị trung bình. Nhưng kiểm định này không phù hợp khi kích cỡ các nhóm mẫu không bằng nhau.
* Dunnett: là thủ tục cho phép chọn so sánh các trị trung bình của các nhóm mẫu còn lại với một trị trung bình của một nhóm mẫu cụ thể nào đó được chọn ra so sánh (nhóm điều khiển), SPSS mặc định chọn nhóm cuối (Last) để làm nhóm điều khiển.
** Trong TH phương sai giữa các đối tượng cần so sánh khác nhau, người ta hay chọn Tamhane’s T2 (kiểm định t từng cặp trường hợp phương sai khác nhau)
Lưu ý: việc sử dụng kiểm định nào là tùy thuộc vào mục đích của nhà nghiên cứu và tình hình thực tế của nghiên cứu.

KIỂM ĐỊNH TRUNG BÌNH TỔNG THỂ

* Nếu muốn so sánh trung bình của một tổng thể với một giá trị cụ thể nào đó ta sẽ thực hiện phép kiểm định giả thuyết về trung bình của tổng thể. Trong SPSS có thể sử dụng lệnh One-Sample T-Test để thực hiện kiểm định này (menu Analyze -> Compare Means -> One-Sample T-Test)
* Nếu muốn so sánh hai trị trung bình của hai nhóm tổng thể riêng biệt ta thực hiện phép kiểm định giả thuyết về sự bằng nhau của 2 trung bình tổng thể dựa trên 2 mẫu độc lập rút từ 2 tổng thể này. SPSS sử dụng lệnh Independent-Sampes T-Test thuộc menu Analyze -> Compare Means để thực hiện kiểm định này.
* Nếu muốn so sánh hai trị trung bình của hai nhóm tổng thể riêng biệt có đặc điểm là mỗi phần tử quan sát trong tổng thể này có sự tương đồng theo cặp với 1 phần tử ở tổng thể bên kia, ta sử dụng kiểm định giả thuyết về sự bằng nhau của 2 trung bình tổng thể dựa trên dữ liệu mẫu rút từ 2 tổng thể theo cách phối hợp từng cặp. Ta tiến hành kiểm định này bằng lệnh Analyze -> Compare Means -> Paired-Samples T-Test của SPSS.
* Nếu muốn mở rộng sự so sánh cho trị trung bình của nhiều nhóm tổng thể độc lập ta sử dụng phương pháp kiểm định giả thuyết về sự bằng nhau của trung bình nhiều tổng thể. Phương pháp này có tên gọi phổ biến là phân tích phương sai (ANOVA). Ta có thể dùng lệnh One-way ANOVA trong menu Analyze -> Compare Means của SPSS để tiến hành kiểm định này.
* Lưu ý: phương pháp ANOVA có thể sử dụng được trong trường hợp có từ 2 or nhiều hơn 2 nhóm tổng thể. Do đó trong một số tình huống người ta có thể dùng ANOVA thay thế cho T-Test.
(theo Hoàng Trọng – Chu Nguyễn Mộng Ngọc)

VẤN ĐỀ ĐA CỘNG TUYẾN (Multicolinearity)

Vấn đề đa cộng tuyến xảy ra khi các biến (nhân tố) độc lập có tương quan tuyến tính khá mạnh với nhau. Nói cách khác hiện tượng đa cộng tuyến xảy ra khi có mối tương quan tuyến tính hiện hữu giữa >= 2 biến độc lập trong mô hình.
Khi đó sẽ dẫn đến các vấn đề sau:
– Hạn chế giá trị của r bình phương (thường sẽ làm tăng r bình phương)
– Làm sai lệch/ đổi dấu các hệ số hồi quy
Kiểm tra vấn đề đa cộng tuyến: dùng hệ số Tolerance hoặc VIF (variance inflation factor – hệ số phóng đại phương sai)
Lưu ý: về giá trị VIF, theo sách của Hoàng Trọng – Chu Nguyễn Mộng Ngọc: “quy tắc là khi VIF vượt quá 10, đó là dấu hiệu của Đa cộng tuyến”. Tuy nhiên cũng có một số tài liệu đưa ra điều kiện VIF <4 or thậm chí là <2.

ĐỘ PHÙ HỢP CỦA MÔ HÌNH HỒI QUY BINARY LOGISTIC

Hồi quy binary logistic cũng đòi hỏi ta phải đánh giá độ phù hợp của mô hình. Đo lường độ phù hợp tổng quát của mô hình này được dựa trên chỉ tiêu -2LL (viết tắt của -2 log likelihood). Bạn không cần quan tâm nhiều đến việc -2LL được tính toán như thế nào, chỉ cần nhớ quy tắc đánh giá độ phù hợp căn cứ trên -2LL ngược với quy tắc dựa trên hệ số xác định mô hình R bình phương, nghĩa là giá trị -2LL càng nhỏ càng thể hiện độ phù hợp cao. Giá trị nhỏ nhất của -2LL là 0 ( tức là không có sai số), khi đó mô hình có một độ phù hợp hoàn hảo.
Ngoài ra chúng ta còn có thể xác định được mô hình dự đoán tốt đến đâu qua bảng phân loại (Clasification table) do SPSS đưa ra, bảng này sẽ so sánh số trị số thực và trị số dự đoán cho từng biểu hiện và tính tỷ lệ dự đoán đúng sự kiện
(theo Hoàng Trọng – Chu Nguyễn Mộng Ngọc)

Ý nghĩa R bình phương (hiệu chỉnh)

Ý NGHĨA R BÌNH PHƯƠNG (HIỆU CHỈNH) KHI PHÂN TÍCH HỒI QUY ĐA BIẾN
Khi chạy hồi quy đa biến, một tham số quan trọng mà các bạn cần kiểm tra đầu tiên đó là r bình phương (hoặc r bình phương hiệu chỉnh). Nó cho biết mức độ phù hợp của mô hình nghiên cứu với ý nghĩa là các biến (nhân tố) độc lập giải thích được bao nhiêu phần trăm (%) biến thiên của biến (nhân tố) phụ thuộc.
Về độ lớn của r bình phương thì các bạn có thể tham khảo các tình huống như sau:
– Đ/v các đề tài liên quan đến vấn đề nhận dạng… or giải thích…, (vd: các yếu ảnh hưởng đến mức độ hài lòng…), thì r bình phương phải nên từ 0.5 (50%) trở lên
– Đ/v các đề tài liên quan đến mối quan hệ…, (vd: ảnh hưởng của sức ì tâm lý đến lòng trung thành…), thì không cần quan tâm nhiều đến r bình phương mà khi đó hệ số hồi quy (beta) sẽ có ý nghĩa nhiều hơn.

PHÂN TÍCH TƯƠNG QUAN PEARSON

* Mục đích chạy tương quan Pearson
– Kiểm tra mối tương quan tuyến tính chặt chẽ giữa biến phụ thuộc với các biến độc lập? Vì điều kiện để hồi quy là trước nhất phải tương quan.
– Ngoài ra cần nhận diện vấn đề đa cộng tuyến khi các biến độc lập cũng có tương quan mạnh với nhau. Dấu hiệu đa cộng tuyến sẽ được xem xét khi phân tích hồi quy (kiểm tra hệ số VIF)
* Cách chạy tương quan trong SPSS: menu Analyza -> Correlate -> Bivariate…
* Cách đọc kết quả (xem hình mình họa)
Hệ số tương quan r
– r <0.2: ko tương quan
– r từ 0.2 đến 0.4: tương quan yếu
– r từ 0.4 đến 0.6: tương quan trung bình
– r từ 0.6 đến 0.8: tương quan mạnh
– r từ 0.8 đến <1: tương quan rất mạnh
Bạn cần quan tâm đến giá trị sig: nếu bạn chọn mức ý nghĩa 1% thì giá trị sig phải <0.01, còn nếu bạn chọn mức ý nghĩa là 5% thì sig <0.05 tương ứng với các dấu (*) được đánh dấu trên hệ số tương quan r.
Lưu ý 2 dòng note dưới bảng ma trận tương quan Pearson này nhé:
**. Correlation is significant at the 0.01 level (2-tailed).
*. Correlation is significant at the 0.05 level (2-tailed).

MBA BK HCM