Thứ Hai, 6 tháng 11, 2017

Phân tích sâu Anova một yếu tố (post-hoc One-way Anova)

Phân tích sâu Anova một yếu tố (post-hoc One-way Anova)


Nhóm MBA Bách Khoa giới thiệu cách phân tích sâu anova : mục đích, ý nghĩa, cách thực hiện bằng hình ảnh, bằng video hướng dẫn trên phần mềm SPSS.

Mục đích phân tích sâu anova

Dùng để xem có sự  khác biệt cụ thể giữa nhóm nào và nhóm nào về một vấn đề nào đó có ý nghĩa thống kê không.. Ví dụ: trong 100 người trả lời bảng câu hỏi, chia ra 3 nhóm tuổi:
  1. Nhóm 1: nhóm <30 tuổi
  2. Nhóm 2: nhóm từ 30-40 tuổi.
  3. Nhóm 3: nhóm trên 40 tuổi
Ta cần so sách xem trong 3 nhóm tuổi trên, nhóm nào hài lòng hơn nhóm nào, và sự khác biệt có ý nghĩa thống kê hay không? Biến cần so sánh sự khác biệt ở đây là biến Hài Lòng.
      Câu hỏi đặt ra là ta đã chạy anova rồi, cho thấy có sự khác biệt về sự Hài Lòng giữa các nhóm tuổi rồi, bây giờ việc còn lại là xác định nhóm tuổi nào có sự khác biệt với nhóm tuổi nào? Bởi vì có thể nhóm 1 có khác biệt với nhóm 3, nhưng nhóm 1 không có khác biệt với nhóm 2 về sự Hài Lòng. Vấn đề này sẽ được giải quyết bằng phân tích sâu Anova, còn gọi là post-hoc test anova. Bài này sẽ hướng dẫn các bạn làm việc đó và đọc ý nghĩa.
         Lưu ý nếu chỉ có hai nhóm quan sát thì không cần chạy phân tích sâu anova, và nếu chạy thì SPSS cũng không thể hiện ra kết quả, vì có hai nhóm , và có sự khác biệt thì chắc chắn là nhóm 1 khác nhóm 2 rồi, cần gì phân tích sâu nữa 🙂

Hướng dẫn bằng Video:

Đây là video hướng dẫn, các bạn không tiện xem video có thể xem hướng dẫn chi tiết bằng hình ảnh bên dưới nhé.

Hướng dẫn bằng hình ảnh:

     Dưới đây là các bước thực hiện phân tích anova bằng hình ảnh, sau đó phân tích sâu post – hoc, kèm theo diễn giải chi tiết:

     Đầu tiên vào menu Analyze -> Compare means -> One-way ANOVA
     Chọn biến phụ thuộc vào ô Dependent List, biến Tuổi vào ô Factor. Sau đó nhấn nút Post-hoc để hiện lên bảng phân tích sâu anova. Sau đó chọn phép kiểm LSD như bên dưới. ( có thể sử dụng Turkey cũng được). Mục đích chỗ này là hiện ra bảng Multiple comparisons bên dưới.
     Tiếp tục nhấn vào Option và chọn thống kê mô tả Descriptive( chủ yếu để biết trung bình sự hài lòng của mỗi nhóm tuổi là bao nhiêu) và Homogeneity of variance test( để kiểm định giả thiết phương sai đồng nhất). Sau đó nhấn OK để hiện ra kết quả
     Kết quả ra như sau:

Cách phân tích kết quả

– Bảng Descriptives: Nhìn vào cột mean ta thấy về mặt Hài Lòng, nhóm Trên 40 TUỔI hài lòng hơn 2 nhóm kia, do mean của nhóm này là 3.5128, cao hơn mean của hai nhóm còn lại( xem khung màu ĐỎ)
– Bảng kiểm định phương sai đồng nhất Test of Homogeneity of Variances, có sig.=0.145 >5%, do đó kết luận phương sai giữa các nhóm không có sự khác biệt, đủ điều kiện để phân tích Anova.
– Bảng ANOVA,sig.=0.031 < 5%, chứng tỏ có sự khác biệt về sự hài lòng giữa các nhóm tuổi. Tuy nhiên để biết nhóm nào khác với nhóm nào cần nhìn vào bảng tiếp theo.
– Bảng Post Hoc Tests Multiple Comparisons, ta để ý cột sig. màu đỏ nhé. Ta sẽ xem xét giá trị nào bé hơn 0.05 tức là 5 phần trăm. Ta thấy có giá trị 0.009, đó là sig. khi so sánh sự hài lòng giữa hai nhóm tuổi: Nhóm từ 30-40, và nhóm trên 40 tuổi. Điều này chứng tỏ trong 3 nhóm tuổi, chỉ có hai nhóm này là có sự khác biệt về sự hài lòng. Cột Mean Difference (I-J) của hàng này là -0.552821 , chứng tỏ mean Hài Lòng của nhóm 30-40 tuổi THẤP HƠN nhóm trên 40 tuổi. Nói cách khác nhóm tuổi trên 40 có sự khác biệt có ý nghĩa thống kê so với nhóm tuổi 30-40 trong vấn đề Hài Lòng.
Như vậy nhóm MBA đã hướng dẫn xong cách Phân tích sâu Anova một yếu tố (post-hoc One-way Anova). Các bạn có thắc mắc cứ liên hệ nhóm tại http://phantichspss.com/lien-he-gioi-thieu để được hỗ trợ hướng dẫn nhé.
-Viber/zalo qua số điện thoại so-alo
-Facebook: http://facebook.com/hoidapSPSS/
-Email: hotrospss@gmail.com

Cách đối diện với dữ liệu bị thiếu Missing values khi phân tích dữ liệu

Nhóm MBA Bách Khoa thảo luận về missing values, các bạn có cần thảo luận cứ comment bên dưới nhé.

Dữ liệu bị thiếu missing values là gì?

– Nếu khảo sát bằng phiếu khảo sát giấy: thì những câu hỏi khảo sát mà người được khảo sát họ không đánh vào bất cứ lựa chọn nào cả, thì đó là missing values.
– Nếu khảo sát online: do thiếu ràng buộc khi thiết kế bảng khảo sát, người được khảo sát không cần chọn hết tất cả các câu hỏi vẫn bấm Submit được.
Cả hai cách trên đều làm cho file dữ liệu sẽ xuất hiện những ô không có giá trị.

Hậu quả của missing values

Nếu bạn có dữ liệu bị thiếu (missing values), điều này có thể gây ra một số vấn đề. Vấn đề rõ ràng nhất là không có đủ dữ liệu để chạy phân tích. Các phân tích EFA, CFA và mô hình  đường dẫn SEM đòi hỏi một số lượng nhất định các mẫu quan sát dữ liệu để tính các ước tính. Con số này tăng cùng với sự phức tạp của mô hình của bạn. Nếu dữ liệu thiếu một số giá trị, phân tích sẽ không chạy.
Một số người có thể không trả lời được những câu hỏi cụ thể trong cuộc khảo sát vì một số vấn đề phổ biến. Ví dụ: nếu bạn hỏi về giới tính, và phụ nữ ít có khả năng báo cáo giới tính của họ hơn nam giới, thì bạn sẽ có dữ liệu nam giới bị chệch . Có lẽ chỉ có 50% phụ nữ báo cáo về giới tính của họ, nhưng 95% nam giới cho biết giới tính. Nếu bạn sử dụng giới tính trong các mô hình nhân quả, thì bạn sẽ có kết quả bị chệnh đối với nam giới, nghĩa là số lượng nam nhiều hơn nữ (bởi vì bạn sẽ không sử dụng các phiếu phản hồi không có đầy đủ dữ liệu)

Hiển thị số lượng quan sát missing như thế nào?

Để tìm hiểu xem có bao nhiêu giá trị bị thiếu trong mỗi biến, trong SPSS chuyển đến Analyze -> Descriptive Statistics -> Frequencies. Nhập các biến trong danh sách các biến. Sau đó nhấn OK. Bảng trong đầu ra sẽ hiển thị số lượng các giá trị còn thiếu cho mỗi biến.
Ngưỡng thiếu dữ liệu rất linh hoạt, nhưng nói chung, nếu bạn thiếu hơn 10% phản hồi đối với một biến cụ thể hoặc từ một người trả lời cụ thể thì biến đó hoặc người trả lời có thể là vấn đề. Có một số cách để đối phó với các biến có vấn đề:
– Chỉ cần không sử dụng biến đó( ý là bỏ luôn biến đó không xài nữa)
– Sử dụng luôn các giá trị còn thiếu, bằng cách chế số cho các giá trị này. Điều này chỉ nên được thực hiện cho dữ liệu liên tục hoặc khoảng thời gian (như Độ tuổi hoặc thang Likert) chứ không phải cho dữ liệu phân loại (như Giới tính).
– Nếu tập dữ liệu của bạn đủ lớn, chỉ cần không sử dụng câu trả lời có các giá trị thiếu cho biến đó. Điều này có thể tạo ra một sự chệnh như nói ở trên, tuy nhiên nếu số lượng phản hồi bị missing lớn hơn 10% thì lúc đó mới có sự chệnh đáng kể.

Chế số cho missing values

Để chế số giá trị trong SPSS cho các missing values, trong SPSS vào Transform, Replace Missing Values; Sau đó chọn các biến mà cần điền dữ liệu trống, và nhấn OK. Xem ảnh chụp màn hình bên dưới. Trong ảnh chụp màn hình này, sử dụng phương pháp thay thế Trung bình.  Có nghĩa là sẽ tính giá trị trung bình cộng của cá giá trị không bị thiếu, và lấy giá trị đó điền vào các ô bị thiếu.
     Nếu một người trả lời không trả lời được phần lớn các câu hỏi, có thể là vô ích khi thử nghiệm các mô hình nhân quả. Ví dụ, nếu họ trả lời các câu hỏi về chế độ ăn kiêng, nhưng không trả lời các câu hỏi ở mục giảm cân, đối với cá nhân này không thể kiểm tra mô hình nhân quả cho rằng chế độ ăn uống có ảnh hưởng tích cực đến việc giảm cân. Chỉ đơn giản là không có dữ liệu cho người đó. Khuyến nghị là xác định trước những biến nào sẽ được sử dụng trong mô hình của bạn (thường chúng ta thu thập dữ liệu về nhiều biến hơn chúng ta thực sự sử dụng trong mô hình của chúng ta), sau đó xác định xem người trả lời có vấn đề không. Nếu vậy, hãy loại bỏ người trả lời đó khỏi phân tích.
Trên đây là bài giới thiệu sơ lược về dữ liệu missing values. Các bạn liên hệ nhóm MBA ĐH Bách Khoa HCM tại http://phantichspss.com/lien-he-gioi-thieu  để được hỗ trợ tư vấn/ khảo sát/ thu thập/xử lý số liệu nh

Cách hiển thị nhiều hơn một chữ số thập phân trong phần kết quả SPSS

Cách hiển thị nhiều hơn một chữ số thập phân trong phần kết quả SPSS

Mặc định phần kết quả sẽ hiển thị 1 chữ số thập phân như hình dưới.

Các bước thực hiện để hiệu chỉnh số thập phân trong SPSS

Bước 1:

Các bạn double click vào những giá trị cần tăng số thập phân sau dấu . như hình dưới.

Bước 2

Sau đó bấm chuột phải, chọn Cell Properties.

Bước cuối cùng

Nhấn chọn:
-Tab: Format Value
-Category: All
– Format #.#
– Decimal: đây là mục quan trọng nhất, nếu gõ vào số 2 thì sẽ có hai chữ số thập phân, gõ số 4 thì sẽ có 4 chữ số thập phân trong kết quả SPSS. Ở đây chọn hiển thị 4 chữ nên mình gõ số 4 nhé.
Sau đó nhấn OK. Kết quả cuối cùng hiển thị như sau:
Số thập phân sau dấu chấm . đã được tăng lên thành 4 số. Các bạn nếu muốn tăng số thập phân trong SPSS thành hai 2 số thì ở trên chỉ việc gõ số 2 là xong nhé.
Như vậy nhóm MBA đã hướng dẫn xong Cách hiển thị nhiều hơn một chữ số thập phân trong phần kết quả SPSS. Các bạn có thắc mắc hãy liên hệ nhóm tại đây để được hỗ trợ hướng dẫn nhé.
(Phần này làm tăng số thập phân của phần kết quả, còn muốn tăng số thập phân trong phần data view của màn hình dữ liệu gốc SPSS thì chọn biến đó và trong cột Decimals gõ số thập phân tương ứng vào nhé)
Nhóm MBA Bách Khoa 2017.
-Viber/zalo qua số điện thoại so-alo

Tổng hợp gần 200 mẫu bảng câu hỏi khảo sát đủ mọi chủ đề cho luận văn tiến sĩ, thạc sĩ và đại học

Tổng hợp gần 200 mẫu bảng câu hỏi khảo sát đủ mọi chủ đề cho luận văn tiến sĩ, thạc sĩ và đại học 


Giới thiệu

Nhóm Thạc Sĩ QTKD ĐH Bách Khoa Tp.HCM Hỗ Trợ SPSS đã tổng hợp gần 200 mẫu bảng câu hỏi khảo sát đủ mọi chủ đề dùng cho luận văn tiến sĩ, thạc sĩ và đại học. Đây là một nguồn thông tin rất đáng đọc để tham khảo xem mọi người làm luận văn như thế nào, các đề tài nào thông dụng là gì, cách lập ý tưởng, thiết kế mô hình ra sao, cách phát biểu câu hỏi khảo sát thị trường như thế nào.
Các bảng khảo sát mẫu này rất có ích cho bạn khi bạn đang trong giai đoạn tìm ý tưởng cho mô hình nghiên cứu, hoặc là bạn chưa biết lựa chọn mô hình gì, đề tài gì cho luận văn của mình thì việc đọc một số bảng câu hỏi của các anh chị đi trước là điều rất cần thiết. Dưới đây có  một số bảng câu hỏi tiếng Anh cho bạn nào học chương trình quốc tế nhé.
Các bảng câu hỏi mang chủ đề chính như sau:
  1. Sự hài lòng của khách hàng về chất lượng dịch vụ, hài lòng về ngân hàng, hài lòng của nhân viên.
  2. Động Lực làm việc của nhân viên.
  3. Dự định nghỉ việc của người lao động.
  4. Sự gắn kết với công việc, công ty.
  5. Quyết định gởi tiết kiệm.
  6. Quyết định mua hàng, hành vi mua hàng, quyết định du học.
  7. Ý định mua hàng, ý định sử dụng dịch vụ.
  8. Lòng trung thành của khách hàng.
  9. Các đề tài khác.
Cụ thể như sau:

1.Sự hài lòng của khách hàng về chất lượng dịch vụ, hài lòng về ngân hàng, hài lòng của nhân viên

2. Động Lực làm việc của nhân viên

3. Dự định nghỉ việc của người lao động

4. Sự gắn kết với công việc, công ty

5. Quyết định gởi tiết kiệm

6. Quyết định mua hàng, hành vi mua hàng, quyết định du học

7. Ý định mua hàng, ý định sử dụng dịch vụ

8.Lòng trung thành của khách hàng

9. Các đề tài khác

Trên đây là những mẫu bảng câu hỏi khảo sát thông dụng nhất, chúc các bạn tìm được những ý tưởng hay để hoàn thành bài luận của mình nhé.
Nhóm MBA Hỗ Trợ SPSS
-Viber/zalo: so-alo

Cách xử lý lỗi Rotation failed to converge in 25 iterations

Cách xử lý lỗi Rotation failed to converge in 25 iterations 


Khi phân tích nhân tố, nếu bị báo lỗi Rotation failed to converge in 25 iterations. (Convergence = .001) thì bạn xử lý như thế nào? Nhóm MBA Hỗ Trợ SPSS hotrospss@gmail.com hướng dẫn bạn xử lý lỗi này để có thể tiếp tục  làm bài nhé.

Hiện tượng:

Lỗi báo như sau:
Rotated Component Matrixa
a Rotation failed to converge in 25 iterations. (Convergence = .001).
Về ý nghĩa, là phép xoay không hội tụ được trong 25 lần thực hiện. Do đó để giải quyết vấn đề ta phải tăng số lần thực hiện lên bằng cách sau:

Giải pháp

Trong phân tích EFA, nhấn vào nút Extraction, sau đó trong hộp thoại Maximum iterations for convergence, thay đổi số 25 thành số cao hơn, ví dụ 50. Sau đó thực  hiện chạy lại.
Sau đó kết quả sẽ được hiển thị, tuy nhiên trong một số trường hợp đặc biệt xấu, vẫn báo lỗi cũ, thì các bạn tiếp tục tăng số lần iteraction lên tiếp , ví dụ 100. Sau đó chạy lại sẽ được nhé.
Ngoài ra , các bạn có thể tham khảo quy tắc loại biến khi chạy EFA ở đây   http://phantichspss.com/quy-tac-loai-bien-xau-khi-phan-tich-nhan-to-efa.html
Liên hệ:
-Viber/zalo qua số điện thoại so-alo
  Để được hướng dẫn:
– Khảo sát thị trường/ xử lý/ hiệu chỉnh số liệu khảo sát để chạy ra kết quả phân tích nhân tố hội tụ,phân tích hồi quy hồi quy có ý nghĩa thống kê.
– Tư vấn mô hình/bảng câu hỏi/ traning trực tiếp về phân tích hồi quy, nhân tố, cronbach alpha… trong SPSS, và mô hình SEM, CFA, AMOS

Cách viết phương trình hồi quy tuyến tính đa biến

Cách viết phương trình hồi quy tuyến tính đa biến


Sau khi phân tích hồi quy, sẽ ra được bảng kết quả. Vấn đề còn lại là thể hiện thành phương trình hồi quy như thế nào cho đúng. Hôm nay nhóm thạc sỹ QTDK ĐH Bách Khoa sẽ bàn chi tiết vấn đề này nhé.
Các cột dữ liệu trong kết quả mô hình hồi quy
  • Unstandardized Coefficients
  • Standardized Coefficients
  • t
  • Sig.
  • Collinearity Statistics
  • B
  • Std. Error
  • Beta
  • Tolerance
  • VIF
Ở đây ta quan tâm đến 3 cột, cột Sig. ,  Unstandardized Coefficients và Standardized Coefficients
Biến phụ thuộc ở đây là HAILONG, có 6 biến độc lập đều có ý nghĩa thống kê( do sig. <0.05)
Phương trình hồi quy có hai dạng, dạng thứ nhất là phương trình hồi quy viết theo hệ số chưa chuẩn hóa, dạng thứ nhì là phương trình hồi quy viết theo hệ số chuẩn hóa.

Phương trình hồi quy viết theo hệ số chưa chuẩn hóa

Ta lấy các giá trị ở cột Unstandardized Coefficients để viết
HAILONG = -1.005+ 0.158*TINCAY + 0.186*DAPUNG + 0.217*DAMBAO + 0.295*CAMTHONG + 0.226*HUUHINH + 0.223*MINHBACH
Giải thích ý nghĩa hệ số hồi quy viết theo hệ số chưa chuẩn hóa:
     Xét biến TINCAY, nếu giải thích theo phương trình hồi quy chưa chuẩn hóa, nếu biến TINCAY tăng 1 đơn vị, thì biến HAILONG tăng 0.158 đơn vị. Tương tự cho các biến khác

Phương trình hồi quy viết theo hệ số đã chuẩn hóa

Ta lấy các giá trị ở cột Standardized Coefficients để viết
HAILONG = 0.216*TINCAY + 0.257*DAPUNG + 0.189*DAMBAO + 0.271*CAMTHONG + 0.224*HUUHINH + 0.224*MINHBACH
Giải thích ý nghĩa hệ số hồi quy theo hệ số đã chuẩn hóa:
     Nếu giải thích theo phương trình hồi quy đã chuẩn hóa, khi biến TINCAY tăng 1 đơn vị độ lệch chuẩn (standard deviation), thì biến HAILONG tăng 0.216 đơn vị độ lệch chuẩn. Lưu ý trong phương trình đã chuẩn hóa, hằng số constant = 0, nên không thể hiện ra.
     Vậy tóm lại khi viết phương trình hồi quy nên dùng hệ số nào? Đã chuẩn hóa hay chưa chuẩn hóa?. Vấn đề này gây ra rắc rối trong suy nghĩ đây :), và một số bạn suy nghĩ đơn giản, dạng như chuẩn hóa thì tốt hơn chưa chuẩn hóa, vì đã CHUẨN rồi mà. Như vậy chưa chính xác nhé. Thực tế khi làm luận văn, mà các biến độc lập có cùng đơn vị đo lường( như là thang đo likert) thì sử dụng phương trình viết theo hệ số chưa chuẩn hóa, vì lúc đó sẽ dễ dàng giải thích ý nghĩa kết quả hơn nhiều.
Giới thiệu liên hệ nhóm ở đây, các bạn liên hệ khi có chỗ nào chưa hiểu rõ nhé: http://phantichspss.com/lien-he-gioi-thieu
-Viber/zalo qua số điện thoại so-alo