Thứ Hai, 24 tháng 2, 2014

HỒI QUY VÀ TƯƠNG QUAN


HỒI QUY VÀ TƯƠNG QUAN
Hồi quy và tương quan khác nhau về mục đích và kỹ thuật. Phân tích tương quan trước hết là đo mức độ kết hợp tuyến tính giữa các biến. Ví dụ: mức độ quan hệ giữa nghiện thuốc là và ung thư phổi, giữa kết quả thi môn Lý và môn Toán… Nhưng phân tích hồi quy lại ước lượng hoặc dự báo một biến (biến phụ thuộc) trên cơ sở giá trị đã cho của các biến khác (biến độc lập). Về kỹ thuật, trong phân tích hồi quy các biến không có tính chất đối xứng. Biến phụ thuộc là đại lượng ngẫu nhiên. Các biến giải thích giá trị của chúng (biến độc lập) đã được xác định. Trong phân tích tương quan không có sự phân biệt giữa các biến, chúng có tính chất đối xứng.
Tóm lại, hồi quy thì tương quan (hay nói cách khác đk để hồi quy thì trước hết phải tương quan), còn tương quan thì chưa chắc đã hồi quy.

(hotrospss@gmail.com)

CÁCH CHỌN MẪU TRONG NGHIÊN CỨU MARKETING

CÁCH CHỌN MẪU TRONG NGHIÊN CỨU MARKETING
Hỏi:
“Chào Hỗ trợ SPSS!
Mình tìm thấy các bạn trên trang Facebook. Bạn có thể cho mình tham vấn về cách chọn mẫu được không? Bọn m đang làm về đề tài đánh giá sự cảm nhận của sinh viên về chất lượng kí túc xá. Bọn m chon mẫu theo dãy nhà. Nhưng nếu tính theo dãy nhà thì không biết xác định cỡ mẫu thế nào. Bạn có thê tham vấn giúp m được không?
M cảm ơn!”
Trả lởi:
“Chào bạn,
Liên quan đến câu hỏi của bạn (mình không biết là bạn đang làm đề tài cho bài tập nhóm hay đang làm luận văn) Mình có 1 số gợi ý như sau:
Để thực hiện đề tài nghiên cứu thì trước tiên bạn phải tìm hiểu cơ sở lý thuyết (luận văn trước, bài báo nghiên cứu liên quan...) để đưa ra mô hình nghiên cứu (và phải được giáo viên hướng dẫn cũng như hội đồng phản biện thông qua (bảo vệ đề cương) thì bạn mới có thể làm các bước tiếp theo)
Từ mô hình nghiên cứu đó bạn sẽ đi xây dựng thang đo cho các yếu tố trong mô hình (thang đo cũng xuất phát từ những bài báo or luận văn trước, có điều chỉnh cho phù hợp hơn thông qua nghiên cứu định tính, sơ bộ định lượng)
Từ thang đo đó bạn mới xây dựng bảng câu hỏi để đi khảo sát.
Sau đó bạn mới mã hóa, nhập liệu và chạy dữ liệu cho mô hình định lượng: thống kế mô tả, kiểm tra độ tin cậy cronbach’s alpha, phân tích nhân tố EFA, tương quan, hồi quy đa biến, anova,…
Số lương mẫu thì có nhiều cách tiếp cận khác nhau. Cách đơn giản nhất là bạn lấy số lượng câu hỏi * 5 lần. Ví dụ: nếu bạn có 30 câu hỏi trong bảng khảo sát thì số lượng mẫu tối thiểu bạn phải có là 30*5= 150 mẫu.
Thông tin cụ thể thì bạn tham khảo như dưới đây:
Mẫu được chọn theo phương pháp thuận tiện, một trong các hình thức chọn mẫu phi xác suất. Khi đó, nhà nghiên cứu có thể chọn những phần tử (đối tượng nghiên cứu) có thể tiếp cận được (Nguyễn Đình Thọ và Nguyễn Thị Mai Trang, 2009).
Kích thước của mẫu áp dụng trong nghiên cứu được dựa theo yêu cầu của phân tích nhân tố khám phá EFA (Exploratory Factor Analysis) và hồi quy đa biến:
-   Đối với phân tích nhân tố khám phá EFA: Dựa theo nghiên cứu của Hair, Anderson, Tatham và Black (1998) cho tham khảo về kích thước mẫu dự kiến. Theo đó kích thước mẫu tối thiểu là gấp 5 lần tổng số biến quan sát.
-   Đối với phân tích hồi quy đa biến: cỡ mẫu tối thiểu cần đạt được tính theo công thức là 50 + 8*m (m: số biến độc lập) (Tabachnick và Fidell, 1996)..
Nghiên cứu về cỡ mẫu do Roger thực hiện (2006) cho thấy cỡ mẫu tối thiểu áp dụng được trong các nghiên cứu thực hành là từ 150-200
Một vài ý trao đổi cùng bạn”

 (hotrospss@gmail.com)

Factor loading trong Phân tích nhân tố khám phá EFA

Factor loading trong Phân tích nhân tố khám phá EFA
Theo Hair & ctg (1998,111), Factor loading là chỉ tiêu để đảm bảo mức ý nghĩa thiết thực của EFA (ensuring practical significance). Factor loading >0.3 được xem là đạt được mức tối thiểu, >0.4 được xem là quan trọng , >=0.5 được xem là có ý nghĩa thực tiễn. Hair & ctg (1998,111) cũng khuyên như sau: nếu chọn tiêu chuẩn Factor loading >0.3 thì cỡ mẫu của bạn ít nhất phải là 350, nếu cỡ mẫu của bạn khoảng 100 thì nên chọn tiêu chuẩn Factor loading >0.55 (thường có thể chọn 0.5), nếu cỡ mẫu của bạn khoảng 50 thì Factor loading phải >0.75

(hotrospss@gmail.com)

CÁCH TÍNH NHÂN SỐ ĐẠI DIỆN CHO NHÂN TỐ

CÁCH TÍNH NHÂN SỐ ĐẠI DIỆN CHO NHÂN TỐ
Sau khi chạy Cronbach’s alpha để kiểm tra độ tin cậy thang đo xong, bạn sẽ phân tích nhân tố EFA để khẳng định lại mô hình nghiên cứu của bạn có bao nhiêu nhân tố.
Nếu bạn tiếp tục chạy tương quan và hồi quy đa biến… trong SPSS thì bước tiếp theo là phải tính được nhân số đại diện cho các nhân tố này. Thường có 2 cách:
C1. Bạn có thể dùng hàm mean để tính trung bình cộng các biến quan sát thuộc nhân tố để làm nhân số đại diện (cách này được áp dụng khá phổ biến vì dễ giải thích).
C2. Khi phân tích EFA trong SPSS, bạn chọn nút Scores để lưu lại nhân số đại diện của nhân tố một cách tự động (SPSS sẽ tính giúp bạn). Nhân số tính theo cách này đã được SPSS chuẩn hóa. Theo kinh nghiệm thì cách này phù hợp khi bạn sử dụng các nhân số này để phân tích hồi quy, kiểm định mối quan hệ ảnh hưởng của các biến độc lập lên biến phụ thuộc… và đặc biệt thích hợp trong TH các biến quan sát có đơn vị tính khác nhau. Còn nếu bạn dùng để thống kê mô tả, t-test or ANOVA… thì không nên vì khi đó sẽ khó giải thích kết quả.

(hotrospss@gmail.com)

TỔNG QUÁT VỀ PHÂN TÍCH ĐA BIẾN

TỔNG QUÁT VỀ PHÂN TÍCH ĐA BIẾN
Phân tích phụ thuộc:
-         Xác định được biến nào là phụ thuộc, biến nào là độc lập
-         Bao gồm các phương pháp: phân tích hồi quy đa biến, ANOVA, Conjoint, Discriminant, Canonical analysis…
Phân tích tương tác:
-         Không xác định trước biến nào là phụ thuộc, biến nào là độc lập, chủ yếu là tìm kiếm các mô thức tương quan.
-         Bao gồm các phương pháp: Factor analaysis, Cluster, Multi-dimensional Scaling…

(Lưu ý: phân tích đa biến giúp giải quyết nhiều bài toán phức tạp. Tuy nhiên, mỗi phương pháp phân tích đa biến đều dựa trên 1 số giả thiết (ngầm) -> cần phải thận trọng)

Ý NGHĨA GIÁ TRỊ TRUNG BÌNH TRONG THANG ĐO KHOẢNG (Interval Scale)

Ý NGHĨA GIÁ TRỊ TRUNG BÌNH TRONG THANG ĐO KHOẢNG (Interval Scale)
Khi phân tích SPSS, bước đầu tiên bạn thường làm là thống kê mô tả, một trong những thông số thông dụng là Mean – trung bình cộng. Bạn nên hiểu rõ ý nghĩa giá trị trung bình của thang đo mà bạn sử dụng (thường là thang đo khoảng - interval scale)
Giả sử bạn dùng thang đo Likert 5 lựa chọn trong bảng khảo sát. Khi đó:
Giá trị khoảng cách = (Maximum – Minimum) / n = (5-1)/5 = 0.8
Ý nghĩa các mức như sau:
1.0         – 1.80: Rất không đồng ý/ Rất không hài lòng/ Rất không quan trọng…
1.81 – 2.60: Không đồng ý/ Không hài lòng/ Không quan trọng…
2.61 – 3.40: Không ý kiến/ Trung bình…
3.41 – 4.20: Đồng ý/ Hài lòng/ Quan trọng…
4.21 – 5.00: Rất đồng ý/ Rất hài lòng/ Rất quan trọng…
(hotrospss@gmail.com)


Thứ Hai, 17 tháng 2, 2014

Ý NGHĨA GIÁ TRỊ TRUNG BÌNH TRONG THANG ĐO KHOẢNG

Ý NGHĨA GIÁ TRỊ TRUNG BÌNH TRONG THANG ĐO KHOẢNG
Khi phân tích SPSS, bước đầu tiên bạn thường làm là thống kê mô tả, một trong những thông số thông dụng là Mean – trung bình cộng. Bạn nên hiểu rõ ý nghĩa giá trị trung bình của thang đo mà bạn sử dụng (thường là thang đo khoảng - interval scale) để giúp cho việc phân tích số liệu được hợp lý và hiệu quả hơn.
Giả sử bạn dùng thang đo Likert 5 lựa chọn trong bảng khảo sát. Khi đó:
Giá trị khoảng cách = (Maximum – Minimum) / n = (5-1)/5 = 0.8
Ý nghĩa các mức như sau:
1.00 – 1.80: Rất không đồng ý/ Rất không hài lòng/ Rất không quan trọng…
1.81 – 2.60: Không đồng ý/ Không hài lòng/ Không quan trọng…
2.61 – 3.40: Không ý kiến/ Trung bình…
3.41 – 4.20: Đồng ý/ Hài lòng/ Quan trọng…
4.21 – 5.00: Rất đồng ý/ Rất hài lòng/ Rất quan trọng…
(hotrospss@gmail.com)

PHÂN TÍCH PHƯƠNG SAI MỘT YẾU TỐ (ANOVA)

PHÂN TÍCH PHƯƠNG SAI MỘT YẾU TỐ (ANOVA)
Dùng để kiểm định giả thuyết trung bình bằng nhau của các nhóm mẫu với khả năng phạm sai lầm chỉ là 5%.
Ví dụ: Phân tích sự khác biệt giữa các thuộc tính khách hàng (giới tính, tuổi, nghề nghiệp, thu nhập…) đối với 1 vấn đề nào đó (thường chọn là nhân tố phụ thuộc, vd: sự hài lòng).
Một số giả định khi phân tích ANOVA:
- Các nhóm so sánh phải độc lập và được chọn một cách ngẫu nhiên.
- Các nhóm so sánh phải có phân phối chuẩn or cỡ mẫu phải đủ lớn để được xem như tiệm cận phân phối chuẩn.
- Phương sai của các nhóm so sánh phải đồng nhất.
Lưu ý: nếu giả định tổng thể có phân phối chuẩn với phương sai bằng nhau không đáp ứng được thì bạn có thể dùng kiểm định phi tham số Kruskal-Wallis sẽ để thay thế cho ANOVA.
(hotrospss@gmail.com)

PHÂN TÍCH ANOVA (cont.)
Levene test
Ho: “Phương sai bằng nhau”
Sig < 0.05: bác bỏ Ho
Sig >=0.05: chấp nhận Ho -> đủ điều kiện để phân tích tiếp anova
ANOVA test
Ho: “Trung bình bằng nhau”
Sig >0.05: bác bỏ Ho -> chưa đủ điều kiện để khẳng định có sự khác biệt…
Sig <=0.05: chấp nhận Ho -> đủ điều kiện để khẳng định có sự khác biệt…
Khi có sự khác biệt thì có thể phân tích sâu hơn để tìm ra sự khác biệt như thế nào giữa các nhóm quan sát.

(hotrospss@gmail.com)