Chủ Nhật, ngày 02 tháng 10 năm 2016

Cách phân tích anova hai yếu tố, two way anova

Nhóm MBA ĐH Bách Khoa hotrospss@gmail.com giới thiệu đến các bạn phân tích anova hai yếu tố (two-way Anova), mục đích , ý nghĩa và cách thực hành trên SPSS. Phần này nhóm lược dịch từ sách “SPSS Survival Manual” của tác giả JULIE PALLANT

Trong phần này chúng ta sẽ phân tích Anova cho hai nhóm biến độc lập với 1 biến phụ thuộc gọi là phân tích two-way Anova . Cách thường dùng là phân tích one way Anova, ví dụ để so sánh giữa các nhóm tuổi khác nhau có sự khác biệt đối với sự hài lòng hay không.
File dữ liệu có thể được download tại đây:2wayanova_staffsurvey4Ed.sav
File dữ liệu có 3 biến, GIOITINH HAILONG NHOMTUOI, tương ứng với người lao động trong một công ty, có 2 loại giới tính, 3 loại nhóm tuổi và sự hài lòng khi làm việc tương ứng.
Giả sử chúng ta đã có sự khác biệt giữa các nhóm tuổi đối với sự hài lòng thì câu hỏi đặt ra tiếp theo là sự khác biệt đó có đúng cho cả hai nhóm giới tính là nam và nữ hay không. Phân tích one-way Anova không thể trả lời câu hỏi này vì phân tích này được tiến hành cho toàn bộ hai loại giới tính nam và nữ không có sự chia ra.
Sự ưu việt của phân tích two-way Anova như sau: Ví dụ trường hợp chúng ta có thể tìm ra là ảnh hưởng của độ tuổi tới sự hài lòng khác nhau giữa Nam và Nữ. Đối với Nam sự hài lòng tăng theo độ tuổi trong khi đối với Nữ lại giảm theo độ tuổi, trường hợp này gọi là hiệu ứng tương tác interaction effect.

Cách phân tích Two-way anova trong SPSS

Bật chương trình SPSS lên
1. Vào menu Analyze,nhấn General Linear Model, chọn Univariate.
1-menu
2. Nhấn vào biến phụ thuộc sự hài lòng HAILONG ,Đưa vào ô Dependent variable.
2
3. Nhấn vào hai biến độc lập dạng phân loại, categorical GIOITINH,NHOMTUOI Và đưa vào ô Fixed Factors.
4. Nhấn vào nút Options.
• Nhấn vào Descriptive Statistics, Estimates of effect size and Homogeneity tests.
• Nhấn Continue.
3-option
5. Nhấn nút Post Hoc.
• Từ danh sách Factors bên trái, chọn biến NHOMTUOI ( nhóm này phải có 3 nhóm trở lên) và đưa vào ô bên phải Post Hoc Tests.
• Chọn loại kiểm định (Tukey).
4-post-hoc
• Nhấn Continue.
Kết quả ra như sau:
Bảng thống kê mô tả cung cấp về: độ lệch chuẩn, số mẫu, giá trị trung bình
5-descriptive
Bảng kiểm định phương sai bằng nhau “Levene’s Test of Equality of Error Variances” cung cấp kiểm định về kết quả định bằng nhau của phương sai. Bạn sẽ muốn hệ số significant lớn hơn 5% và do đó không có ý nghĩa thống kê, như thế có thể kết luận được phương sai giữa các nhóm biến bằng nhau.
6-anova
Bảng: Test of between subject effect, đây là phần kết quả chính của phân tích two-way Anova.
Interaction effects: Chúng ta nhìn vào dòng NHOMTUOI*GIOITINH với giá trị kiểm định sig. hệ số là 0.138 lớn hơn 5% do đó ảnh hưởng tương tác “Interaction effects”là không có, điều đó chỉ ra rằng không có sự khác biệt trong ảnh hưởng của độ tuổi nên sự hài lòng theo giới tính (nam và nữ).
Main effects: phân tích tác động chính để tìm xem một biến có tác động đến sự hài lòng hay không thì chúng ta nhìn vào cột sig. Nếu giá trị này lớn hơn 5% thì không có tác động có ý nghĩa thống kê trong trường hợp này nhóm tuổi bé hơn 5% và giới tính lớn hơn 5% có nghĩa là giữa các nhóm tuổi có sự khác biệt đối với sự hài lòng còn giữa nam và nữ thì không có sự khác biệt.
Cụ thể muốn biết nhóm nào khác với nhóm nào giữa các nhóm tuổi thì chúng ta nhìn vào phần phân tích sâu Anova,
7-post-hoc
Chúng ta sẽ thấy nhóm tuổi dưới 20 so với nhóm tuổi trên 40 có sig. dưới 5%, và nhóm tuổi dưới 20 so với nhóm tuổi trên 20-40 có sig. dưới 5% Do đó ta kết luận giữa nhóm dưới 20 tuổi và nhóm trên 40 tuổi có sự khác biệt đối với việc hài lòng, cũng như kết luận giữa nhóm dưới 20 tuổi và nhóm 20-40 tuổi có sự khác biệt đối với việc hài lòng.
Các bạn cần trao đổi thêm có thể chát với nhóm tạo facebook.com/hoidapSPSS hoặc mail hotrospss@gmail.com, nhóm sẽ hỗ trợ nhé.
Video 2 way anova:

Ngoài ra nhóm hotrospss@gmail.com có các dịch vụ sau:
– Tư vấn mô hình/bảng câu hỏi/ traning trực tiếp về phân tích hồi quy, nhân tố, cronbach alpha… trong SPSS, và mô hình SEM, CFA, AMOS
– Cung cấp/chỉnh sửa số liệu khảo sát để chạy ra kết quả có ý nghĩa thống kê.

Thứ Tư, ngày 17 tháng 8 năm 2016

Kiểm định Chi bình phương Chi Square test: cách thực hiện, cách đọc kết quả, cách thao tác tính toán bằng tay thay vì dùng SPSS

Kiểm định Chi bình phương Chi Square test: cách thực hiện, cách đọc kết quả, cách thao tác tính toán bằng tay thay vì dùng SPSS


Nhóm MBA hotrospss@gmail.com ĐH Bách Khoa giới thiệu chi tiết về kiểm định chi bình phương. Đọc xong bài này các bạn sẽ hiểu rõ nó, không còn mơ hồ về mục đích và phương pháp thực hiện( kể cả làm bằng thủ công hoặc bằng phần mềm SPSS)

Mục đích

Giả sử chúng ta có 100 người , và có trình độ học vấn khác nhau tại một tỉnh nọ. Câu hỏi đặt ra là có sự liên quan giữa giới tính và trình độ học vấn hay không. Lúc đó ta sẽ dùng kiểm định chi bình phương ( có nhà nghiên cứu đọc là khi bình phương, khi square). Bài này sẽ dùng hai cách:
-Cách tính toán  bằng tay để ra được chỉ số chi-square, df, sig.
-Cách làm bằng SPSS để ra kết quả, để các bạn nắm chắc hơn kiến thức về phần Chi Square này

Cách thực hiện kiểm định chi-square bằng phần mềm SPSS

2 crosstab menu
Đầu tiên các bạn load file dữ liệu ở đây: phantichspss.com/filefordownload/chisquare/ChiSquare.sav
Đầu tiên vào menu Analyze- Descriptive Statistics – Crosstabs, sau đó đưa hai biến giới tính , bằng cấp GIOITINH và BANGCAP vào hai ô tương ứng như trên hình. Sau đó nhấn vào nút Statistics, chọn Chi-square để thực hiện kiểm định.
3 crosstab
Chọn ô Cells và nhấn chọn Observed, Expected và Total như trong hình. Về ý nghĩa thì Observed là số lượng thực tế quan sát, Expected là số lượng kì vọng, Total là tổng phần trăm theo từng dòng và từng cột. Giá trị expected sẽ được nhóm MBA hotrospss@gmail.com tính toán bằng tay ở bước sau để cho các bạn hiểu rõ.
4 cell crosstab
Kết quả ra như sau:
5 ket qua chi square
Các giá trị ở ô màu đỏ là giá trị thực tế quan sát được. Ví dụ số 6 ở hàng màu đỏ đầu tiên. Đó là có 6 người Nam học CAO ĐẲNG. Số 35 bên tay phải của số 6 có nghĩa là có 35 người Nam học ĐẠI HỌC.
Các giá trị ở ô màu xanh là giá trị kì vọng mong đợi .  Ví dụ số 5.6 ở hàng màu xanh đầu tiên. Đó là có 5.6 người Nam kì vọng học CAO ĐẲNG. Số 38.6 bên tay phải của số 5.6 có nghĩa là có 38.6 người Nam kì vọng học ĐẠI HỌC.
Giá trị kì vọng expected cũng khá dễ hiểu, đó là khi có giả thiết độ tuổi và trình độ không có quan hệ với nhau. Thì xác suất xuất hiện của độ tuổi và giới tính độc lập nhau. Lúc đó công thức tính xác suất P(gioitinh & dotuoi)=P(gioitinh)*P(dotuoi) .
Về kết quả kiểm định chi-square trong phần hình màu vàng. Giá trị Asymptotic Significance (2-sided) = 0.238 chính là significane 2 đuôi của kiểm định. Kiểm định Chi-bình phương chỉ có ý nghĩa khi số quan sát đủ lớn, nếu có nhiều hơn 20% số ô trong bảng chéo có tần suất mong đợi expected value nhỏ hơn 5 thì giá trị chi-square nói chung không còn đáng tin cậy. Cuối bảng Chi-Square Tests luôn đưa ra một dòng thông báo cho bạn biết có bao nhiêu % số ô có tần suất mong đợi  expected value dưới 5 của bảng. Nếu số này dưới 20% thì chúc mừng bạn. Còn nếu trên 20% bạn phải tính đến các biện pháp khác, như là sử kiểm định Fisher’s exact test. ( nếu bảng dữ liệu 2×2 thì fisher sẽ tự hiện ra sau giá trị chi square trong bảng kết quả này).
Ở đây ta thấy có 3 giá trị cần lưu ý: giá trị chi square là 2.873, giá trị bậc tự do df là 2, giá trị sig. là 0.238. Do sig. > 5% nên có bằng chứng cho thấy hai biến này độc lập với nhau. Do đó kết  luận giữa HỌC VẤN và GIỚI TÍNH không có quan hệ với nhau. Còn nếu sig<5% thì có bằng chứng cho thấy hai biến này không độc lập với nhau. Ở phần sau nhóm hotrospss@gmail.com sẽ tính bằng tay 3 giá trị chi square, bậc tự do và sig. này để các bạn xem nhé.

Cách thực hiện kiểm định chi-square bằng thủ công.

Các bạn tải file excel  hướng dẫn thủ công ở đây
phantichspss.com/filefordownload/chisquare/ChiSquare.xlsx
Phần này sẽ tính toán các giá trị Chi square, bậc tự do và sig. của kiểm định chi-square. Dữ liệu gốc ban đầu là 100 người được phân bố như sau
6 data goc
Tổng cộng có 100 người nhé.
Từ dữ liệu trên, tính được % theo dòng vào theo cột như sau( ô màu vàng)
7 excel
Ví dụ ô có vòng tròn đỏ là 10%,  nghĩa là có 10% trong 100 người này có trình độ CAO ĐẲNG số này bằng (6+4)/100
8 kivong
Từ các số màu vàng đó, tính ngược lại ra các số kì vọng expected là các số màu đỏ như trên hình. Ví dụ số 5.6 trong vòng tròn màu xanh là bằng 10%x56%x100. Các bạn để ý các số màu đỏ này chính là các số được tính tự động dùng SPSS ở trên , là giá trị expected. Lưu ý P(A&B)=P(A)*P(B) nếu A và B độc lập với nhau. Giả sử A, B độc lập thì mới được bảng trên.Nếu kì vọng i chang quan sát: thì hai biến hoàn toàn không liên quan nhau .Nếu không  chang: thì có liên quan nhau, thì không độc lập với nhau
Áp dụng công thức tính chi bình phương như sau:
9 chi square
Ta tính được chi-square= (6-5.6)*(6-5.6)/5.6+(35-38.64)*(35-38.64)/38.64+(15-11.76)*(15-11.76)/11.76+(4-4.4)*(4-4.4)/4.4+(34-30.36)*(34-30.36)/30.36+(6-9.24)*(6-9.24)/9.24= 2.873
Vậy giá trị chi-square=2.873, giống với giá trị chạy tự động ở trên
Tính giá trị bậc tự do degree of freedom= (3-1)*(2-1)=2 . Số 3 ở đây là do có ba bậc học, số hai là do có hai giới tính.
Để tính được sig. ta dùng hàm chidist trong excel CHIDIST(chi-square,df) = CHIDIST(2.873,2)=0.238
Như vậy đã đủ điều kiện để kết luận hai giá trị Học vấn và Giới tính không có liên quan với nhau
Như vậy đã giúp các bạn hiểu được bản chất của vấn đề. Ngoài ra nếu các bạn muốn tìm hiểu thêm về các kiểm định liên quan , như là kiểm định fisher’s exact test, df tính ra sao…. thì có thể mail cho nhóm Thạc Sĩ QTKD ĐH Bách Khoa tại địa chỉ hotrospss@gmail.com, có thể để lại số alo, viber, facebook… nhóm sẽ trả lời ngay nhé.
Ngoài ra nhóm hotrospss@gmail.com có các dịch vụ sau:
– Tư vấn mô hình/bảng câu hỏi/ traning trực tiếp về phân tích hồi quy, nhân tố, cronbach alpha… trong SPSS, và mô hình SEM, CFA, AMOS
– Cung cấp/chỉnh sửa số liệu khảo sát để chạy ra kết quả có ý nghĩa thống kê.

So sánh quan hệ giữa 7 phương pháp phân tích đa biến : Regression, Discriminant, Conjoint, SEM, ANOVA, MANOVA, Canonical Correlation

So sánh quan hệ giữa 7 phương pháp phân tích đa biến : Regression, Discriminant, Conjoint, SEM, ANOVA, MANOVA, Canonical Correlation


Hôm nay nhóm Thạc Sĩ ĐH Bách Khoa TP.HCM (hotrospss@gmail.com) giới thiệu đến các bạn sự khác nhau giữa các phương pháp đa biến, để các bạn có thể chủ động chọn phương pháp nghiên cứu cho luận văn của mình nhé. Mỗi phương pháp phân tích định lượng chỉ phù hợp với một số loại dữ liệu, loại mô hình, loại biến độc lập và biến phụ thuộc nhất định. Phương pháp thông dụng là hồi quy regession. Tuy nhiên có một số nghiên cứu phương pháp này không xử lý được, cụ thể có 7 phương pháp như sau.

1.Multiple Regression Analysis Hồi quy đa biến

Phương trình toán hoc:
regression
  • Biến độc lập: biến dạng metric hoặc nometric
  • Biến phụ thuộc: một biến dạng metric

2.Mô hình cấu trúc tuyến tính Structural Equation Modeling

Phương trình toán hoc:
sem
Gồm nhiều phương trình hồi quy đa biến tập hợp lại với nhau, mỗi phương trình có:
  • Biến độc lập: biến dạng metric hoặc nometric
  • Biến phụ thuộc: một biến dạng metric

3.Phân tích biệt số Discriminant Analysis

Phương trình toán hoc:
bietso
  •  Biến độc lập: biến dạng metric
  • Biến phụ thuộc: một biến dạng nometric

4.Phân tích kết hợp Conjoint Analysis

Phương trình toán hoc: conjoint
  • Biến độc lập: biến dạng nometric
  • Biến phụ thuộc: một biến dạng metric hoặc nometric

5.Phân tích phương sai Analysis of Variance (ANOVA)

Phương trình toán hoc:
anova
  • Biến độc lập: biến dạng nometric
  • Biến phụ thuộc: một biến dạng metric

6.Phân tích phương sai đa biến Multivariate Analysis of Variance (MANOVA)

Phương trình toán hoc:
manova
  •  Biến độc lập: biến dạng nometric
  • Biến phụ thuộc: nhiều biến dạng metric

7. Phân tích tương quan chính tắc Canonical Correlation

Phương trình toán hoc:
canonicalCorrelation
  • Biến độc lập: biến dạng metric hoặc nometric
  • Biến phụ thuộc: nhiều biến dạng metric hoặc nometric
  Ngoài ra nhóm có các dịch vụ sau( các bạn mail hotrospss@gmail.com, nhóm sẽ trả lời ngay)
– Tư vấn mô hình/bảng câu hỏi/ traning trực tiếp về phân tích hồi quy, nhân tố, cronbach alpha… trong SPSS, và mô hình SEM, CFA, AMOS
– Cung cấp/chỉnh sửa số liệu khảo sát để chạy ra kết quả có ý nghĩa thống kê.

Xử lý lỗi ma trận xoay nhân tố bị xáo trộn lộn xộn, không hội tụ



Hôm nay nhóm Thạc Sĩ ĐH Bách Khoa tp.HCM hướng dẫn cách xử lý khi ma trận xoay trong phân tích nhân tố  xoay  ra số liệu  xấu, các nhân tố không hội tụ

Sau khi chạy Cronbach alpha ổn, điều mong đợi nhất chạy phân tích nhân tố EFA các kết quả ra đẹp, ma trận xoay hội tụ, không bị xáo trộn lộn xộn.
( bạn nào chưa biết cách chạy EFA thì xem link ở đây http://phantichspss.com/tong-quan-phan-tich-nhan-to-kham-pha-efa.html )
Nếu kết quả bạn chạy ra , biến quan sát bị xáo trộn như sau:
matranxoay2
Ta thấy nhiều câu hỏi bị xáo trộn, giá trị các biến không hội tụ lại được,ma trận xoay không theo từng nhóm biến.
Trong khi mong ước của bài là như sau:
matranxoay1
Như ta thấy, mô hình ban đầu chỉ có 6 biến độc lập, sau khi thực hiện xoay nhân tố lại ra tới 12 nhóm, không thể giải thích được.

Nguyên nhân:

– Số  liệu có vấn đề, cần phải xem lại bảng câu hỏi, thậm chí khảo sát lại.

Giải pháp:

– Xem lại toàn bộ số liệu, kiểm tra lại quá trình thu thập bảng câu hỏi
– Gởi mail cho nhóm hotrospss@gmail.com để được tư vấn xử lý, xử lý dứt điểm
–  Ngoài ra nhóm Thạc Sĩ ĐH Bách Khoa tp.HCM còn có dịch vụ tư vấn bảng câu hỏi, hiệu chỉnh số liệu khảo sát cho ổn. Các bạn mail hotrospss@gmail.com nhé.
Nhóm Hỗ Trợ SPSS – hotrospss @gmail.com


Các nội dung nhóm thường tư vấn, hướng dẫn xử lý cho các bạn như sau:
Ma trận xoay rồi thì thấy nó Lộn xộn quá!
biến quan sát bị xáo trộn
ma tran nhân tố xoay nó không hội tụ mà phân tùm lum hết
nhiều biến không có hệ số.
ma trận xoay các nhân tố cho ra kết quả các nhóm rất không tốt, lộn xộn.
ma trận xoay không theo từng nhóm biến
cái bảng xoay nhân tố Rotated Component Matrixa nó ra rất lộn xộn, có 1 biến mà thuộc 2 nhóm nhân tố
Một số câu hỏi bị xáo trộn
Efa bảng dữ liệu đã xoay số liệu rất xấu
nhưng khi khắc phục xong ma trận xoay của em còn rất ít yếu tố
mà giá trị các biến không hội tụ lại được
ma trận xoay cũng không ra luôn à.
ma trận xoay đúng trật tự các nhân tố ban đầu
Bảng xoay EFA cuối cùng của em các biến bị sắp xếp lộn xộn không cùng một nhóm

Xử lý lỗi chỉ số KMO không xuất hiện khi phân tích nhân tố EFA



Khi tiến hành phân tích nhân tố, một số trường hợp sẽ bị lỗi là chỉ số KMO không xuất hiện trong bảng kết quả , trong khi mọi chỉ số khác đều đầy đủ. Vậy làm thế nào để KMO hiện ra? Nay nhóm MBA Bách Khoa hotrospss@gmail.com sẽ hướng dẫn bạn cách tự xử lý:
Khi KMO không xuất hiện, kết quả như sau:
kmo1
KMO xuất hiện, mong muốn được như  sau:
kmo2
Nguyên nhân do một trong ba vấn đề chính sau đây làm cho KMO không hiển thị khi phân tích nhân tố EFA.

Lý do 1:

– Có hai biến quan sát giá trị hòa toàn giống nhau, đây là điều dễ gặp khi các bạn “chế số” để ra kết quả chạy đẹp. Để biết được điều này thì các bạn thực hiện thống kê mô tả cho tất cả các biến, trong phần options  chọn Ascending means
kmo3
– Sau đó xem kết quả , xem hai giá trị nào có cùng giá trị trung bình mean và độ lệch chuẩn Std. Deviation. Thì đây là hai đối tượng nghi ngờ gây ra chuyện giá trị KMO không xuất hiện.( bạn nào chưa biết chạy thống kê mô tả thì xem ở đây nhé: http://phantichspss.com/huong-dan-cach-chay-thong-ke-mo-ta-trong-spss.html  )

Lý do 2:

– Có một hoặc nhiều biến có độ lệch chuẩn bằng 0. Các bạn cũng dùng thống kê mô tả ở trên để tìm ra nó( tìm biến nào có Std. Deviation=0)
Và khi chỉ số KMO disappear, nếu các bạn tinh mắt sẽ thấy có một giá trị khác thay vào nó, và cũng ko xác định được, đó là giá trị Correlation Matrix: a. This matrix is not positive definite. Các bạn không cần quan tâm đến ma trận này nhé.
Lý do chính của hai vấn đề trên là do số liệu SPSS được sửa lại để chạy kiểm định Cronbach’s alpha…., điều này rất nguy hiểm, bởi vì số liệu cần phải đạt được tính thống nhất trong tất cả các bước của một bài luận văn: cronbach, efa, tương quan, hồi quy… Chỉ cần một bước dữ liệu bị thay đổi là các bước sau bị ảnh hưởng hết.

Lý do 3:

Lý do này hơi ngớ ngẩn, đó là do khi phân tích nhân tố bạn chưa tick vào chọn hiển thị KMO như sau:
kmo4

Đặc biệt:

Gởi mail cho nhóm MBA Bách Khoa hotrospss@gmail.com để được tư vấn hướng dẫn xử lý số liệu, đào tạo trực tiếp cho việc làm luận văn với SPSS hoặc AMOS nhé.

Cài SPSS bị lỗi: Error 1311. Source file not found



Khi cài SPSS một số trường hợp sẽ gặp lỗi sau: “Error 1311. Source file not found.. Verify that the file exists and that you can access it
spss install errors
Nguyên nhân là do chưa giải nén thư mục cài đặt. Ví dụ toàn bộ thư mục cài đặt được đặt trong file giainen.zip , các bạn double click vào file này và chọn cài đặt luôn. Như vậy là chưa đúng. Cần phải giải nén file này ra, sau đó sẽ xuất hiện thư mục sau khi giải nén, sau đó vào đó chọn file cài đặt. Như vậy sẽ hết lỗi.( Nhóm MBA Bách Khoa hotrospss@gmail.com  –  năm 2016)

Dịch spss tiếng việt cho phần kết quả



Dịch spss Tiếng Việt
Khi làm luận văn, chạy các bước cronbach’s alpha, EFA, tương quan, hồi quy, một số trường hợp giáo viên sẽ yêu cầu dịch các bảng biểu qua tiếng Việt. Do đó nhóm hỗ trợ SPSS dịch một số thuật ngữ trong phần kết quả của SPSS qua tiếng Việt.   Có chỗ nào chưa rõ các bạn cứ mail về nhóm tại địa chỉ hotrospss@gmail.com nhé
dichvietnamese
Tên tiếng Anh
Dịch qua tiếng Việt
Frequencies
Tần số
Statistics
Thống kê
Valid
Hợp lệ
Missing
Thiếu
Frequency Table
Bảng tần số
Frequency
Tần số
PercentValid Percent
Tỷ lệ phần trăm
hợp lệ
Cumulative Percent
Phần trăm tích lũy
Descriptive Statistics
Thống kê mô
tả
Minimum
Nhỏ nhất
Maximum
Lớn nhất
Mean
Trung Bình
Std. Deviation
Độ lệch chuẩn
Corrected Item-Total Correlation
Tương quan biến tổng
Cronbach’s Alpha if Item Deleted
Alpha Cronbach nếu Deleted câu này
KMO and Bartlett’s Test
Kiểm định KMO và Bartlett
Total Variance Explained
Tổng phương sai trích
Initial Eigenvalues
Eigenvalues khởi tạo
Component Matrix
Ma trận các thành phần
Rotated Component Matrix
Ma trận xoay các thành phần
R
Hệ số R
R Square
Hệ số R bình phương
Adjusted R Square
Hệ số R bình phương
hiệu chỉnh
Std. Error of the Estimate
Sai số chuẩn của
ước lượng
Coefficients
Hệ số
Model
Mô hình
Unstandardized Coefficients
Hệ số chưa chuẩn hóa
Standardized Coefficients
Hệ số đã chuẩn hóa
t
t
Sig.
Sig.
Collinearity Statistics
Đa cộng Tuyến
B
B
Std. Error
Sai số chuẩn
Beta
Beta
Tolerance
Hệ số Tolerance
VIF
Hệ số phóng đại
phương sai VIF
Constant
Hằng số
Test of Homogeneity of Variances
Kiểm định tính
đồng nhất của phương sai
Levene Statistic
Kiểm định Levene
Gởi mail ngay cho nhóm MBA hotrospss@gmail.com để được hướng dẫn:
– Khảo sát thị trường/ xử lý/hiệu chỉnh số liệu khảo sát để chạy ra kết quả phân tích nhân tố hội tụ,phân tích hồi quy hồi quy có ý nghĩa thống kê.
– Tư vấn mô hình/bảng câu hỏi/traning trực tiếp về phân tích hồi quy, nhân tố, cronbach alpha… trong SPSS, và mô hình SEM, CFA, AMOS

Cách chuyển từ biến Category sang Dichotomy



Nhóm MBA ĐH Bách Khoa hotrospss@gmail.com giới thiệu cách:
Chuyển 1 biến dạng phân loại (Category) thành dạng biến lưỡng phân (Dichotomy) . Biến category là biến có nhiều biển hiện, ví dụ Xanh, Đỏ, Vàng. Biến Dichotomy là biến chỉ có 2 biểu hiện, ví dụ có màu hoặc không có màu
Được dùng khi gặp câu hỏi có nhiều trả lới (MA) để tập hợp một thông tin chứa trong các câu trả lời, muốn vậy cần tạo một biến với 2 biểu hiện: 1 có thông tin và 0 không có thông tin, đếm 1 sẽ có được thông tin cần quan tâm;

Cách tiến hành

Đầu tiên các bạn download file thực hành Hoàng Trọng ở đây
Sau đó mở file.
Vào menu Transform \ count
Khai tên biến Dichotomy trong Target Variable (docTTre) và nhãn biến trong Target Label (Nguoi doc bao TTre).
dichotomy1[1]
Vào Define Values
Value: nhập 7 (là mã hóa của báo Tuổi trẻ), nhấn Add để chuyển vào Values to Count. Continue. OK.
dichotomy2[1]

Biến docTTre được tạo ra ở cuối Variable View, khai báo tiếp Value với 2 biểu hiện của biến: 0 không đọc báo Tuổi trẻ và 1 có đọc báo Tuổi trẻ.

Sau đây là phần video hướng dẫn


Hướng dẫn thực hành phân tích hồi quy nhị phân binary logistic

 Chào các bạn,
Hôm nay nhóm giới thiệu video về cách thực hành chạy hồi quy binary logistic. Mô hình này dùng khi biến phụ thuộc dạng nhị phân, chỉ có hai giá trị 0  hoặc 1.
Bên dưới có hướng dẫn chi tiết ý nghĩa các bảng được đề cập trong video.

Về mô hình: đây là mô hình xác định khả năng trả nợ dựa vào  6 yếu tố độc lập.
Mô hình có 6 biến độc lập:
THUNHAP, TUOI, TAISAN, DIENTICHDAT, HOCVAN, SOLUONGBATDONGSAN
Và 1 biến phụ thuộc là TRANO. 
Biến phụ thuộc dạng nhị phân có hai giá trị 0 và 1 tương ứng với không trả được nợ và trả được nợ.
 
Khi chạy ra các kết quả sau:
-Omnibus Tests of Model Coefficients: Giống kiểm định F bên hồi quy đa biến, sig<5% nên bác bỏ giả thiết Ho: B1=B2=B3…=0
Omnibus Tests of Model Coefficients
Chi-square
df
Sig.
Step 1
Step
107.435
6
0
Block
107.435
6
0
Model
107.435
6
0
Bảng Model Summary
Model Summary
Step
-2 Log likelihood
Cox & Snell R Square
Nagelkerke R Square
1
129.147a
.466
.623
 Chỉ số -2 Log  likelihood: càng nhỏ càng tốt,cách tính ngược
lại với R bình phương của hồi quy đa biến. Nếu nhỏ thì thể hiện độ phù hợp khá
tốt của mô hình tổng thể
 
Bảng Classification Table cho thấy phân loại đối tượng trả được nợ và không trả được nợ theo hai tiêu chí : quan sát thực tế và dự đoán
Classification Tablea
Observed
Predicted
TRANO
Percentage Correct
0
1
Step 1
TRANO
0
76
14
84.4
1
19
62
76.5
Overall Percentage
80.7
a. The cut value is
.500
Ý nghĩa:
Trong 90 trường hợp quan sát ko trả được nợ, thì dự đoán có 76 trường
hợp không trả được, vậy tỉ lệ dự đoán đúng là 76/90=84.4
Trong 81 trường hợp quan sát trả được nợ, dự đoán có 62 trường hợp
trả được, vậy tỉ lệ dự đoán đúng là 62/81=76.5
Vậy trung bình dự đoán đúng (84.4+76.5)/2=80.7 phần trăm
Variables in the Equation
B
S.E.
Wald
Df
Sig.
Exp(B)
Step 1a
THUNHAP
0.269
0.087
9.568
1
0.002
1.309
TUOI
0.049
0.017
8.285
1
0.004
1.05
TAISAN
0.006
0.002
5.536
1
0.019
1.006
DIENTICHDAT
0.001
0
7.974
1
0.005
1.001
HOCVAN
1.139
0.378
9.063
1
0.003
3.124
SOLUONGBATDONGSAN
1.024
0.304
11.329
1
0.001
2.785
Constant
-18.937
2.978
40.445
1
0
0
a. Variable(s) entered
on step 1: THUNHAP, TUOI, TAISAN, DIENTICHDAT, HOCVAN, SOLUONGBATDONGSAN.

Ví dụ một người có các thông tin cá nhân như sau, ta sẽ dùng kết quả phương trình hồi quy để dự đoán khả năng trả nợ:
THUNHAP
TUOI
TAISAN
DIENTICHDAT
HOCVAN
SOLUONGBATDONGSAN
13.5
56
493
4,011
4
3
Hàm xác suất trả nợ
xacsuattrano[1]

Thế vào, kết quả E(Y/X)= 4.90/5.90=0.83
Kết luận, khả
năng trả nợ của người này là 83%, và đây là khả năng trả nợ dự đoán, và dự đoán
này đúng 80.7%
 
@liên hệ nhóm MBA để được hỗ trợ khi xử lý số liệu, để đạt được ý nghĩa thống kê khi phân tích hồi quy logistic với SPSS tại mail hotrospss@gmail.com