Thứ Sáu, 11 tháng 7, 2014

Về khái niệm listwise và pairwise trong thống kê với SPSS

Gần đây ad nhận được câu hỏi của một số bạn về hai khái niệm  listwise deletion  và pairwise deletion  khi phân tích với dữ liệu missing values, ad viết bài sau đây là chia sẻ  để các bạn có thể tham khảo thêm thông tin.
Khi thu thập dữ liêu nghiên cứu, có thể có trường hợp ta không thu thập đủ thông tin, những giá trị đó gọi là missing values. Phân tích dữ liệu với SPSS , hoặc AMOS chia ra như sau:
- Exclude Case Listwise : khi phân tích sẽ loại bỏ hoàn toàn dòng dữ liệu đó ra khỏi các phân tích liên quan.
- Exclude Case Pairwise : khi phân tích chỉ loại bỏ những giá trị trống của dòng dữ liệu đó, các cột có dữ liệu vẫn được phân tích bình thường.
Ví dụ khi phân tích tương quan, mục option có mục chọn như sau

Và dữ liệu như sau, chúng ta sẽ phân tích tương quan cho 3 biến RELIABILITY1 2 3


Chỉ có một missing value là RELIABILITY1 ở dòng thứ nhì. Trong phương pháp listwise deletetion thì phân tích bỏ hẵn dòng này ra, kể cả RELIABILITY2 và RELIABILITY3 không hề có missing value vẫn bị loại bỏ dòng thứ nhì ra, mẫu chỉ còn 3 dòng. Trong khi đó, phương pháp pairwise chỉ loại bỏ giá trị dòng thứ 2 liên quan đến biến RELIABILITY1 , còn các dòng không liên quan , mẫu vẫn là 4 dòng như các giá trị tô màu đỏ trong hình.