Bài giảng Tin học căn bản - Chương 3: SPSS
Phân tích dữ liệu là gì?
Phân tích dữ liệu là quy trình sử dụng các công cụ tính
toán điện tử và các phương pháp chuyên dụng để biến đổi
các dòng dữ liệu ban đầu thành các dòng thông tin kết quả.
Việc chắt lọc được các
thông tin hữu ích nhất từ
một kho các thông tin chính
là yêu cầu số một của quá
trình phân tích dữ liệu thông
tin kinh tế.
Quá trình tư duy thống kê dựa trên dữ liệu
1- Giới thiệu về phân tích dữ liệu và SPSS
Tại sao phải phân tích dữ liệu?
Dữ liệu chỉ là các số liệu thô và bản thân chúng không phải
là tri thức. Phân tích dữ liệu có vai trò quan trọng trong các hệ
thống quản lý kinh tế, nó giúp biến đổi dữ liệu trở thành những
thông tin thống kê làm cơ sở cho việc gia tăng sự hiểu biết, tri
thức từ đó đưa ra được các quyết định kịp thời, chính xác. Tất
cả mọi quyết định quản lý chỉ mang lại hiệu quả kinh tế cao khi
dựa trên cơ sở của một quy trình xử lý thông tin khoa học, bao
quát được các nguồn thông tin chiến lược và đón đầu được các
xu thế phát triển.
Tóm tắt nội dung tài liệu: Bài giảng Tin học căn bản - Chương 3: SPSS
18/09/2013 1 HỌC VIỆN NGÂN HÀNG KHOA HỆ THỐNG THÔNG TIN KINH TẾ Chƣơng 3 - SPSS (Statistical Products for the Social Sevices) Bài giảng của Khoa Hệ thống thông tin Quản lý Nội dung Giới thiệu về phân tích dữ liệu và SPSS 1 Dữ liệu trong SPSS 2 Các phép xử lý dữ liệu căn bản 3 18/09/2013 Chương 3 - SPSS 2 1- Giới thiệu về phân tích dữ liệu với SPSS Chương 3 - SPSS 3 18/09/2013 1/ Dữ liệu là gì? 2/ Phân loại dữ liệu 3/ Phân tích dữ liệu là gì? 4/ Các bƣớc cơ bản trong nghiên cứu, phân tích dữ liệu 5/ SPSS? 6/ Khởi động SPSS 7/ Màn hình giao diện SPSS 1- Giới thiệu về phân tích dữ liệu và SPSS Chương 3 - SPSS 4 18/09/2013 1/ Dữ liệu là gì? Dữ liệu là các số liệu hoặc tài liệu cho trước chưa qua xử lý. 2/ Phân loại dữ liệu: 2 loại ⟹ Phân loại dữ liệu định tính và định lượng nhằm xác định các phép toán thống kê hợp lý. Dữ liệu định tính Dữ liệu định lượng Thể hiện dưới dạng từ ngữ. Mang tính chủ quan như ý kiến, kinh nghiệm, cảm giác Ví dụ: các dịch vụ ngân hàng bạn thường dùng: Gửi tiền, vay tiền, chuyển khoản, thanh toán nội địa Thể hiện dưới dạng số học. Mang tính khách quan. Ví dụ: Lãi suất gửi tiền của các kỳ hạn 1- Giới thiệu về phân tích dữ liệu và SPSS 5 18/09/2013 3/ Phân tích dữ liệu là gì? Phân tích dữ liệu là quy trình sử dụng các công cụ tính toán điện tử và các phương pháp chuyên dụng để biến đổi các dòng dữ liệu ban đầu thành các dòng thông tin kết quả. Việc chắt lọc được các thông tin hữu ích nhất từ một kho các thông tin chính là yêu cầu số một của quá trình phân tích dữ liệu thông tin kinh tế. Quá trình tư duy thống kê dựa trên dữ liệu Chương 3 - SPSS 1- Giới thiệu về phân tích dữ liệu và SPSS 6 18/09/2013 Tại sao phải phân tích dữ liệu? Dữ liệu chỉ là các số liệu thô và bản thân chúng không phải là tri thức. Phân tích dữ liệu có vai trò quan trọng trong các hệ thống quản lý kinh tế, nó giúp biến đổi dữ liệu trở thành những thông tin thống kê làm cơ sở cho việc gia tăng sự hiểu biết, tri thức từ đó đưa ra được các quyết định kịp thời, chính xác. Tất cả mọi quyết định quản lý chỉ mang lại hiệu quả kinh tế cao khi dựa trên cơ sở của một quy trình xử lý thông tin khoa học, bao quát được các nguồn thông tin chiến lược và đón đầu được các xu thế phát triển. Chương 3 - SPSS 18/09/2013 2 1- Giới thiệu về phân tích dữ liệu và SPSS 7 18/09/2013 4/ Các bƣớc cơ bản trong nghiên cứu, phân tích dữ liệu: a) Xác định vấn đề nghiên cứu: cần xác định rõ ràng, chính xác vấn đề cần nghiên cứu giúp thu thập dữ liệu tiến hành nhanh gọn, chính xác. b) Thu thập dữ liệu: • Thiết kế các cách thức thu thập dữ liệu là công việc quan trọng đối với phân tích thống kê. • Hai khía cạnh quan trọng của nghiên cứu thống kê là: tổng thể (tập hợp các phần tử) và mẫu (một tập hợp con của tổng thể). • Dữ liệu có thể được thu thập từ những nguồn có sẵn hay qua quan sát, nghiên cứu, thử nghiệm. Chương 3 - SPSS 1- Giới thiệu về phân tích dữ liệu và SPSS 8 18/09/2013 c) Xử lý dữ liệu: qua 3 bước • Mã hoá: trừ một số dữ liệu định lượng thì không cần mã hoá, còn các dữ liệu định tính cần được mã hóa để chuyển về dạng số. • Nhập liệu: Dữ liệu được nhập và lưu trữ bởi ít nhất hai người nhập liệu độc lập khác nhau. Thông thường trong thực tế nhập dữ liệu từ bảng câu hỏi vào máy tính là nhập hai lần. • Hiệu chỉnh: Dữ liệu được kiểm tra bằng cách so sánh hai tập hợp dữ liệu được nhập độc lập với nhau và phát hiện sai lệch giữa hai lần nhập. Kiểm tra bằng cách nhập lần hai bảo đảm mức độ chính xác lên đến 99,8%. Chương 3 - SPSS 1- Giới thiệu về phân tích dữ liệu và SPSS 9 18/09/2013 d) Phân tích dữ liệu: Các phương pháp phân tích dữ liệu được chia thành hai loại: • Các phương pháp thăm dò: dùng để khám phá ý nghĩa của dữ liệu bằng các phép tính số học đơn giản và các biểu đồ đơn giản tóm tắt dữ liệu. • Các phương pháp khẳng định: dùng các ý tưởng trong lý thuyết xác suất để trả lời các vấn đề nghiên cứu cụ thể e) Báo cáo kết quả: thông qua suy diễn, từ dữ liệu mẫu thu thập được ước lượng, kiểm định và các mô hình phân tích khác sẽ giúp khẳng định các đặc tính của tổng thể. Các kết quả có thể được báo cáo dưới dạng bảng, đồ thị hay các số phần trăm. Chương 3 - SPSS 1- Giới thiệu về phân tích dữ liệu và SPSS 10 18/09/2013 5/ SPSS là gì? ∎ SPSS (Statistical Products for the Social Sevices) là một phần mềm chuyên dụng cho thống kê kinh tế xã hội và kinh tế lượng được thiết kế để thực hiện tất cả các bước trong phân tích thống kê, từ việc liệt kê dữ liệu, lập bảng biểu và thống kê mô tả cho đến các phân tích thống kê phức tạp mà không cần phải lập trình như các phần mềm khác. ∎ SPSS có thể tạo ra các bảng tính tần suất của tất cả các biến trong cơ sở dữ liệu, hoặc cho phép tạo ra các bảng tương quan giữa các biến. Ví dụ: cơ sở dữ liệu của một cơ quan có thể lập các bảng tổng hợp như: mức lương phân theo chức vụ, mức lương phân theo trình độ học vấn, hệ số phụ cấp phân theo số năm công tác ∎ SPSS ra đời từ 1960, đến nay đã xuất hiện phiên bản 19. Chương 3 - SPSS 1- Giới thiệu về phân tích dữ liệu và SPSS 11 18/09/2013 6/ Khởi động SPSS: Chọn Start – All Programs – SPSS 16.0 - SPSS 16.0 Chạy chương trình Tutorial Mở 1 tệp trống .sav cho phép người dùng nhập dữ liệu mới Chạy một câu truy vấn dữ liệu có sẵn với phần mở rộng là .spq Cho phép tạo mới câu truy vấn dữ liệu với phần mở rộng .spq Mở 1 tệp dữ liệu đã có sẵn với các định dạng của: SPSS, Excel, Lotus, DBASE Mở 1 tệp dữ liệu với các định dạng khác Chương 3 - SPSS 1- Giới thiệu về phân tích dữ liệu và SPSS 12 18/09/2013 7/ Giao diện của SPSS Sau khi khởi động SPSS sẽ xuất hiện cửa sổ SPSS Data Editor với giao diện như một bảng tính cho phép người dùng định nghĩa, nhập, hiệu đính và thể hiện dữ liệu. Thanh tiêu đề (Title bar) Thanh thực đơn (Menu bar) Thanh công cụ (Tool bar) Thanh cuộn Thanh trạng thái (Status bar) Cột: Mỗi cột chứa một biến dữ liệu cụ thể Dòng: Mỗi dòng trong bảng chứa các dữ liệu của đối tượng được quan sát Màn hình để nhập và thể hiện dữ liệu đã nhập Màn hình để khai báo biến (tên, loại, độ rộng, loại thang đocủa biến) Chương 3 - SPSS 18/09/2013 3 1- Giới thiệu về phân tích dữ liệu và SPSS 13 18/09/2013 Tìm hiểu thanh thực đơn Menu: File: Khởi tạo, đóng mở file, lưu file, in ấn, thoát Edit: Undo, sao chép, cắt dán, tìm kiếm thay thế, chèn biến, chèn giá trị View: Cho hiện dòng trạng thái, thanh công cụ, chọn font chữ, cho hiện giá trị nhập vào hay nhãn của các giá trị nhập Data: Định nghĩa biến, thêm biến, ghép file, chia file, chọn quan sát Transform: Tính toán, mã hoá lại các biến Analyze: Thực hiện thống kê: tóm tắt dữ liệu, so sánh trung bình, phương sai, tương quan và hồi quy, phân tích đa biến Utilities: Tìm hiểu thông tin về các biến, file Graphs: Tạo các biểu đồ và đồ thị. Window: Sắp xếp và di chuyển các cửa sổ làm việc trong SPSS Chương 3 - SPSS 1- Giới thiệu về phân tích dữ liệu và SPSS 14 18/09/2013 Sử dụng tiếng Việt trong SPSS: từ cửa sổ Data chọn View – chọn Font rồi chọn kiểu font. Chương 3 - SPSS 2- Dữ liệu trong SPSS 15 18/09/2013 1/ Thu thập dữ liệu 2/ Nhập dữ liệu 3/ Làm sạch dữ liệu Chương 3 - SPSS 16 18/09/2013 1/ Thu thập dữ liệu Việc thu thập dữ liệu là từ các phiếu trả lời của các bảng hỏi. Ví dụ một bảng hỏi được xây dựng theo cách thức sau: BẢNG CÂU HỎI PHỎNG VẤN Số phiếu: Đề tài nghiên cứu: “Thăm dò về thói quen sử dụng các dịch vụ của ngân hàng” Mục đích: Tìm hiểu một phần về vai trò của ngân hàng trong đời sống của người dân cũng như giúp cho các ngân hàng hiểu rõ hơn các ý kiến và nhu cầu sử dụng các dịch vụ ngân hàng của khách hàng, trên cơ sở đó đưa ra được các dịch vụ và chính sách hiệu quả, hợp lý. Xin vui lòng khoanh tròn các phương án mà anh/chị/ông/bà thấy phù hợp với mình. A- CÁC DỊCH VỤ NGÂN HÀNG 1. Anh/chị/ông/bà có thường xuyên sử dụng các dịch vụ của ngân hàng không? (chọn 1 trả lời) Chương 3 - SPSS Hầu như không 1 Thỉnh thoảng 2 Thường xuyên 3 Rất thường xuyên 4 2- Dữ liệu trong SPSS 2- Dữ liệu trong SPSS 17 18/09/2013 2a. Anh/chị/ông/bà đã sử dụng dịch vụ của ngân hàng nào? (có thể chọn nhiều trả lời) 2b. Các thành viên gia đình anh/chị/ ông/bà đã sử dụng dịch vụ của ngân hàng nào? (có thể chọn nhiều trả lời) 3. Trong gia đình anh/chị/ông/bà, số lượng người đã sử dụng các dịch vụ của ngân hàng là bao nhiêu? Ghi một con số cụ thể: ___ người. 4. Anh/chị/ông/bà thường sử dụng các dịch vụ nào của ngân hàng? (có thể chọn nhiều trả lời) Chương 3 - SPSS 2a 2b Agribank 1 1 Techcombank 2 2 Vietcombank 3 3 ACB 4 4 MB bank 5 5 VP bank 6 6 Khác 7 7 Gửi tiền 1 Vay tiền 2 Chuyển khoản 3 Thanh toán 4 Trả lương 5 Khác 6 2- Dữ liệu trong SPSS 18 18/09/2013 5. Khi có một khoản tiền nhàn rỗi anh/chị/ ông/bà thường làm gì? (chọn tối đa 2 trả lời) 6. Anh/chị/ông/bà thường sử dụng kỳ hạn lãi suất nào khi sử dụng dịch vụ vay, gửi tiền? (chọn tối đa 3 trả lời) 7. Hãy xếp hạng các chủ đề sau đây tùy theo mức độ quan tâm của anh/chị/ông/bà đối với từng loại chủ đề: chủ đề nào quan tâm nhất thì ghi số 1, quan tâm nhì thì ghi số 2, quan tâm ba thì ghi số 3. Lãi suất: _____ Thái độ phục vụ: _____ Uy tín: _____ Chương 3 - SPSS Gửi tiết kiệm 1 Mua vàng 2 Mua sắm 3 Đầu tư 4 Khác 5 1 tháng 1 3 tháng 2 6 tháng 3 9 tháng 4 1 năm 5 Khác 6 18/09/2013 4 2- Dữ liệu trong SPSS 19 18/09/2013 8. Anh/chị/ông/bà đánh giá các mặt sau đây của các ngân hàng như thế nào? Chương 3 - SPSS Rất không hài lòng Không hài lòng Bình thường Hài lòng Rất hài lòng Không ý kiến 1. Tính đa dạng của dịch vụ 1 2 3 4 5 8 2. Tính tin cậy của các dịch vụ 1 2 3 4 5 8 3. Tính hiệu quả của các dịch vụ 1 2 3 4 5 8 4. Tính tiện ích của các dịch vụ 1 2 3 4 5 8 5. Tính mới, đột phá 1 2 3 4 5 8 2- Dữ liệu trong SPSS 20 18/09/2013 B- THÔNG TIN CÁ NHÂN Họ tên: __________________________ Điện thoại: ____________ Địa chỉ: _________________________________________________ Tuổi: ____________ Số người trong hộ gia đình: _____________ Giới tính: 1. Nam 2. Nữ Thu nhập cá nhân(TB tháng): 1. Không 2. Dưới 1 tr 3. 1-2 tr 4. 2-4 tr 5. Trên 4 tr Thu nhập gia đình (TB tháng): 1. Dưới 2 tr 2. 2-4 tr 3. 4-6 tr 4. Trên 6 tr Học vấn: 1. Phổ thông 2. CĐ 3. ĐH 4. Sau ĐH Nghề nghiệp: 1. Công chức 2. Giáo viên 3. Nhân viên văn phòng 4. Nhân viên KD 5. Tự KD 6. SV – HS 7. LĐ đơn giản 8. Về hưu 9. Không làm việc 10. Nghề chuyên môn (Bác sĩ, kiến trúc sư, kế toán, nhạc sĩ) Chương 3 - SPSS 2- Dữ liệu trong SPSS 21 18/09/2013 2/ Nhập dữ liệu: Sau khi lấy ý kiến của người dân thông qua bảng câu hỏi phỏng vấn trên, ta tiến hành nhập dữ liệu thu thập được từ các phương án trả lời của các bảng câu hỏi vào phần mềm SPSS, ta thực hiện theo 2 bước sau: Bƣớc 1: Mã hoá và tạo khuôn nhập dữ liệu theo 4 quy tắc sau: Các thông tin thu thập không phải dưới dạng số phải mã hoá để chuyển thành dạng số. VD: Giới tính được mã hóa: 1. Nam; 2. Nữ Các thông tin thu thập đã ở dạng số không cần mã hoá. VD: Tuổi Các câu hỏi chỉ có một trả lời thì chỉ cần tạo một biến để lưu trữ câu trả lời. VD: Anh/chị/ông/bà có thường xuyên sử dụng các dịch vụ của ngân hàng không? (chọn 1 trả lời) ⟹ chỉ cần tạo 1 biến Chương 3 - SPSS 2- Dữ liệu trong SPSS 22 18/09/2013 Các câu hỏi có thể chọn nhiều trả lời thì cần phải tạo nhiều biến để lưu trữ các phương án trả lời tương ứng. VD: Anh/chị/ông/bà thường sử dụng các dịch vụ nào của ngân hàng? (có thể chọn nhiều trả lời) ⟹ cần tạo 6 biến Bƣớc 2: Nhập dữ liệu: dữ liệu có thể được nhập theo 3 cách sau: Cách 1: Nhập trực tiếp trong cửa sổ Data Editor. Cách 2: Lấy từ các file dữ liệu có các định dạng khác nhau từ: - Các bảng tính worksheet được lập trong Excel hoặc Lotus. - Cơ sở dữ liệu được lập dưới định dạng DBASE và SQL. - Các file dạng text ASCII với kiểu Tab-deliminated Cách 3: Dùng phần mềm tạo form nhập liệu. Chương 3 - SPSS 18/09/2013 23 Tổ chức sắp xếp dữ liệu và nhập liệu trong SPSS như sau: Mỗi đối tượng trả lời (quan sát) tương ứng với một dòng (1 case). Thông tin của mỗi đối tượng được nhập vào một dòng của cửa sổ Data View Mỗi loại thông tin thu thập được sắp xếp tương ứng với một cột (1 variable) Nhập liệu từ trái qua phải trên cửa số Data View theo từng dòng). Xong một phiếu (một dòng) thì chuyển sang phiếu khác (sang dòng mới). Cách 1: Nhập trực tiếp dữ liệu trong cửa sổ Data Editor Chương 3 - SPSS 18/09/2013 24 Định nghĩa các biến cần dùng trong bảng Variable View Biến là đại lượng đại diện cho các câu hỏi trong bảng hỏi hoặc các vấn đề cần quan sát. VD: Dịch vụ ngân hàng, Giới tính, Tuổi là các biến. Bảng Variable View chứa đựng các thông tin về các thuộc tính của từng biến trong file dữ liệu. Trong một bảng Variable View ta có: các hàng là danh sách các biến; các cột là các thuộc tính của từng biến. Số lượng biến cần định nghĩa bằng tổng số phương án trả lời của từng câu hỏi trong bảng phỏng vấn. Các câu hỏi có tối đa bao nhiêu câu trả lời thì cần phải tạo bấy nhiêu biến để lưu trữ các phương án trả lời tương ứng. Ví dụ trong bảng câu hỏi phỏng vấn trên: câu 1 cần tạo 1 biến, câu 2a cần tạo 7 biến, câu 5 cần tạo 2 biến. Chương 3 - SPSS 18/09/2013 5 18/09/2013 25 Với mỗi một biến ta xác định các thuộc tính sau: Tên biến {Name} Kiểu dữ liệu {Type} Số các chữ số của biến {Width} ⟹ Xđ độ rộng cột chứa biến Số lượng chữ số thập phân {Decimals} Mô tả nhãn hiển thị của biến {Label} Xác định nhãn giá trị của biến {Values} Mô tả giá trị khuyết thiếu {Missing} Căn lề hiển thị giá trị của biến trong cửa sổ Data View {Align} Xác định thang đo của biến {Measure} Chương 3 - SPSS 18/09/2013 26 a) Tên biến (Name): Tên biến là một chuỗi có độ dài 8 ký tự, không bắt đầu bằng một chữ số, không kết thúc bằng dấu chấm, không chứa khoảng trắng và các ký tự đặc biệt như: !, ?, „,* . Thông thường tên biến được đặt tương ứng với thứ tự của câu hỏi mà biến đó mô tả, ví dụ với câu hỏi 1 thì đặt tên biến là c1. - Cách tạo tên biến: gõ trực tiếp giá trị của tên biến tại cột Name. Với những câu hỏi có nhiều phương án trả lời thì phải tạo nhiều biến lưu trữ. Chương 3 - SPSS 18/09/2013 27 Chú ý: ta có thể Copy các thuộc tính đã định nghĩa ở 1 biến cho các biến khác. Bước 1: Trong cửa sổ Variable View lựa chọn ô, các ô hay một dòng các thuộc tính đã được định nghĩa muốn áp dụng cho các biến khác. Từ thanh menu Edit chọn Copy hoặc kích chuột phải chọn Copy. Bước 2: Chọn ô, các ô/dòng muốn áp dụng các thuộc tính. Từ thanh menu Edit chọn Paste hoặc kích chuột phải chọn Paste. Chương 3 - SPSS b) Kiểu dữ liệu (Type): Mặc định một biến mới tạo sẽ có kiểu dữ liệu số Numeric, ta có thể thay đổi sang các kiểu dữ liệu khác trong hộp thoại Variable Type. Cách thiết lập Kiểu dữ liệu: chọn trực tiếp trong cửa sổ Variable Ty ... thống ứng với một giá trị mới. • System-or user-missing: giá trị khuyết của hệ thống hoặc giá trị khuyết do người sử dụng định nghĩa ứng với một giá trị mới. • Range: một khoảng giá trị cũ ứng với một giá trị mới. Ví dụ: mã hóa nhóm tuổi từ 17 đến 25: tại khung Old Value, kích chọn mục Range through và nhập vào giá trị 17; 25. Tại khung New Value, nhập 1 tại ô Value rồi kích chọn nút Add. Thực hiện tương tự cho 3 nhóm còn lại ta có kết quả như sau: 18/09/2013 61 Chương 3 - SPSS 18/09/2013 62 - Nhấn Continue để trở lại hộp thoại chính và chọn OK. Kết quả trong cửa sổ Variable View xuất hiện một biến mới có tên là tuoiMH như sau: Chương 3 - SPSS 18/09/2013 63 -Tiến hành sửa giá trị Decimals = 0 và khai báo thuộc tính Values cho biến tuoiMH như bên: - Mở cửa sổ Data View ta có giá trị của biến tuoiMH như sau: Chương 3 - SPSS 18/09/2013 64 - Cuối cùng lập bảng tần số của biến tuoiMH ta có kết quả như sau: Chương 3 - SPSS b) Chuyển một biến dạng Category thành dạng Dichotomy - Biến dạng Category là biến phân loại có thể có nhiều giá trị mã hóa tượng trưng cho nhiều trạng thái, biểu hiện khác nhau. Ví dụ các ngân hàng gồm có: Agribank, Techcombank, Vietcombank - Biến Dichotomy là biến phân loại chỉ có 2 giá trị mã hóa tượng trưng cho 2 trạng thái hay 2 biểu hiện khác nhau. Ví dụ: nam hay nữ, đồng ý hay không đồng ý có sử dụng dịch vụ của ngân hàng MB hay không sử dụng dịch vụ của ngân hàng MB... ⟹ Đối với các câu hỏi khảo sát dùng thang đo định danh có nhiều hơn 1 câu trả lời, có thể mã hóa và nhập liệu theo cả 2 kiểu biến này. Tuy nhiên kiểu Category dễ mã hóa và nhập liệu hơn, nhưng khi phân tích sâu hơn thì hay dùng kiểu Dichotomy. Do đó ta thường tạo khuôn và nhập liệu theo kiểu Category, sau đó khi cần phân tích sâu hơn thì chuyển sang dạng biến Dichotomy. 65 18/09/2013 3- Các phép xử lý dữ liệu căn bản Chương 3 - SPSS Ví dụ: Câu hỏi 2a về việc đã sử dụng các dịch vụ của ngân hàng nào, thông tin lựa chọn các ngân hàng được thể hiện trong 7 biến từ c2a1-c2a7. Muốn biết ngân hàng MB được lựa chọn như thế nào, ta tạo một biến Dichotomy với giá trị 1 tượng trưng cho việc có lựa chọn ngân hàng MB, giá trị 0 là không lựa chọn. Sau đó đếm tần số gặp số 1 ta sẽ biết được số người chọn ngân hàng MB. Các bước thực hiện như sau: Vào menu Transform - Count Values within Cases, xuất hiện hộp thoại sau: 18/09/2013 66 Chương 3 - SPSS 18/09/2013 12 - Khai báo tên biến Dichotomy muốn tạo tại ô Target Variable, ví dụ: sudungMB. - Khai báo nhãn biến Dichotomy tại ô Target Label, ví dụ: So nguoi su dung MB. - Đưa các biến: c2a1 đến c2a7 vào khung Numeric Variables. - Nhấn nút Define Values mở hộp thoại Count Values within Cases: Values to Count. - Nhập số 5 (là con số được mã hóa cho ngân hàng MB trong các biến từ c2a1 đến c2a7) vào ô Value sau đó bấm nút Add để đưa nó sang ô Values to Count. Ở bước này ta đã yêu cầu SPSS đếm tất cả các trường hợp quan sát dọc theo các biến từ c2a1 đến c2a7 để xem có gặp giá trị 5 không? Nếu gặp thì SPSS gán giá trị 1 cho biến sudungMB, nếu không thì gán giá trị 0. - Nhấn Continue để trở lại hộp thoại chính và chọn OK. Kết quả trong cửa sổ Variable View xuất hiện một biến mới có tên là sudungMB như hình sau: 18/09/2013 67 Chương 3 - SPSS 18/09/2013 68 - Ta sửa giá trị Decimals = 0 và khai báo thuộc tính Values cho biến sudungMB như sau: Chương 3 - SPSS - Mở cửa sổ Data View ta có giá trị của biến sudungMB như sau: 2/ Lập bảng tổng hợp nhiều biến a) Lập bảng tần số và tính toán các đại lượng thống kê mô tả cho biến định lượng Ví dụ: Lập bảng tần số và tính toán các đại lượng thống kê mô tả cho biến c3-Số người sử dụng dịch vụ ngân hàng trong gia đình. Các bước thực hiện như sau: - Vào menu Analyze-Descriptive Statistics-Frequencies xuất hiện hộp thoại Frequencies. Đưa biến c3 vào khung Variable(s) 69 18/09/2013 3- Các phép xử lý dữ liệu căn bản Chương 3 - SPSS Để thiết lập các đại lượng thống kê mô tả, kích chọn nút Statistics, xuất hiện hộp thoại Frequencies: Statistics Percentile Values: Tứ phân vị (Quartiles) chia các quan sát ra thành 4 nhóm có cùng số lượng quan sát. Nếu bạn muốn một số lượng các nhóm lớn hơn 4, hãy chọn Cut points for n equal groups. Bạn cũng có thể xác định các số phân vị riêng biệt tại Percentiles (ví dụ, phân vị thứ 95, là trị số mà nằm dưới nó là 95% số lượng quan sát rơi vào). 18/09/2013 70 Chương 3 - SPSS Central Tendency: Các thống kê mô tả trung tâm của một phân bố bao gồm trung bình, trung vị, mode và tổng cộng các giá trị trong tập dữ liệu quan sát. 18/09/2013 71 Chương 3 - SPSS Giá trị trung bình (Mean): Là giá trị trung bình số học của một biến Trung vị (Median): Là số nằm giữa (nếu lượng quan sát là lẻ) hoặc là giá trị trung bình của 2 quan sát nằm giữa (nếu số lượng quan sát là chẵn). Mode: Là giá trị có tần suất xuất hiện lớn nhất của một tập hợp các số đo. Sum: Tổng cộng các giá trị trong tập dữ liệu quan sát Độ lệch chuẩn (Standard deviation): Dùng để đo lường độ phân tán của dữ liệu xung quanh giá trị trung bình của nó. Phương sai (Variance): Dùng để đo lường mức độ phân tán của một tập các giá trị quan sát xung quanh giá trị trung bình của tập quan sát đó. Khoảng biến thiên (Range): Là khoảng cách giữa giá trị quan sát nhỏ nhất đến giá trị quan sát lớn nhất. Sai số trung bình mẫu (Standard Error of Mean): Được dùng để đo • Dispersion: Các thống kê đo đạc độ lớn của sự biến thiên hoặc sự trải rộng trong dữ liệu, gồm: độ lệch chuẩn, phương sai, khoảng biến thiên, giá trị nhỏ nhỏ, giá trị lớn nhất và sai số chuẩn. 18/09/2013 72 Chương 3 - SPSS của mẫu nghiên cứu này so với mẫu nghiên cứu khác. lường sự khác biệt về giá trị trung bình 18/09/2013 13 • Distribution: Skewness {Độ lệch} và Kurtosis {độ nhọn} là các thống kê mô tả hình dạng và độ cân xứng của một phân bố.Kích chọn các ô vuông để chọn các đại lượng thống kê cần tính (như hình trên) rồi nhấn nút Continue để trở lại hộp thoại Frequencies. 18/09/2013 73 Chương 3 - SPSS Skewness (Độ lệch): gọi là hệ số bất đối xứng, nó đánh giá sự phân phối các giá trị có cân đối đối với giá trị trung bình hay không, Kurtosis (độ nhọn): đánh giá đường mật độ phân phối của dãy số liệu có nhọn hơn hay tù hơn đường mật độ chuẩn tắc (dương là nhọn hơn, âm là tù hơn). Nếu trong khoảng [-2,2] thì có thể coi số liệu xấp xỉ chuẩn - Kích chọn các ô vuông để chọn các đại lượng thống kê cần tính (như hình trên) rồi nhấn nút Continue để trở lại hộp thoại Frequencies. -Tại hộp thoại Frequencies, kích chọn nút OK, ta có kết quả như sau: Theo kết quả ta thấy: giá trị trung vị (Median) của c3 là 3, có nghĩa là khi số liệu về số người sử dụng dịch vụ trong Ngân hàng được sắp xếp theo thứ tự tăng dần thì có 50% trường hợp nằm dưới giá trị 3 và 50% trường hợp nằm trên giá trị 3; và Mode = 3 tức là sử dụng dịch vụ trong Ngân hàng thường gặp nhất là 3. 18/09/2013 74 Chương 3 - SPSS 2/ Lập bảng tổng hợp nhiều biến b) Bảng kết hợp 2 biến định tính - Được sử dụng khi ta cần xem xét tần suất của các giá trị của một biến định tính theo mối quan hệ với một biến khác. Ví dụ: xác định số người trong độ tuổi từ 17 đến 25 có bao nhiêu nam, bao nhiêu nữ và chiếm bao nhiêu %? - Để lập bảng kết hợp 2 biến định tính ta có thể dùng lệnh Analyze-Descriptive Statistics-Crostabs, xuất hiện hộp thoại Crostabs. 75 18/09/2013 3- Các phép xử lý dữ liệu căn bản Chương 3 - SPSS - Đưa biến tuoiMH vào ô Rows để tạo nên các dòng của bảng. - Đưa biến gioitinh vào ô Columns để tạo nên các cột của bảng (cột thường là các biến có ít giá trị hơn). - Kích chọn nút Cells xuất hiện hộp thoại Crosstabs: Cell Display để xác định các đại lượng thống kê - Chọn Column để tính phần trăm theo cột (giới tính) và kích chọn Continue để trở về hộp thoại Crosstabs. -Trong hộp thoại Crosstabs, kích chọn nút OK ta có kết quả như sau: 18/09/2013 76 Chương 3 - SPSS Chú ý: nếu trong hộp thoại Crosstabs: Cell Display không chọn mục nào trong khung Pecentages thì kết quả như sau: 18/09/2013 77 c) Bảng kết hợp 3 biến định tính: Giả sử xác định mối quan hệ giữa Thu nhập cá nhân, trình độ học vấn và giới tính. - Vào Analyze-Descriptive Statistics-Crosstabs - Đưa các biến tncn vào ô Rows, biến hocvan vào ô Columns, biến gioitinh vào ô Layer 1 of 1. Chương 3 - SPSS - Kích chọn nút Cells trong hộp thoại Crosstabs: Cell Display chọn Column để tính tỷ lệ % theo trình độ học vấn. - Trong hộp thoại Crosstabs, kích chọn nút OK ta có kết quả như sau: 18/09/2013 78 Chương 3 - SPSS 18/09/2013 14 d) Bảng kết hợp 1 biến định tính và 1 biến định lượng: Giả sử xác định mối quan hệ giữa số người sử dụng dịch vụ ngân hàng trong gia đình theo từng thành phố - Vào Analyze-Descriptive Statistics- Explore xuất hiện hộp thoại Explore. + Đưa biến định lượng c3 vào ô Dependent List. + Đưa biến diachi vào ô Factor List. Kích chọn nút OK ta có kết quả như sau: 18/09/2013 79 Chương 3 - SPSS 18/09/2013 80 Kết quả ta có số lượng người sử dụng dịch vụ ngân hàng trung bình trong gia đình ở Hà Nội là 3.5, còn ở Thành phố HCM là 2.62. Chương 3 - SPSS 2/ Lập bảng tổng hợp nhiều biến e) Bảng kết hợp 2 biến định tính và 1 biến định lượng - Giả sử xác định mối quan hệ giữa số người sử dụng dịch vụ Ngân hàng tại từng thành phố, chi tiết theo từng nhóm thu nhập gia đình. - Vào Analyze - Compear Mean - Means xuất hiện hộp thoại Means. + Đưa biến định lượng c3 vào ô Dependent List. + Đưa biến diachi vào ô Layer 1 of 1. Nhấn nút Next, đưa biến tngd vào ô Layer 2 of 2. Kích chọn nút OK ta có kết quả như sau: 81 18/09/2013 3- Các phép xử lý dữ liệu căn bản Chương 3 - SPSS 18/09/2013 82 Kết quả ta có, tại Hà Nội nhóm thu nhập gia đình dưới 2 triệu có 1 quan sát và số lượng người sử dụng dịch vụ trung bình trong các hộ này là 1 người Chương 3 - SPSS 3/ Trình bày kết quả bằng đồ thị Kết quả được trình bầy dưới dạng đồ thị có ưu điểm là trực quan và dễ dàng so sánh. SPSS cung cấp các loại đồ thị cơ bản sau: Biểu đồ thanh (Bar): thường được dùng để biểu diễn dữ liệu dưới dạng tần số hay tần suất %. Biểu đồ hình tròn (Pie): thường được dùng biểu diễn dữ liệu định tính dạng tần số hay % có ít giá trị. Đồ thị đường gấp khúc (Line) và diện tích (Area): thường được áp dụng cho dữ liệu định lượng. Biểu đồ Histograms: biểu đồ phân phối tần số thường được áp dụng cho các biến có giá trị liên tục. 83 18/09/2013 3- Các phép xử lý dữ liệu căn bản Chương 3 - SPSS 3/ Trình bày kết quả bằng đồ thị: Biểu đồ thanh (Bar): thường được dùng để biểu diễn dữ liệu dưới dạng tần số hay tần suất %. Chương 3 - SPSS 84 C18/09/2013 Dùng để biểu diễn dữ liệu của 1 biến đơn (dạng đơn giản có các thanh riêng biệt). Dùng để biểu diễn dữ liệu của 1 biến theo mối quan hệ với biến khác (dạng từng nhóm thanh kề nhau). Dùng để biểu diễn dữ liệu như ở Clusterd nhưng các thanh trong nhóm nằm chồng lên nhau. Thể hiện một con số thống kê tổng hợp cho những nhóm trường hợp khác nhau. Thể hiện những con số thống kê tổng hợp cho những biến khác nhau trên cùng một đồ thị. Thể hiện giá trị thật của 1 biến trong từng tình huống cụ thể (không thể hiện những con số thống kê tổng hợp). 3- Các phép xử lý dữ liệu căn bản 18/09/2013 15 Biểu đồ thanh biểu diễn một biến đơn Ví dụ vẽ biểu đồ thanh biểu diễn dữ liệu của biến độ tuổi: - Vào Graphs-Legacy Dialogs Bar Trong hộp thoại Bar Charts chọn Simple và Summaries for groups of cases, kích chọn nút Define xuất hiện hộp thoại bên: - Khung Bars Represent cho phép chọn các thông tin hiển thị trên các thanh của biến muốn vẽ đồ thị, với Number of case: hiển thị tần số (số lượng), % of case: hiển thị tần suất (%). Ở đây ta chọn Number of case. - Đưa biến tuoiMH vào khung Category Axis. 18/09/2013 85 Chương 3 - SPSS - Nhấn nút Titles để nhập tên cho đồ thị (nếu muốn). Cuối cùng nhấn nút OK, ta có kết quả đồ thị như sau: 18/09/2013 86 Ta có trục hoành của đồ thị cho ta thông tin về các nhóm độ tuổi, độ cao của trục tung cho ta thông tin về số lượng người trong từng nhóm độ tuổi. Từ đồ thị ta thấy số lượng người trong nhóm tuổi từ 36 đến 45, từ 46 đến 60 xấp xỉ nhau và chiếm phần lớn, số lượng người nhóm từ 26 đến 35 là ít nhất. Chương 3 - SPSS Biểu đồ thanh kết hợp nhiều biến: Ví dụ vẽ biểu đồ Bar biểu diễn mối quan hệ giữa trình độ học vấn và thành phố. - Vào Graphs-Legacy- Dialogs-Bar trong hộp thoại Bar Charts chọn Clustered và Summaries for groups of cases rồi kích chọn nút Define. - Trong hộp thoại Define Clustered Bars: Summaries for Groups of Cases: đưa biến hocvan vào khung Category Axis, đưa biến Diachi vào khung Define Clusters by. Kích chọn OK, ta có kết quả đồ thị như sau: 18/09/2013 87 Chương 3 - SPSS 18/09/2013 88 Từ đồ thị ta thấy số lượng người có trình độ học vấn ở bậc đại học và sau đại học của thành phố Hà Nội cao hơn của thành phố Hồ Chí Minh. Chương 3 - SPSS 89 18/09/2013 6.4. Các kỹ thuật phân tích và xử lý dữ liệu căn bản Hiệu chỉnh đồ thị: nhấn đúp vào đồ thị để mở cửa sổ SPSS Chart Editor để hiêụ chỉnh Chương 2 - SPSS Chương 3 - SPSS 3/ Trình bày kết quả bằng đồ thị: Biểu đồ bánh (Pie): Biểu đồ bánh thể hiện thông tin về kết cấu rất tốt, nó giúp hình thành được cảm nhận về tổng thể và bộ phận của vấn để. Vì thế, có thể so sánh được các biểu hiện của các biến hay các biến với nhau hoặc các giá trị riêng biệt. Các số thống kê được sử dụng trong đồ thị Pie là tần số, tần suất và tổng cộng. SPSS cho phép chỉnh sửa màu sắc hoặc có thể tách riêng từng phần của đồ thị như sau: - Kích đúp chuột vào đồ thị để mở cửa sổ SPSS Chart Editor - Kích chuột vào miếng muốn tách khi đó đường viền của nó xuất hiện các chấm vuông - Vào Elements- Explode Slice kết quả miếng đã được chọn sẽ tự động tách riêng ra. 90 18/09/2013 3- Các phép xử lý dữ liệu căn bản Chương 3 - SPSS 18/09/2013 16 18/09/2013 91 Ví dụ: vẽ biểu đồ Pie minh họa trình độ học vấn. Chương 3 - SPSS 3/ Trình bày kết quả bằng đồ thị: Đồ thị dạng đƣờng (Line) và diện tích (Area) Đồ thị loại này có quan hệ rất gần với đồ thị Bar. Cả 3 dạng đồ thị đều thể hiện tần số, giá trị của dữ liệu và các số thống kê cho mỗi biểu hiện riêng biệt của một biến 92 18/09/2013 3- Các phép xử lý dữ liệu căn bản Chương 3 - SPSS CHƢƠNG I – CÁC VẤN ĐỀ CƠ BẢN CỦA TIN HỌC Phải trả lời các câu hỏi sau Ý nghĩa của phân tích dữ liệu? Phần mềm SPSS có ưu/nhược điểm gì? Phân biệt ý nghĩa của các cửa sổ: Data View, Data Editor và Variable View. Liệt kê các phép xử lý trên biến. Có mấy bảng tổng hợp nhiều biến? Nếu vận dụng Excel và SPSS để quản lý dữ liệu thì ta sẽ thực hiện được những yêu cầu nào? TỔNG KẾT CHƢƠNG III 18/09/2013 Chương 3 - SPSS 93 Kết thúc Chương III 18/09/2013 Chương 3 - SPSS 94
File đính kèm:
- bai_giang_tin_hoc_can_ban_chuong_3_spss.pdf