Bài giảng Tin học căn bản - Chương 3: SPSS
Phân tích dữ liệu là gì?
Phân tích dữ liệu là quy trình sử dụng các công cụ tính
toán điện tử và các phương pháp chuyên dụng để biến đổi
các dòng dữ liệu ban đầu thành các dòng thông tin kết quả.
Việc chắt lọc được các
thông tin hữu ích nhất từ
một kho các thông tin chính
là yêu cầu số một của quá
trình phân tích dữ liệu thông
tin kinh tế.
Quá trình tư duy thống kê dựa trên dữ liệu
1- Giới thiệu về phân tích dữ liệu và SPSS
Tại sao phải phân tích dữ liệu?
Dữ liệu chỉ là các số liệu thô và bản thân chúng không phải
là tri thức. Phân tích dữ liệu có vai trò quan trọng trong các hệ
thống quản lý kinh tế, nó giúp biến đổi dữ liệu trở thành những
thông tin thống kê làm cơ sở cho việc gia tăng sự hiểu biết, tri
thức từ đó đưa ra được các quyết định kịp thời, chính xác. Tất
cả mọi quyết định quản lý chỉ mang lại hiệu quả kinh tế cao khi
dựa trên cơ sở của một quy trình xử lý thông tin khoa học, bao
quát được các nguồn thông tin chiến lược và đón đầu được các
xu thế phát triển.
Tóm tắt nội dung tài liệu: Bài giảng Tin học căn bản - Chương 3: SPSS
18/09/2013
1
HỌC VIỆN NGÂN HÀNG
KHOA HỆ THỐNG THÔNG TIN KINH TẾ
Chƣơng 3 - SPSS
(Statistical Products for the Social Sevices)
Bài giảng của Khoa Hệ thống thông tin Quản lý
Nội dung
Giới thiệu về phân tích dữ liệu và SPSS 1
Dữ liệu trong SPSS 2
Các phép xử lý dữ liệu căn bản 3
18/09/2013 Chương 3 - SPSS
2
1- Giới thiệu về phân tích dữ liệu với SPSS
Chương 3 - SPSS 3 18/09/2013
1/ Dữ liệu là gì?
2/ Phân loại dữ liệu
3/ Phân tích dữ liệu là gì?
4/ Các bƣớc cơ bản trong nghiên cứu, phân
tích dữ liệu
5/ SPSS?
6/ Khởi động SPSS
7/ Màn hình giao diện SPSS
1- Giới thiệu về phân tích dữ liệu và SPSS
Chương 3 - SPSS 4 18/09/2013
1/ Dữ liệu là gì?
Dữ liệu là các số liệu hoặc tài liệu cho trước chưa qua xử lý.
2/ Phân loại dữ liệu: 2 loại
⟹ Phân loại dữ liệu định tính và định lượng nhằm xác định
các phép toán thống kê hợp lý.
Dữ liệu định tính Dữ liệu định lượng
Thể hiện dưới dạng từ ngữ.
Mang tính chủ quan như ý
kiến, kinh nghiệm, cảm giác
Ví dụ: các dịch vụ ngân hàng
bạn thường dùng: Gửi tiền, vay
tiền, chuyển khoản, thanh toán
nội địa
Thể hiện dưới dạng số học.
Mang tính khách quan.
Ví dụ: Lãi suất gửi tiền của
các kỳ hạn
1- Giới thiệu về phân tích dữ liệu và SPSS
5 18/09/2013
3/ Phân tích dữ liệu là gì?
Phân tích dữ liệu là quy trình sử dụng các công cụ tính
toán điện tử và các phương pháp chuyên dụng để biến đổi
các dòng dữ liệu ban đầu thành các dòng thông tin kết quả.
Việc chắt lọc được các
thông tin hữu ích nhất từ
một kho các thông tin chính
là yêu cầu số một của quá
trình phân tích dữ liệu thông
tin kinh tế.
Quá trình tư duy thống kê dựa trên dữ liệu
Chương 3 - SPSS
1- Giới thiệu về phân tích dữ liệu và SPSS
6 18/09/2013
Tại sao phải phân tích dữ liệu?
Dữ liệu chỉ là các số liệu thô và bản thân chúng không phải
là tri thức. Phân tích dữ liệu có vai trò quan trọng trong các hệ
thống quản lý kinh tế, nó giúp biến đổi dữ liệu trở thành những
thông tin thống kê làm cơ sở cho việc gia tăng sự hiểu biết, tri
thức từ đó đưa ra được các quyết định kịp thời, chính xác. Tất
cả mọi quyết định quản lý chỉ mang lại hiệu quả kinh tế cao khi
dựa trên cơ sở của một quy trình xử lý thông tin khoa học, bao
quát được các nguồn thông tin chiến lược và đón đầu được các
xu thế phát triển.
Chương 3 - SPSS
18/09/2013
2
1- Giới thiệu về phân tích dữ liệu và SPSS
7 18/09/2013
4/ Các bƣớc cơ bản trong nghiên cứu, phân tích dữ liệu:
a) Xác định vấn đề nghiên cứu: cần xác định rõ ràng, chính
xác vấn đề cần nghiên cứu giúp thu thập dữ liệu tiến hành
nhanh gọn, chính xác.
b) Thu thập dữ liệu:
• Thiết kế các cách thức thu thập dữ liệu là công việc quan
trọng đối với phân tích thống kê.
• Hai khía cạnh quan trọng của nghiên cứu thống kê là: tổng
thể (tập hợp các phần tử) và mẫu (một tập hợp con của tổng
thể).
• Dữ liệu có thể được thu thập từ những nguồn có sẵn hay
qua quan sát, nghiên cứu, thử nghiệm.
Chương 3 - SPSS
1- Giới thiệu về phân tích dữ liệu và SPSS
8 18/09/2013
c) Xử lý dữ liệu: qua 3 bước
• Mã hoá: trừ một số dữ liệu định lượng thì không cần mã
hoá, còn các dữ liệu định tính cần được mã hóa để chuyển
về dạng số.
• Nhập liệu: Dữ liệu được nhập và lưu trữ bởi ít nhất hai
người nhập liệu độc lập khác nhau. Thông thường trong thực
tế nhập dữ liệu từ bảng câu hỏi vào máy tính là nhập hai lần.
• Hiệu chỉnh: Dữ liệu được kiểm tra bằng cách so sánh hai
tập hợp dữ liệu được nhập độc lập với nhau và phát hiện sai
lệch giữa hai lần nhập. Kiểm tra bằng cách nhập lần hai bảo
đảm mức độ chính xác lên đến 99,8%.
Chương 3 - SPSS
1- Giới thiệu về phân tích dữ liệu và SPSS
9 18/09/2013
d) Phân tích dữ liệu: Các phương pháp phân tích dữ liệu
được chia thành hai loại:
• Các phương pháp thăm dò: dùng để khám phá ý nghĩa
của dữ liệu bằng các phép tính số học đơn giản và các biểu
đồ đơn giản tóm tắt dữ liệu.
• Các phương pháp khẳng định: dùng các ý tưởng trong lý
thuyết xác suất để trả lời các vấn đề nghiên cứu cụ thể
e) Báo cáo kết quả: thông qua suy diễn, từ dữ liệu mẫu thu
thập được ước lượng, kiểm định và các mô hình phân tích
khác sẽ giúp khẳng định các đặc tính của tổng thể. Các kết quả
có thể được báo cáo dưới dạng bảng, đồ thị hay các số phần
trăm.
Chương 3 - SPSS
1- Giới thiệu về phân tích dữ liệu và SPSS
10 18/09/2013
5/ SPSS là gì?
∎ SPSS (Statistical Products for the Social Sevices) là một
phần mềm chuyên dụng cho thống kê kinh tế xã hội và kinh tế
lượng được thiết kế để thực hiện tất cả các bước trong phân
tích thống kê, từ việc liệt kê dữ liệu, lập bảng biểu và thống kê
mô tả cho đến các phân tích thống kê phức tạp mà không cần
phải lập trình như các phần mềm khác.
∎ SPSS có thể tạo ra các bảng tính tần suất của tất cả các
biến trong cơ sở dữ liệu, hoặc cho phép tạo ra các bảng tương
quan giữa các biến. Ví dụ: cơ sở dữ liệu của một cơ quan có
thể lập các bảng tổng hợp như: mức lương phân theo chức vụ,
mức lương phân theo trình độ học vấn, hệ số phụ cấp phân
theo số năm công tác
∎ SPSS ra đời từ 1960, đến nay đã xuất hiện phiên bản 19.
Chương 3 - SPSS
1- Giới thiệu về phân tích dữ liệu và SPSS
11 18/09/2013
6/ Khởi động SPSS:
Chọn Start – All Programs – SPSS 16.0 - SPSS 16.0
Chạy chương trình Tutorial
Mở 1 tệp trống .sav cho phép
người dùng nhập dữ liệu mới
Chạy một câu truy vấn dữ liệu có
sẵn với phần mở rộng là .spq
Cho phép tạo mới câu truy vấn dữ
liệu với phần mở rộng .spq
Mở 1 tệp dữ liệu đã có sẵn với các định
dạng của: SPSS, Excel, Lotus, DBASE
Mở 1 tệp dữ liệu với các định dạng khác
Chương 3 - SPSS
1- Giới thiệu về phân tích dữ liệu và SPSS
12 18/09/2013
7/ Giao diện của SPSS
Sau khi khởi động SPSS sẽ xuất hiện cửa sổ SPSS Data
Editor với giao diện
như một bảng tính
cho phép người
dùng định nghĩa,
nhập, hiệu đính
và thể hiện dữ liệu.
Thanh tiêu đề (Title bar)
Thanh thực đơn (Menu bar) Thanh công cụ (Tool bar)
Thanh cuộn
Thanh trạng thái (Status bar)
Cột: Mỗi cột chứa một biến dữ liệu cụ thể
Dòng: Mỗi dòng trong bảng chứa các dữ
liệu của đối tượng được quan sát
Màn hình để nhập và thể
hiện dữ liệu đã nhập
Màn hình để khai báo
biến (tên, loại, độ rộng,
loại thang đocủa biến)
Chương 3 - SPSS
18/09/2013
3
1- Giới thiệu về phân tích dữ liệu và SPSS
13 18/09/2013
Tìm hiểu thanh thực đơn Menu:
File: Khởi tạo, đóng mở file, lưu file, in ấn, thoát
Edit: Undo, sao chép, cắt dán, tìm kiếm thay thế, chèn biến, chèn giá trị
View: Cho hiện dòng trạng thái, thanh công cụ, chọn font chữ, cho hiện
giá trị nhập vào hay nhãn của các giá trị nhập
Data: Định nghĩa biến, thêm biến, ghép file, chia file, chọn quan sát
Transform: Tính toán, mã hoá lại các biến
Analyze: Thực hiện thống kê: tóm tắt dữ liệu, so sánh trung bình, phương
sai, tương quan và hồi quy, phân tích đa biến
Utilities: Tìm hiểu thông tin về các biến, file
Graphs: Tạo các biểu đồ và đồ thị.
Window: Sắp xếp và di chuyển các cửa sổ làm việc trong SPSS
Chương 3 - SPSS
1- Giới thiệu về phân tích dữ liệu và SPSS
14 18/09/2013
Sử dụng tiếng Việt trong SPSS: từ cửa sổ Data chọn View
– chọn Font rồi chọn kiểu font.
Chương 3 - SPSS
2- Dữ liệu trong SPSS
15 18/09/2013
1/ Thu thập dữ liệu
2/ Nhập dữ liệu
3/ Làm sạch dữ liệu
Chương 3 - SPSS 16 18/09/2013
1/ Thu thập dữ liệu
Việc thu thập dữ liệu là từ các phiếu trả lời của các bảng hỏi.
Ví dụ một bảng hỏi được xây dựng theo cách thức sau:
BẢNG CÂU HỎI PHỎNG VẤN
Số phiếu:
Đề tài nghiên cứu: “Thăm dò về thói quen sử dụng các dịch vụ của ngân hàng”
Mục đích: Tìm hiểu một phần về vai trò của ngân hàng trong đời sống của người
dân cũng như giúp cho các ngân hàng hiểu rõ hơn các ý kiến và nhu cầu sử dụng
các dịch vụ ngân hàng của khách hàng, trên cơ sở đó đưa ra được các dịch vụ và
chính sách hiệu quả, hợp lý.
Xin vui lòng khoanh tròn các phương án mà anh/chị/ông/bà thấy phù hợp với mình.
A- CÁC DỊCH VỤ NGÂN HÀNG
1. Anh/chị/ông/bà có thường xuyên sử dụng các dịch vụ của ngân hàng không?
(chọn 1 trả lời)
Chương 3 - SPSS
Hầu như không 1
Thỉnh thoảng 2
Thường xuyên 3
Rất thường xuyên 4
2- Dữ liệu trong SPSS
2- Dữ liệu trong SPSS
17 18/09/2013
2a. Anh/chị/ông/bà đã sử dụng dịch vụ của ngân hàng nào? (có thể chọn
nhiều trả lời)
2b. Các thành viên gia đình anh/chị/
ông/bà đã sử dụng dịch vụ của ngân
hàng nào? (có thể chọn nhiều trả lời)
3. Trong gia đình anh/chị/ông/bà, số lượng người đã sử dụng các dịch vụ
của ngân hàng là bao nhiêu? Ghi
một con số cụ thể: ___ người.
4. Anh/chị/ông/bà thường sử dụng
các dịch vụ nào của ngân hàng?
(có thể chọn nhiều trả lời)
Chương 3 - SPSS
2a 2b
Agribank 1 1
Techcombank 2 2
Vietcombank 3 3
ACB 4 4
MB bank 5 5
VP bank 6 6
Khác 7 7
Gửi tiền 1
Vay tiền 2
Chuyển khoản 3
Thanh toán 4
Trả lương 5
Khác 6
2- Dữ liệu trong SPSS
18 18/09/2013
5. Khi có một khoản tiền nhàn rỗi anh/chị/
ông/bà thường làm gì? (chọn tối đa 2 trả lời)
6. Anh/chị/ông/bà thường
sử dụng kỳ hạn lãi suất
nào khi sử dụng dịch
vụ vay, gửi tiền?
(chọn tối đa 3 trả lời)
7. Hãy xếp hạng các chủ đề sau đây tùy theo mức độ quan tâm của
anh/chị/ông/bà đối với từng loại chủ đề: chủ đề nào quan tâm nhất thì ghi số
1, quan tâm nhì thì ghi số 2, quan tâm ba thì ghi số 3.
Lãi suất: _____
Thái độ phục vụ: _____
Uy tín: _____
Chương 3 - SPSS
Gửi tiết kiệm 1
Mua vàng 2
Mua sắm 3
Đầu tư 4
Khác 5
1 tháng 1
3 tháng 2
6 tháng 3
9 tháng 4
1 năm 5
Khác 6
18/09/2013
4
2- Dữ liệu trong SPSS
19 18/09/2013
8. Anh/chị/ông/bà đánh giá các mặt sau đây của các ngân hàng như thế nào?
Chương 3 - SPSS
Rất
không
hài
lòng
Không
hài
lòng
Bình
thường
Hài
lòng
Rất
hài
lòng
Không
ý kiến
1. Tính đa dạng của dịch vụ 1 2 3 4 5 8
2. Tính tin cậy của các dịch vụ 1 2 3 4 5 8
3. Tính hiệu quả của các dịch vụ 1 2 3 4 5 8
4. Tính tiện ích của các dịch vụ 1 2 3 4 5 8
5. Tính mới, đột phá 1 2 3 4 5 8
2- Dữ liệu trong SPSS
20 18/09/2013
B- THÔNG TIN CÁ NHÂN
Họ tên: __________________________ Điện thoại: ____________
Địa chỉ: _________________________________________________
Tuổi: ____________ Số người trong hộ gia đình: _____________
Giới tính: 1. Nam 2. Nữ
Thu nhập cá nhân(TB tháng):
1. Không 2. Dưới 1 tr 3. 1-2 tr 4. 2-4 tr 5. Trên 4 tr
Thu nhập gia đình (TB tháng):
1. Dưới 2 tr 2. 2-4 tr 3. 4-6 tr 4. Trên 6 tr
Học vấn:
1. Phổ thông 2. CĐ 3. ĐH 4. Sau ĐH
Nghề nghiệp:
1. Công chức 2. Giáo viên 3. Nhân viên văn phòng
4. Nhân viên KD 5. Tự KD 6. SV – HS
7. LĐ đơn giản 8. Về hưu 9. Không làm việc
10. Nghề chuyên môn (Bác sĩ, kiến trúc sư, kế toán, nhạc sĩ)
Chương 3 - SPSS
2- Dữ liệu trong SPSS
21 18/09/2013
2/ Nhập dữ liệu:
Sau khi lấy ý kiến của người dân thông qua bảng câu hỏi phỏng vấn
trên, ta tiến hành nhập dữ liệu thu thập được từ các phương án trả
lời của các bảng câu hỏi vào phần mềm SPSS, ta thực hiện theo 2
bước sau:
Bƣớc 1: Mã hoá và tạo khuôn nhập dữ liệu theo 4 quy tắc sau:
Các thông tin thu thập không phải dưới dạng số phải mã hoá để
chuyển thành dạng số.
VD: Giới tính được mã hóa: 1. Nam; 2. Nữ
Các thông tin thu thập đã ở dạng số không cần mã hoá. VD: Tuổi
Các câu hỏi chỉ có một trả lời thì chỉ cần tạo một biến để lưu trữ
câu trả lời.
VD: Anh/chị/ông/bà có thường xuyên sử dụng các dịch vụ của
ngân hàng không? (chọn 1 trả lời) ⟹ chỉ cần tạo 1 biến
Chương 3 - SPSS
2- Dữ liệu trong SPSS
22 18/09/2013
Các câu hỏi có thể chọn nhiều trả lời thì cần phải tạo nhiều biến để
lưu trữ các phương án trả lời tương ứng. VD: Anh/chị/ông/bà thường
sử dụng các dịch vụ nào của ngân hàng? (có thể chọn nhiều trả lời)
⟹ cần tạo 6 biến
Bƣớc 2: Nhập dữ liệu: dữ liệu có thể được nhập theo 3 cách sau:
Cách 1: Nhập trực tiếp trong cửa sổ Data Editor.
Cách 2: Lấy từ các file dữ liệu có các định dạng khác nhau từ:
- Các bảng tính worksheet được lập trong Excel hoặc Lotus.
- Cơ sở dữ liệu được lập dưới định dạng DBASE và SQL.
- Các file dạng text ASCII với kiểu Tab-deliminated
Cách 3: Dùng phần mềm tạo form nhập liệu.
Chương 3 - SPSS
18/09/2013 23
Tổ chức sắp xếp dữ liệu và nhập liệu trong SPSS như sau:
Mỗi đối tượng trả lời (quan sát) tương ứng với một dòng (1
case). Thông tin của mỗi đối tượng được nhập vào một dòng
của cửa sổ Data View
Mỗi loại thông tin thu thập được sắp xếp tương ứng với một
cột (1 variable)
Nhập liệu từ trái qua phải trên cửa số Data View theo từng
dòng). Xong một phiếu (một dòng) thì chuyển sang phiếu khác
(sang dòng mới).
Cách 1: Nhập trực tiếp dữ liệu trong cửa sổ Data Editor
Chương 3 - SPSS 18/09/2013 24
Định nghĩa các biến cần dùng trong bảng Variable View
Biến là đại lượng đại diện cho các câu hỏi trong bảng hỏi
hoặc các vấn đề cần quan sát.
VD: Dịch vụ ngân hàng, Giới tính, Tuổi là các biến.
Bảng Variable View chứa đựng các thông tin về các thuộc
tính của từng biến trong file dữ liệu. Trong một bảng Variable
View ta có: các hàng là danh sách các biến; các cột là các
thuộc tính của từng biến. Số lượng biến cần định nghĩa bằng
tổng số phương án trả lời của từng câu hỏi trong bảng phỏng
vấn. Các câu hỏi có tối đa bao nhiêu câu trả lời thì cần phải tạo
bấy nhiêu biến để lưu trữ các phương án trả lời tương ứng.
Ví dụ trong bảng câu hỏi phỏng vấn trên: câu 1 cần tạo 1
biến, câu 2a cần tạo 7 biến, câu 5 cần tạo 2 biến.
Chương 3 - SPSS
18/09/2013
5
18/09/2013 25
Với mỗi một biến ta xác định các thuộc tính sau:
Tên biến {Name}
Kiểu dữ liệu {Type}
Số các chữ số của biến {Width} ⟹ Xđ độ rộng cột chứa biến
Số lượng chữ số thập phân {Decimals}
Mô tả nhãn hiển thị của biến {Label}
Xác định nhãn giá trị của biến {Values}
Mô tả giá trị khuyết thiếu {Missing}
Căn lề hiển thị giá trị của biến trong cửa sổ Data View {Align}
Xác định thang đo của biến {Measure}
Chương 3 - SPSS
18/09/2013 26
a) Tên biến (Name): Tên biến là một chuỗi có độ dài 8 ký tự,
không bắt đầu bằng một chữ số, không kết thúc bằng dấu chấm,
không chứa khoảng trắng và các ký tự đặc biệt như: !, ?, „,* .
Thông thường tên biến được đặt tương ứng với thứ tự của câu
hỏi mà biến đó mô tả, ví dụ với câu hỏi 1 thì đặt tên biến là c1.
- Cách tạo tên biến: gõ trực tiếp giá trị của tên biến tại cột Name.
Với những câu hỏi có nhiều phương án trả lời thì phải tạo nhiều
biến lưu trữ.
Chương 3 - SPSS
18/09/2013 27
Chú ý: ta có thể Copy các thuộc tính đã định nghĩa ở 1
biến cho các biến khác.
Bước 1: Trong cửa sổ Variable View lựa chọn ô, các ô
hay một dòng các thuộc tính đã được định nghĩa muốn áp
dụng cho các biến khác. Từ thanh menu Edit chọn Copy
hoặc kích chuột phải chọn Copy.
Bước 2: Chọn ô, các ô/dòng muốn áp dụng các thuộc
tính. Từ thanh menu Edit chọn Paste hoặc kích chuột phải
chọn Paste.
Chương 3 - SPSS
b) Kiểu dữ liệu (Type): Mặc định một biến mới tạo sẽ có kiểu
dữ liệu số Numeric,
ta có thể thay đổi
sang các kiểu dữ
liệu khác trong hộp
thoại Variable Type.
Cách thiết lập
Kiểu dữ liệu: chọn
trực tiếp trong cửa
sổ Variable Ty ... thống ứng với một giá
trị mới.
• System-or user-missing: giá trị khuyết của hệ thống hoặc
giá trị khuyết do người sử dụng định nghĩa ứng với một giá trị
mới.
• Range: một khoảng giá trị cũ ứng với một giá trị mới.
Ví dụ: mã hóa nhóm tuổi từ 17 đến 25: tại khung Old Value,
kích chọn mục Range through và nhập vào giá trị 17; 25.
Tại khung New Value, nhập 1 tại ô Value rồi kích chọn nút Add.
Thực hiện tương tự cho 3 nhóm còn lại ta có kết quả như sau:
18/09/2013 61 Chương 3 - SPSS 18/09/2013 62
- Nhấn Continue để
trở lại hộp thoại chính
và chọn OK. Kết quả
trong cửa sổ Variable
View xuất hiện một
biến mới có tên là
tuoiMH như sau:
Chương 3 - SPSS
18/09/2013 63
-Tiến hành sửa giá trị Decimals = 0 và khai báo thuộc tính
Values cho biến tuoiMH
như bên:
- Mở cửa sổ Data View
ta có giá trị của biến
tuoiMH như sau:
Chương 3 - SPSS 18/09/2013 64
- Cuối cùng lập bảng tần số của biến tuoiMH ta có kết quả như
sau:
Chương 3 - SPSS
b) Chuyển một biến dạng Category thành dạng Dichotomy
- Biến dạng Category là biến phân loại có thể có nhiều giá trị mã
hóa tượng trưng cho nhiều trạng thái, biểu hiện khác nhau. Ví dụ các
ngân hàng gồm có: Agribank, Techcombank, Vietcombank
- Biến Dichotomy là biến phân loại chỉ có 2 giá trị mã hóa tượng
trưng cho 2 trạng thái hay 2 biểu hiện khác nhau. Ví dụ: nam hay nữ,
đồng ý hay không đồng ý có sử dụng dịch vụ của ngân hàng MB hay
không sử dụng dịch vụ của ngân hàng MB...
⟹ Đối với các câu hỏi khảo sát dùng thang đo định danh có nhiều
hơn 1 câu trả lời, có thể mã hóa và nhập liệu theo cả 2 kiểu biến này.
Tuy nhiên kiểu Category dễ mã hóa và nhập liệu hơn, nhưng khi
phân tích sâu hơn thì hay dùng kiểu Dichotomy. Do đó ta thường tạo
khuôn và nhập liệu theo kiểu Category, sau đó khi cần phân tích sâu
hơn thì chuyển sang dạng biến Dichotomy.
65 18/09/2013
3- Các phép xử lý dữ liệu căn bản
Chương 3 - SPSS
Ví dụ: Câu hỏi 2a về việc đã sử dụng các dịch vụ của ngân
hàng nào, thông tin lựa chọn các ngân hàng được thể hiện
trong 7 biến từ c2a1-c2a7. Muốn biết ngân hàng MB được lựa
chọn như thế nào, ta tạo một biến Dichotomy với giá trị 1
tượng trưng cho việc có lựa chọn ngân hàng MB, giá trị 0 là
không lựa chọn. Sau đó đếm tần số gặp số 1 ta sẽ biết được
số người chọn ngân hàng MB.
Các bước thực hiện như sau:
Vào menu Transform - Count Values within Cases, xuất
hiện hộp thoại sau:
18/09/2013 66 Chương 3 - SPSS
18/09/2013
12
- Khai báo tên biến Dichotomy muốn tạo tại ô Target Variable,
ví dụ: sudungMB.
- Khai báo nhãn biến Dichotomy tại ô Target Label, ví dụ: So
nguoi su dung MB.
- Đưa các biến: c2a1 đến c2a7 vào khung Numeric Variables.
- Nhấn nút Define Values mở hộp thoại Count Values within
Cases: Values to Count.
- Nhập số 5 (là con số được mã hóa cho ngân hàng MB trong
các biến từ c2a1 đến c2a7) vào ô Value sau đó bấm nút Add
để đưa nó sang ô Values to Count. Ở bước này ta đã yêu cầu
SPSS đếm tất cả các trường hợp quan sát dọc theo các biến
từ c2a1 đến c2a7 để xem có gặp giá trị 5 không? Nếu gặp thì
SPSS gán giá trị 1 cho biến sudungMB, nếu không thì gán giá
trị 0.
- Nhấn Continue để trở lại hộp thoại chính và chọn OK. Kết
quả trong cửa sổ Variable View xuất hiện một biến mới có tên
là sudungMB như hình sau:
18/09/2013 67 Chương 3 - SPSS 18/09/2013 68
- Ta sửa giá trị
Decimals = 0 và
khai báo thuộc tính
Values cho biến
sudungMB như sau:
Chương 3 - SPSS
- Mở cửa sổ Data View ta có giá
trị của biến sudungMB như sau:
2/ Lập bảng tổng hợp nhiều biến
a) Lập bảng tần số và tính toán các đại lượng thống kê mô tả
cho biến định lượng
Ví dụ: Lập bảng tần số và tính toán các đại lượng thống kê mô
tả cho biến c3-Số người sử dụng dịch vụ ngân hàng trong gia
đình. Các bước thực hiện như sau:
- Vào menu Analyze-Descriptive Statistics-Frequencies
xuất hiện hộp thoại Frequencies. Đưa biến c3 vào khung
Variable(s)
69 18/09/2013
3- Các phép xử lý dữ liệu căn bản
Chương 3 - SPSS
Để thiết lập các đại lượng thống kê mô tả, kích chọn nút
Statistics, xuất hiện hộp thoại Frequencies: Statistics
Percentile Values: Tứ phân
vị (Quartiles) chia các quan sát
ra thành 4 nhóm có cùng số
lượng quan sát. Nếu bạn muốn
một số lượng các nhóm lớn
hơn 4, hãy chọn Cut points for
n equal groups. Bạn cũng có thể
xác định các số phân vị riêng
biệt tại Percentiles (ví dụ, phân
vị thứ 95, là trị số mà nằm dưới nó là 95% số lượng quan sát
rơi vào).
18/09/2013 70 Chương 3 - SPSS
Central Tendency: Các thống kê mô tả trung tâm của một
phân bố bao gồm trung bình, trung vị, mode và tổng cộng các
giá trị trong tập dữ liệu quan sát.
18/09/2013 71 Chương 3 - SPSS
Giá trị trung bình (Mean):
Là giá trị trung bình số học của
một biến
Trung vị (Median): Là số
nằm giữa (nếu lượng quan sát là
lẻ) hoặc là giá trị trung bình của
2 quan sát nằm giữa (nếu số
lượng quan sát là chẵn).
Mode: Là giá trị có tần suất
xuất hiện lớn nhất của một tập
hợp các số đo.
Sum: Tổng cộng các giá trị
trong tập dữ liệu quan sát
Độ lệch chuẩn (Standard
deviation): Dùng để đo lường độ
phân tán của dữ liệu xung quanh giá
trị trung bình của nó.
Phương sai (Variance): Dùng để
đo lường mức độ phân tán của một
tập các giá trị quan sát xung quanh
giá trị trung bình của tập quan sát đó.
Khoảng biến thiên (Range): Là
khoảng cách giữa giá trị quan sát nhỏ
nhất đến giá trị quan sát lớn nhất.
Sai số trung bình mẫu (Standard
Error of Mean): Được dùng để đo
• Dispersion: Các thống kê đo đạc độ lớn của sự biến thiên
hoặc sự trải rộng trong dữ liệu, gồm: độ lệch chuẩn, phương
sai, khoảng biến thiên, giá trị nhỏ nhỏ, giá trị lớn nhất và sai số
chuẩn.
18/09/2013 72 Chương 3 - SPSS
của mẫu nghiên cứu này so với mẫu nghiên cứu khác.
lường sự khác biệt về giá trị trung bình
18/09/2013
13
• Distribution: Skewness {Độ lệch} và Kurtosis {độ nhọn}
là các thống kê mô tả hình dạng và độ cân xứng của một phân
bố.Kích chọn các ô vuông để chọn các đại lượng thống kê cần
tính (như hình trên) rồi nhấn nút Continue để trở lại hộp thoại
Frequencies.
18/09/2013 73 Chương 3 - SPSS
Skewness (Độ lệch): gọi là hệ
số bất đối xứng, nó đánh giá sự
phân phối các giá trị có cân đối
đối với giá trị trung bình hay
không,
Kurtosis (độ nhọn): đánh giá
đường mật độ phân phối của dãy
số liệu có nhọn hơn hay tù hơn
đường mật độ chuẩn tắc (dương
là nhọn hơn, âm là tù hơn). Nếu
trong khoảng [-2,2] thì có thể coi số liệu xấp xỉ chuẩn
- Kích chọn các ô vuông để chọn các đại lượng thống kê cần
tính (như hình trên) rồi nhấn nút Continue để trở lại hộp thoại
Frequencies.
-Tại hộp thoại Frequencies, kích chọn nút OK, ta có kết quả
như sau:
Theo kết quả ta thấy: giá trị
trung vị (Median) của c3 là 3,
có nghĩa là khi số liệu về số
người sử dụng dịch vụ trong
Ngân hàng được sắp xếp theo
thứ tự tăng dần thì có 50%
trường hợp nằm dưới giá trị 3
và 50% trường hợp nằm
trên giá trị 3; và Mode = 3
tức là sử dụng dịch vụ trong
Ngân hàng thường gặp
nhất là 3.
18/09/2013 74 Chương 3 - SPSS
2/ Lập bảng tổng hợp nhiều biến
b) Bảng kết hợp 2 biến định tính
- Được sử dụng khi ta cần xem xét tần suất của các giá trị
của một biến định tính theo mối quan hệ với một biến khác.
Ví dụ: xác định số người trong độ tuổi từ 17 đến 25 có bao
nhiêu nam, bao nhiêu nữ và chiếm bao nhiêu %?
- Để lập bảng kết
hợp 2 biến định tính
ta có thể dùng lệnh
Analyze-Descriptive
Statistics-Crostabs,
xuất hiện hộp thoại
Crostabs.
75 18/09/2013
3- Các phép xử lý dữ liệu căn bản
Chương 3 - SPSS
- Đưa biến tuoiMH vào ô Rows để tạo nên các dòng của bảng.
- Đưa biến gioitinh vào ô Columns để tạo nên các cột của bảng (cột
thường là các biến có ít giá trị hơn).
- Kích chọn nút Cells xuất hiện hộp thoại Crosstabs: Cell Display
để xác định các đại lượng thống kê
- Chọn Column để tính phần trăm theo
cột (giới tính) và kích chọn Continue để
trở về hộp thoại Crosstabs.
-Trong hộp thoại Crosstabs, kích chọn
nút OK ta có kết quả như sau:
18/09/2013 76 Chương 3 - SPSS
Chú ý: nếu trong hộp thoại
Crosstabs: Cell Display
không chọn mục nào
trong khung Pecentages
thì kết quả như sau:
18/09/2013 77
c) Bảng kết hợp 3 biến định tính:
Giả sử xác định mối quan
hệ giữa Thu nhập cá nhân,
trình độ học vấn và giới tính.
- Vào Analyze-Descriptive
Statistics-Crosstabs
- Đưa các biến tncn vào
ô Rows, biến hocvan vào ô
Columns, biến gioitinh vào ô
Layer 1 of 1.
Chương 3 - SPSS
- Kích chọn nút Cells trong hộp thoại Crosstabs: Cell Display
chọn Column để tính tỷ lệ % theo trình độ học vấn.
- Trong hộp thoại Crosstabs, kích chọn nút OK ta có kết quả
như sau:
18/09/2013 78 Chương 3 - SPSS
18/09/2013
14
d) Bảng kết hợp 1 biến định tính và 1 biến định lượng:
Giả sử xác định mối quan hệ giữa số người sử dụng dịch vụ
ngân hàng trong gia đình theo từng thành phố
- Vào Analyze-Descriptive Statistics- Explore xuất hiện
hộp thoại Explore.
+ Đưa biến định
lượng c3 vào ô
Dependent List.
+ Đưa biến diachi
vào ô Factor List.
Kích chọn nút
OK ta có kết quả
như sau:
18/09/2013 79 Chương 3 - SPSS 18/09/2013 80
Kết quả ta có
số lượng người
sử dụng dịch vụ
ngân hàng
trung bình trong
gia đình ở Hà
Nội là 3.5, còn
ở Thành phố
HCM là 2.62.
Chương 3 - SPSS
2/ Lập bảng tổng hợp nhiều biến
e) Bảng kết hợp 2 biến định tính và 1 biến định lượng
- Giả sử xác định mối quan hệ giữa số người sử dụng dịch
vụ Ngân hàng tại từng thành phố, chi tiết theo từng nhóm thu
nhập gia đình.
- Vào Analyze - Compear Mean - Means xuất hiện hộp
thoại Means.
+ Đưa biến định
lượng c3 vào ô
Dependent List.
+ Đưa biến diachi
vào ô Layer 1 of 1.
Nhấn nút Next,
đưa biến tngd
vào ô Layer 2 of 2. Kích chọn nút OK ta có kết quả như sau:
81 18/09/2013
3- Các phép xử lý dữ liệu căn bản
Chương 3 - SPSS 18/09/2013 82
Kết quả ta có, tại Hà
Nội nhóm thu nhập
gia đình dưới 2 triệu
có 1 quan sát và số
lượng người sử
dụng dịch vụ trung
bình trong các hộ
này là 1 người
Chương 3 - SPSS
3/ Trình bày kết quả bằng đồ thị
Kết quả được trình bầy dưới dạng đồ thị có ưu điểm là trực
quan và dễ dàng so sánh. SPSS cung cấp các loại đồ thị cơ
bản sau:
Biểu đồ thanh (Bar): thường được dùng để biểu diễn dữ liệu
dưới dạng tần số hay tần suất %.
Biểu đồ hình tròn (Pie): thường được dùng biểu diễn dữ liệu
định tính dạng tần số hay % có ít giá trị.
Đồ thị đường gấp khúc (Line) và diện tích (Area): thường
được áp dụng cho dữ liệu định lượng.
Biểu đồ Histograms: biểu đồ phân phối tần số thường được
áp dụng cho các biến có giá trị liên tục.
83 18/09/2013
3- Các phép xử lý dữ liệu căn bản
Chương 3 - SPSS
3/ Trình bày kết quả bằng đồ thị:
Biểu đồ thanh (Bar): thường được dùng để biểu diễn dữ
liệu dưới dạng tần số hay tần suất %.
Chương 3 - SPSS 84 C18/09/2013
Dùng để biểu diễn dữ liệu của 1 biến đơn (dạng
đơn giản có các thanh riêng biệt).
Dùng để biểu diễn dữ liệu của 1 biến theo mối quan
hệ với biến khác (dạng từng nhóm thanh kề nhau).
Dùng để biểu diễn dữ liệu như ở Clusterd nhưng các
thanh trong nhóm nằm chồng lên nhau.
Thể hiện một con số thống kê tổng hợp cho những
nhóm trường hợp khác nhau.
Thể hiện những con số thống kê tổng hợp cho những
biến khác nhau trên cùng một đồ thị.
Thể hiện giá trị thật của 1 biến trong từng tình huống cụ
thể (không thể hiện những con số thống kê tổng hợp).
3- Các phép xử lý dữ liệu căn bản
18/09/2013
15
Biểu đồ thanh biểu diễn một biến đơn
Ví dụ vẽ biểu đồ thanh biểu
diễn dữ liệu của biến độ tuổi:
- Vào Graphs-Legacy Dialogs
Bar Trong hộp thoại Bar
Charts chọn Simple và
Summaries for groups of
cases, kích chọn nút Define
xuất hiện hộp thoại bên:
- Khung Bars Represent cho
phép chọn các thông tin hiển
thị trên các thanh của biến
muốn vẽ đồ thị, với Number
of case: hiển thị tần số (số
lượng), % of case: hiển thị tần
suất (%). Ở đây ta chọn
Number of case.
- Đưa biến tuoiMH vào khung
Category Axis.
18/09/2013 85 Chương 3 - SPSS
- Nhấn nút Titles
để nhập tên cho đồ thị
(nếu muốn). Cuối cùng
nhấn nút OK, ta có kết
quả đồ thị như sau:
18/09/2013 86
Ta có trục hoành của đồ thị cho ta thông tin về các nhóm độ
tuổi, độ cao của trục tung cho ta thông tin về số lượng người
trong từng nhóm độ tuổi.
Từ đồ thị ta thấy số lượng người trong nhóm tuổi từ 36 đến
45, từ 46 đến 60 xấp xỉ nhau và chiếm phần lớn, số lượng
người nhóm từ 26 đến 35 là ít nhất.
Chương 3 - SPSS
Biểu đồ thanh kết hợp nhiều biến: Ví dụ vẽ biểu đồ Bar biểu
diễn mối quan hệ giữa
trình độ học vấn và
thành phố.
- Vào Graphs-Legacy-
Dialogs-Bar trong hộp
thoại Bar Charts chọn
Clustered và Summaries
for groups of cases rồi
kích chọn nút Define.
- Trong hộp thoại Define
Clustered Bars: Summaries
for Groups of Cases: đưa
biến hocvan vào khung
Category Axis, đưa biến
Diachi vào khung Define
Clusters by. Kích chọn
OK, ta có kết quả đồ thị
như sau:
18/09/2013 87 Chương 3 - SPSS 18/09/2013 88
Từ đồ thị ta thấy số lượng người có trình độ học vấn ở bậc
đại học và sau đại học của thành phố Hà Nội cao hơn của
thành phố Hồ Chí Minh.
Chương 3 - SPSS
89 18/09/2013
6.4. Các kỹ thuật phân tích và xử lý dữ liệu căn bản Hiệu chỉnh đồ thị: nhấn đúp vào đồ thị để mở cửa sổ SPSS
Chart Editor để hiêụ chỉnh
Chương 2 - SPSS
Chương 3 - SPSS
3/ Trình bày kết quả bằng đồ thị:
Biểu đồ bánh (Pie):
Biểu đồ bánh thể hiện thông tin về kết cấu rất tốt, nó giúp
hình thành được cảm nhận về tổng thể và bộ phận của vấn để.
Vì thế, có thể so sánh được các biểu hiện của các biến hay các
biến với nhau hoặc các giá trị riêng biệt.
Các số thống kê được sử dụng trong đồ thị Pie là tần số, tần
suất và tổng cộng.
SPSS cho phép chỉnh sửa màu sắc hoặc có thể tách riêng
từng phần của đồ thị như sau:
- Kích đúp chuột vào đồ thị để mở cửa sổ SPSS Chart Editor
- Kích chuột vào miếng muốn tách khi đó đường viền của nó
xuất hiện các chấm vuông
- Vào Elements- Explode Slice kết quả miếng đã được chọn
sẽ tự động tách riêng ra.
90 18/09/2013
3- Các phép xử lý dữ liệu căn bản
Chương 3 - SPSS
18/09/2013
16
18/09/2013 91
Ví dụ: vẽ biểu đồ Pie minh họa trình độ học vấn.
Chương 3 - SPSS
3/ Trình bày kết quả bằng đồ thị:
Đồ thị dạng đƣờng (Line) và diện tích (Area)
Đồ thị loại này có quan hệ rất gần với đồ thị Bar. Cả 3 dạng
đồ thị đều thể hiện tần số, giá trị của dữ liệu và các số thống kê
cho mỗi biểu hiện riêng biệt của một biến
92 18/09/2013
3- Các phép xử lý dữ liệu căn bản
Chương 3 - SPSS
CHƢƠNG I – CÁC VẤN ĐỀ CƠ BẢN CỦA TIN HỌC
Phải
trả lời
các
câu hỏi
sau
Ý nghĩa của phân tích dữ liệu?
Phần mềm SPSS có ưu/nhược điểm gì?
Phân biệt ý nghĩa của các cửa sổ: Data View,
Data Editor và Variable View.
Liệt kê các phép xử lý trên biến.
Có mấy bảng tổng hợp nhiều biến?
Nếu vận dụng Excel và SPSS để quản lý dữ
liệu thì ta sẽ thực hiện được những yêu cầu
nào?
TỔNG KẾT CHƢƠNG III
18/09/2013 Chương 3 - SPSS 93
Kết thúc Chương III
18/09/2013 Chương 3 - SPSS 94
File đính kèm:
bai_giang_tin_hoc_can_ban_chuong_3_spss.pdf

