Bài giảng Tin học căn bản - Chương 3: SPSS

Phân tích dữ liệu là gì?

 Phân tích dữ liệu là quy trình sử dụng các công cụ tính

toán điện tử và các phương pháp chuyên dụng để biến đổi

các dòng dữ liệu ban đầu thành các dòng thông tin kết quả.

Việc chắt lọc được các

thông tin hữu ích nhất từ

một kho các thông tin chính

là yêu cầu số một của quá

trình phân tích dữ liệu thông

tin kinh tế.

Quá trình tư duy thống kê dựa trên dữ liệu

1- Giới thiệu về phân tích dữ liệu và SPSS

Tại sao phải phân tích dữ liệu?

Dữ liệu chỉ là các số liệu thô và bản thân chúng không phải

là tri thức. Phân tích dữ liệu có vai trò quan trọng trong các hệ

thống quản lý kinh tế, nó giúp biến đổi dữ liệu trở thành những

thông tin thống kê làm cơ sở cho việc gia tăng sự hiểu biết, tri

thức từ đó đưa ra được các quyết định kịp thời, chính xác. Tất

cả mọi quyết định quản lý chỉ mang lại hiệu quả kinh tế cao khi

dựa trên cơ sở của một quy trình xử lý thông tin khoa học, bao

quát được các nguồn thông tin chiến lược và đón đầu được các

xu thế phát triển.

pdf 16 trang kimcuc 4400
Bạn đang xem tài liệu "Bài giảng Tin học căn bản - Chương 3: SPSS", để tải tài liệu gốc về máy hãy click vào nút Download ở trên

Tóm tắt nội dung tài liệu: Bài giảng Tin học căn bản - Chương 3: SPSS

Bài giảng Tin học căn bản - Chương 3: SPSS
18/09/2013 
1 
HỌC VIỆN NGÂN HÀNG 
KHOA HỆ THỐNG THÔNG TIN KINH TẾ 
Chƣơng 3 - SPSS 
(Statistical Products for the Social Sevices) 
Bài giảng của Khoa Hệ thống thông tin Quản lý 
Nội dung 
Giới thiệu về phân tích dữ liệu và SPSS 1 
Dữ liệu trong SPSS 2 
Các phép xử lý dữ liệu căn bản 3 
18/09/2013 Chương 3 - SPSS 
2 
1- Giới thiệu về phân tích dữ liệu với SPSS 
Chương 3 - SPSS 3 18/09/2013 
1/ Dữ liệu là gì? 
2/ Phân loại dữ liệu 
3/ Phân tích dữ liệu là gì? 
4/ Các bƣớc cơ bản trong nghiên cứu, phân 
tích dữ liệu 
5/ SPSS? 
6/ Khởi động SPSS 
7/ Màn hình giao diện SPSS 
1- Giới thiệu về phân tích dữ liệu và SPSS 
Chương 3 - SPSS 4 18/09/2013 
1/ Dữ liệu là gì? 
 Dữ liệu là các số liệu hoặc tài liệu cho trước chưa qua xử lý. 
2/ Phân loại dữ liệu: 2 loại 
 ⟹ Phân loại dữ liệu định tính và định lượng nhằm xác định 
các phép toán thống kê hợp lý. 
Dữ liệu định tính Dữ liệu định lượng 
 Thể hiện dưới dạng từ ngữ. 
 Mang tính chủ quan như ý 
kiến, kinh nghiệm, cảm giác  
 Ví dụ: các dịch vụ ngân hàng 
bạn thường dùng: Gửi tiền, vay 
tiền, chuyển khoản, thanh toán 
nội địa 
 Thể hiện dưới dạng số học. 
 Mang tính khách quan. 
 Ví dụ: Lãi suất gửi tiền của 
các kỳ hạn 
1- Giới thiệu về phân tích dữ liệu và SPSS 
5 18/09/2013 
3/ Phân tích dữ liệu là gì? 
 Phân tích dữ liệu là quy trình sử dụng các công cụ tính 
toán điện tử và các phương pháp chuyên dụng để biến đổi 
các dòng dữ liệu ban đầu thành các dòng thông tin kết quả. 
 Việc chắt lọc được các 
thông tin hữu ích nhất từ 
một kho các thông tin chính 
là yêu cầu số một của quá 
trình phân tích dữ liệu thông 
tin kinh tế. 
Quá trình tư duy thống kê dựa trên dữ liệu 
Chương 3 - SPSS 
1- Giới thiệu về phân tích dữ liệu và SPSS 
6 18/09/2013 
Tại sao phải phân tích dữ liệu? 
 Dữ liệu chỉ là các số liệu thô và bản thân chúng không phải 
là tri thức. Phân tích dữ liệu có vai trò quan trọng trong các hệ 
thống quản lý kinh tế, nó giúp biến đổi dữ liệu trở thành những 
thông tin thống kê làm cơ sở cho việc gia tăng sự hiểu biết, tri 
thức từ đó đưa ra được các quyết định kịp thời, chính xác. Tất 
cả mọi quyết định quản lý chỉ mang lại hiệu quả kinh tế cao khi 
dựa trên cơ sở của một quy trình xử lý thông tin khoa học, bao 
quát được các nguồn thông tin chiến lược và đón đầu được các 
xu thế phát triển. 
Chương 3 - SPSS 
18/09/2013 
2 
1- Giới thiệu về phân tích dữ liệu và SPSS 
7 18/09/2013 
 4/ Các bƣớc cơ bản trong nghiên cứu, phân tích dữ liệu: 
 a) Xác định vấn đề nghiên cứu: cần xác định rõ ràng, chính 
xác vấn đề cần nghiên cứu giúp thu thập dữ liệu tiến hành 
nhanh gọn, chính xác. 
 b) Thu thập dữ liệu: 
• Thiết kế các cách thức thu thập dữ liệu là công việc quan 
trọng đối với phân tích thống kê. 
• Hai khía cạnh quan trọng của nghiên cứu thống kê là: tổng 
thể (tập hợp các phần tử) và mẫu (một tập hợp con của tổng 
thể). 
• Dữ liệu có thể được thu thập từ những nguồn có sẵn hay 
qua quan sát, nghiên cứu, thử nghiệm. 
Chương 3 - SPSS 
1- Giới thiệu về phân tích dữ liệu và SPSS 
8 18/09/2013 
 c) Xử lý dữ liệu: qua 3 bước 
• Mã hoá: trừ một số dữ liệu định lượng thì không cần mã 
hoá, còn các dữ liệu định tính cần được mã hóa để chuyển 
về dạng số. 
• Nhập liệu: Dữ liệu được nhập và lưu trữ bởi ít nhất hai 
người nhập liệu độc lập khác nhau. Thông thường trong thực 
tế nhập dữ liệu từ bảng câu hỏi vào máy tính là nhập hai lần. 
• Hiệu chỉnh: Dữ liệu được kiểm tra bằng cách so sánh hai 
tập hợp dữ liệu được nhập độc lập với nhau và phát hiện sai 
lệch giữa hai lần nhập. Kiểm tra bằng cách nhập lần hai bảo 
đảm mức độ chính xác lên đến 99,8%. 
Chương 3 - SPSS 
1- Giới thiệu về phân tích dữ liệu và SPSS 
9 18/09/2013 
 d) Phân tích dữ liệu: Các phương pháp phân tích dữ liệu 
được chia thành hai loại: 
• Các phương pháp thăm dò: dùng để khám phá ý nghĩa 
của dữ liệu bằng các phép tính số học đơn giản và các biểu 
đồ đơn giản tóm tắt dữ liệu. 
• Các phương pháp khẳng định: dùng các ý tưởng trong lý 
thuyết xác suất để trả lời các vấn đề nghiên cứu cụ thể 
 e) Báo cáo kết quả: thông qua suy diễn, từ dữ liệu mẫu thu 
thập được ước lượng, kiểm định và các mô hình phân tích 
khác sẽ giúp khẳng định các đặc tính của tổng thể. Các kết quả 
có thể được báo cáo dưới dạng bảng, đồ thị hay các số phần 
trăm. 
Chương 3 - SPSS 
1- Giới thiệu về phân tích dữ liệu và SPSS 
10 18/09/2013 
5/ SPSS là gì? 
 ∎ SPSS (Statistical Products for the Social Sevices) là một 
phần mềm chuyên dụng cho thống kê kinh tế xã hội và kinh tế 
lượng được thiết kế để thực hiện tất cả các bước trong phân 
tích thống kê, từ việc liệt kê dữ liệu, lập bảng biểu và thống kê 
mô tả cho đến các phân tích thống kê phức tạp mà không cần 
phải lập trình như các phần mềm khác. 
 ∎ SPSS có thể tạo ra các bảng tính tần suất của tất cả các 
biến trong cơ sở dữ liệu, hoặc cho phép tạo ra các bảng tương 
quan giữa các biến. Ví dụ: cơ sở dữ liệu của một cơ quan có 
thể lập các bảng tổng hợp như: mức lương phân theo chức vụ, 
mức lương phân theo trình độ học vấn, hệ số phụ cấp phân 
theo số năm công tác 
 ∎ SPSS ra đời từ 1960, đến nay đã xuất hiện phiên bản 19. 
 Chương 3 - SPSS 
1- Giới thiệu về phân tích dữ liệu và SPSS 
11 18/09/2013 
6/ Khởi động SPSS:  
 Chọn Start – All Programs – SPSS 16.0 - SPSS 16.0 
Chạy chương trình Tutorial 
Mở 1 tệp trống .sav cho phép 
người dùng nhập dữ liệu mới 
Chạy một câu truy vấn dữ liệu có 
sẵn với phần mở rộng là .spq 
Cho phép tạo mới câu truy vấn dữ 
liệu với phần mở rộng .spq 
Mở 1 tệp dữ liệu đã có sẵn với các định 
dạng của: SPSS, Excel, Lotus, DBASE 
Mở 1 tệp dữ liệu với các định dạng khác 
Chương 3 - SPSS 
1- Giới thiệu về phân tích dữ liệu và SPSS 
12 18/09/2013 
7/ Giao diện của SPSS 
 Sau khi khởi động SPSS sẽ xuất hiện cửa sổ SPSS Data 
Editor với giao diện 
như một bảng tính 
cho phép người 
dùng định nghĩa, 
nhập, hiệu đính 
và thể hiện dữ liệu. 
Thanh tiêu đề (Title bar) 
Thanh thực đơn (Menu bar) Thanh công cụ (Tool bar) 
Thanh cuộn 
Thanh trạng thái (Status bar) 
Cột: Mỗi cột chứa một biến dữ liệu cụ thể 
Dòng: Mỗi dòng trong bảng chứa các dữ 
liệu của đối tượng được quan sát 
Màn hình để nhập và thể 
hiện dữ liệu đã nhập 
Màn hình để khai báo 
biến (tên, loại, độ rộng, 
loại thang đocủa biến) 
Chương 3 - SPSS 
18/09/2013 
3 
1- Giới thiệu về phân tích dữ liệu và SPSS 
13 18/09/2013 
Tìm hiểu thanh thực đơn Menu: 
File: Khởi tạo, đóng mở file, lưu file, in ấn, thoát 
Edit: Undo, sao chép, cắt dán, tìm kiếm thay thế, chèn biến, chèn giá trị 
View: Cho hiện dòng trạng thái, thanh công cụ, chọn font chữ, cho hiện 
giá trị nhập vào hay nhãn của các giá trị nhập 
Data: Định nghĩa biến, thêm biến, ghép file, chia file, chọn quan sát 
Transform: Tính toán, mã hoá lại các biến 
Analyze: Thực hiện thống kê: tóm tắt dữ liệu, so sánh trung bình, phương 
sai, tương quan và hồi quy, phân tích đa biến 
Utilities: Tìm hiểu thông tin về các biến, file 
Graphs: Tạo các biểu đồ và đồ thị. 
Window: Sắp xếp và di chuyển các cửa sổ làm việc trong SPSS 
Chương 3 - SPSS 
1- Giới thiệu về phân tích dữ liệu và SPSS 
14 18/09/2013 
Sử dụng tiếng Việt trong SPSS: từ cửa sổ Data chọn View 
– chọn Font rồi chọn kiểu font. 
Chương 3 - SPSS 
2- Dữ liệu trong SPSS 
15 18/09/2013 
1/ Thu thập dữ liệu 
2/ Nhập dữ liệu 
3/ Làm sạch dữ liệu 
Chương 3 - SPSS 16 18/09/2013 
1/ Thu thập dữ liệu 
 Việc thu thập dữ liệu là từ các phiếu trả lời của các bảng hỏi. 
 Ví dụ một bảng hỏi được xây dựng theo cách thức sau: 
 BẢNG CÂU HỎI PHỎNG VẤN 
 Số phiếu: 
Đề tài nghiên cứu: “Thăm dò về thói quen sử dụng các dịch vụ của ngân hàng” 
Mục đích: Tìm hiểu một phần về vai trò của ngân hàng trong đời sống của người 
dân cũng như giúp cho các ngân hàng hiểu rõ hơn các ý kiến và nhu cầu sử dụng 
các dịch vụ ngân hàng của khách hàng, trên cơ sở đó đưa ra được các dịch vụ và 
chính sách hiệu quả, hợp lý. 
Xin vui lòng khoanh tròn các phương án mà anh/chị/ông/bà thấy phù hợp với mình. 
A- CÁC DỊCH VỤ NGÂN HÀNG 
1. Anh/chị/ông/bà có thường xuyên sử dụng các dịch vụ của ngân hàng không? 
(chọn 1 trả lời) 
Chương 3 - SPSS 
Hầu như không 1 
Thỉnh thoảng 2 
Thường xuyên 3 
Rất thường xuyên 4 
2- Dữ liệu trong SPSS 
2- Dữ liệu trong SPSS 
17 18/09/2013 
2a. Anh/chị/ông/bà đã sử dụng dịch vụ của ngân hàng nào? (có thể chọn 
nhiều trả lời) 
2b. Các thành viên gia đình anh/chị/ 
ông/bà đã sử dụng dịch vụ của ngân 
hàng nào? (có thể chọn nhiều trả lời) 
3. Trong gia đình anh/chị/ông/bà, số lượng người đã sử dụng các dịch vụ 
của ngân hàng là bao nhiêu? Ghi 
một con số cụ thể: ___ người. 
4. Anh/chị/ông/bà thường sử dụng 
các dịch vụ nào của ngân hàng? 
(có thể chọn nhiều trả lời) 
Chương 3 - SPSS 
2a 2b 
Agribank 1 1 
Techcombank 2 2 
Vietcombank 3 3 
ACB 4 4 
MB bank 5 5 
VP bank 6 6 
Khác 7 7 
Gửi tiền 1 
Vay tiền 2 
Chuyển khoản 3 
Thanh toán 4 
Trả lương 5 
Khác 6 
2- Dữ liệu trong SPSS 
18 18/09/2013 
5. Khi có một khoản tiền nhàn rỗi anh/chị/ 
ông/bà thường làm gì? (chọn tối đa 2 trả lời) 
6. Anh/chị/ông/bà thường 
sử dụng kỳ hạn lãi suất 
nào khi sử dụng dịch 
vụ vay, gửi tiền? 
(chọn tối đa 3 trả lời) 
7. Hãy xếp hạng các chủ đề sau đây tùy theo mức độ quan tâm của 
anh/chị/ông/bà đối với từng loại chủ đề: chủ đề nào quan tâm nhất thì ghi số 
1, quan tâm nhì thì ghi số 2, quan tâm ba thì ghi số 3. 
Lãi suất: _____ 
Thái độ phục vụ: _____ 
Uy tín: _____ 
 Chương 3 - SPSS 
Gửi tiết kiệm 1 
Mua vàng 2 
Mua sắm 3 
Đầu tư 4 
Khác 5 
1 tháng 1 
3 tháng 2 
6 tháng 3 
9 tháng 4 
1 năm 5 
Khác 6 
18/09/2013 
4 
2- Dữ liệu trong SPSS 
19 18/09/2013 
8. Anh/chị/ông/bà đánh giá các mặt sau đây của các ngân hàng như thế nào? 
Chương 3 - SPSS 
Rất 
không 
hài 
lòng 
Không 
hài 
lòng 
Bình 
thường 
Hài 
lòng 
Rất 
hài 
lòng 
Không 
ý kiến 
1. Tính đa dạng của dịch vụ 1 2 3 4 5 8 
2. Tính tin cậy của các dịch vụ 1 2 3 4 5 8 
3. Tính hiệu quả của các dịch vụ 1 2 3 4 5 8 
4. Tính tiện ích của các dịch vụ 1 2 3 4 5 8 
5. Tính mới, đột phá 1 2 3 4 5 8 
2- Dữ liệu trong SPSS 
20 18/09/2013 
B- THÔNG TIN CÁ NHÂN 
 Họ tên: __________________________ Điện thoại: ____________ 
 Địa chỉ: _________________________________________________ 
 Tuổi: ____________ Số người trong hộ gia đình: _____________ 
 Giới tính: 1. Nam 2. Nữ 
 Thu nhập cá nhân(TB tháng): 
 1. Không 2. Dưới 1 tr 3. 1-2 tr 4. 2-4 tr 5. Trên 4 tr 
 Thu nhập gia đình (TB tháng): 
 1. Dưới 2 tr 2. 2-4 tr 3. 4-6 tr 4. Trên 6 tr 
 Học vấn: 
 1. Phổ thông 2. CĐ 3. ĐH 4. Sau ĐH 
 Nghề nghiệp: 
 1. Công chức 2. Giáo viên 3. Nhân viên văn phòng 
 4. Nhân viên KD 5. Tự KD 6. SV – HS 
 7. LĐ đơn giản 8. Về hưu 9. Không làm việc 
 10. Nghề chuyên môn (Bác sĩ, kiến trúc sư, kế toán, nhạc sĩ) 
Chương 3 - SPSS 
2- Dữ liệu trong SPSS 
21 18/09/2013 
2/ Nhập dữ liệu: 
 Sau khi lấy ý kiến của người dân thông qua bảng câu hỏi phỏng vấn 
trên, ta tiến hành nhập dữ liệu thu thập được từ các phương án trả 
lời của các bảng câu hỏi vào phần mềm SPSS, ta thực hiện theo 2 
bước sau: 
 Bƣớc 1: Mã hoá và tạo khuôn nhập dữ liệu theo 4 quy tắc sau: 
 Các thông tin thu thập không phải dưới dạng số phải mã hoá để 
chuyển thành dạng số. 
 VD: Giới tính được mã hóa: 1. Nam; 2. Nữ 
 Các thông tin thu thập đã ở dạng số không cần mã hoá. VD: Tuổi 
 Các câu hỏi chỉ có một trả lời thì chỉ cần tạo một biến để lưu trữ 
câu trả lời. 
 VD: Anh/chị/ông/bà có thường xuyên sử dụng các dịch vụ của 
ngân hàng không? (chọn 1 trả lời) ⟹ chỉ cần tạo 1 biến 
Chương 3 - SPSS 
2- Dữ liệu trong SPSS 
22 18/09/2013 
 Các câu hỏi có thể chọn nhiều trả lời thì cần phải tạo nhiều biến để 
lưu trữ các phương án trả lời tương ứng. VD: Anh/chị/ông/bà thường 
sử dụng các dịch vụ nào của ngân hàng? (có thể chọn nhiều trả lời) 
 ⟹ cần tạo 6 biến 
 Bƣớc 2: Nhập dữ liệu: dữ liệu có thể được nhập theo 3 cách sau: 
 Cách 1: Nhập trực tiếp trong cửa sổ Data Editor. 
 Cách 2: Lấy từ các file dữ liệu có các định dạng khác nhau từ: 
 - Các bảng tính worksheet được lập trong Excel hoặc Lotus. 
 - Cơ sở dữ liệu được lập dưới định dạng DBASE và SQL. 
 - Các file dạng text ASCII với kiểu Tab-deliminated 
 Cách 3: Dùng phần mềm tạo form nhập liệu. 
Chương 3 - SPSS 
18/09/2013 23 
Tổ chức sắp xếp dữ liệu và nhập liệu trong SPSS như sau: 
 Mỗi đối tượng trả lời (quan sát) tương ứng với một dòng (1 
case). Thông tin của mỗi đối tượng được nhập vào một dòng 
của cửa sổ Data View 
 Mỗi loại thông tin thu thập được sắp xếp tương ứng với một 
cột (1 variable) 
 Nhập liệu từ trái qua phải trên cửa số Data View theo từng 
dòng). Xong một phiếu (một dòng) thì chuyển sang phiếu khác 
(sang dòng mới). 
Cách 1: Nhập trực tiếp dữ liệu trong cửa sổ Data Editor 
Chương 3 - SPSS 18/09/2013 24 
Định nghĩa các biến cần dùng trong bảng Variable View 
  Biến là đại lượng đại diện cho các câu hỏi trong bảng hỏi 
hoặc các vấn đề cần quan sát. 
 VD: Dịch vụ ngân hàng, Giới tính, Tuổi là các biến. 
  Bảng Variable View chứa đựng các thông tin về các thuộc 
tính của từng biến trong file dữ liệu. Trong một bảng Variable 
View ta có: các hàng là danh sách các biến; các cột là các 
thuộc tính của từng biến. Số lượng biến cần định nghĩa bằng 
tổng số phương án trả lời của từng câu hỏi trong bảng phỏng 
vấn. Các câu hỏi có tối đa bao nhiêu câu trả lời thì cần phải tạo 
bấy nhiêu biến để lưu trữ các phương án trả lời tương ứng. 
 Ví dụ trong bảng câu hỏi phỏng vấn trên: câu 1 cần tạo 1 
biến, câu 2a cần tạo 7 biến, câu 5 cần tạo 2 biến. 
Chương 3 - SPSS 
18/09/2013 
5 
18/09/2013 25 
Với mỗi một biến ta xác định các thuộc tính sau: 
 Tên biến {Name} 
 Kiểu dữ liệu {Type} 
 Số các chữ số của biến {Width} ⟹ Xđ độ rộng cột chứa biến 
 Số lượng chữ số thập phân {Decimals} 
 Mô tả nhãn hiển thị của biến {Label} 
 Xác định nhãn giá trị của biến {Values} 
 Mô tả giá trị khuyết thiếu {Missing} 
 Căn lề hiển thị giá trị của biến trong cửa sổ Data View {Align} 
 Xác định thang đo của biến {Measure} 
Chương 3 - SPSS 
18/09/2013 26 
a) Tên biến (Name): Tên biến là một chuỗi có độ dài 8 ký tự, 
không bắt đầu bằng một chữ số, không kết thúc bằng dấu chấm, 
không chứa khoảng trắng và các ký tự đặc biệt như: !, ?, „,* . 
Thông thường tên biến được đặt tương ứng với thứ tự của câu 
hỏi mà biến đó mô tả, ví dụ với câu hỏi 1 thì đặt tên biến là c1. 
 - Cách tạo tên biến: gõ trực tiếp giá trị của tên biến tại cột Name. 
Với những câu hỏi có nhiều phương án trả lời thì phải tạo nhiều 
biến lưu trữ. 
Chương 3 - SPSS 
18/09/2013 27 
Chú ý: ta có thể Copy các thuộc tính đã định nghĩa ở 1 
biến cho các biến khác. 
 Bước 1: Trong cửa sổ Variable View lựa chọn ô, các ô 
hay một dòng các thuộc tính đã được định nghĩa muốn áp 
dụng cho các biến khác. Từ thanh menu Edit chọn Copy 
hoặc kích chuột phải chọn Copy. 
 Bước 2: Chọn ô, các ô/dòng muốn áp dụng các thuộc 
tính. Từ thanh menu Edit chọn Paste hoặc kích chuột phải 
chọn Paste. 
Chương 3 - SPSS 
b) Kiểu dữ liệu (Type): Mặc định một biến mới tạo sẽ có kiểu 
dữ liệu số Numeric, 
ta có thể thay đổi 
sang các kiểu dữ 
liệu khác trong hộp 
thoại Variable Type. 
 Cách thiết lập 
Kiểu dữ liệu: chọn 
trực tiếp trong cửa 
sổ Variable Ty ... thống ứng với một giá 
trị mới. 
• System-or user-missing: giá trị khuyết của hệ thống hoặc 
giá trị khuyết do người sử dụng định nghĩa ứng với một giá trị 
mới. 
• Range: một khoảng giá trị cũ ứng với một giá trị mới. 
Ví dụ: mã hóa nhóm tuổi từ 17 đến 25: tại khung Old Value, 
kích chọn mục Range  through và nhập vào giá trị 17; 25. 
Tại khung New Value, nhập 1 tại ô Value rồi kích chọn nút Add. 
Thực hiện tương tự cho 3 nhóm còn lại ta có kết quả như sau: 
18/09/2013 61 Chương 3 - SPSS 18/09/2013 62 
- Nhấn Continue để 
trở lại hộp thoại chính 
và chọn OK. Kết quả 
trong cửa sổ Variable 
View xuất hiện một 
biến mới có tên là 
tuoiMH như sau: 
Chương 3 - SPSS 
18/09/2013 63 
-Tiến hành sửa giá trị Decimals = 0 và khai báo thuộc tính 
Values cho biến tuoiMH 
như bên: 
- Mở cửa sổ Data View 
ta có giá trị của biến 
tuoiMH như sau: 
Chương 3 - SPSS 18/09/2013 64 
- Cuối cùng lập bảng tần số của biến tuoiMH ta có kết quả như 
sau: 
Chương 3 - SPSS 
b) Chuyển một biến dạng Category thành dạng Dichotomy 
 - Biến dạng Category là biến phân loại có thể có nhiều giá trị mã 
hóa tượng trưng cho nhiều trạng thái, biểu hiện khác nhau. Ví dụ các 
ngân hàng gồm có: Agribank, Techcombank, Vietcombank 
 - Biến Dichotomy là biến phân loại chỉ có 2 giá trị mã hóa tượng 
trưng cho 2 trạng thái hay 2 biểu hiện khác nhau. Ví dụ: nam hay nữ, 
đồng ý hay không đồng ý có sử dụng dịch vụ của ngân hàng MB hay 
không sử dụng dịch vụ của ngân hàng MB... 
 ⟹ Đối với các câu hỏi khảo sát dùng thang đo định danh có nhiều 
hơn 1 câu trả lời, có thể mã hóa và nhập liệu theo cả 2 kiểu biến này. 
Tuy nhiên kiểu Category dễ mã hóa và nhập liệu hơn, nhưng khi 
phân tích sâu hơn thì hay dùng kiểu Dichotomy. Do đó ta thường tạo 
khuôn và nhập liệu theo kiểu Category, sau đó khi cần phân tích sâu 
hơn thì chuyển sang dạng biến Dichotomy. 
 65 18/09/2013 
3- Các phép xử lý dữ liệu căn bản 
Chương 3 - SPSS 
Ví dụ: Câu hỏi 2a về việc đã sử dụng các dịch vụ của ngân 
hàng nào, thông tin lựa chọn các ngân hàng được thể hiện 
trong 7 biến từ c2a1-c2a7. Muốn biết ngân hàng MB được lựa 
chọn như thế nào, ta tạo một biến Dichotomy với giá trị 1 
tượng trưng cho việc có lựa chọn ngân hàng MB, giá trị 0 là 
không lựa chọn. Sau đó đếm tần số gặp số 1 ta sẽ biết được 
số người chọn ngân hàng MB. 
 Các bước thực hiện như sau: 
Vào menu Transform - Count Values within Cases, xuất 
hiện hộp thoại sau: 
18/09/2013 66 Chương 3 - SPSS 
18/09/2013 
12 
- Khai báo tên biến Dichotomy muốn tạo tại ô Target Variable, 
ví dụ: sudungMB. 
- Khai báo nhãn biến Dichotomy tại ô Target Label, ví dụ: So 
nguoi su dung MB. 
- Đưa các biến: c2a1 đến c2a7 vào khung Numeric Variables. 
- Nhấn nút Define Values mở hộp thoại Count Values within 
Cases: Values to Count. 
- Nhập số 5 (là con số được mã hóa cho ngân hàng MB trong 
các biến từ c2a1 đến c2a7) vào ô Value sau đó bấm nút Add 
để đưa nó sang ô Values to Count. Ở bước này ta đã yêu cầu 
SPSS đếm tất cả các trường hợp quan sát dọc theo các biến 
từ c2a1 đến c2a7 để xem có gặp giá trị 5 không? Nếu gặp thì 
SPSS gán giá trị 1 cho biến sudungMB, nếu không thì gán giá 
trị 0. 
- Nhấn Continue để trở lại hộp thoại chính và chọn OK. Kết 
quả trong cửa sổ Variable View xuất hiện một biến mới có tên 
là sudungMB như hình sau: 
 18/09/2013 67 Chương 3 - SPSS 18/09/2013 68 
- Ta sửa giá trị 
Decimals = 0 và 
khai báo thuộc tính 
Values cho biến 
sudungMB như sau: 
Chương 3 - SPSS 
- Mở cửa sổ Data View ta có giá 
trị của biến sudungMB như sau: 
2/ Lập bảng tổng hợp nhiều biến 
 a) Lập bảng tần số và tính toán các đại lượng thống kê mô tả 
cho biến định lượng 
Ví dụ: Lập bảng tần số và tính toán các đại lượng thống kê mô 
tả cho biến c3-Số người sử dụng dịch vụ ngân hàng trong gia 
đình. Các bước thực hiện như sau: 
 - Vào menu Analyze-Descriptive Statistics-Frequencies 
xuất hiện hộp thoại Frequencies. Đưa biến c3 vào khung 
Variable(s) 
69 18/09/2013 
3- Các phép xử lý dữ liệu căn bản 
Chương 3 - SPSS 
Để thiết lập các đại lượng thống kê mô tả, kích chọn nút 
Statistics, xuất hiện hộp thoại Frequencies: Statistics 
 Percentile Values: Tứ phân 
vị (Quartiles) chia các quan sát 
ra thành 4 nhóm có cùng số 
lượng quan sát. Nếu bạn muốn 
một số lượng các nhóm lớn 
hơn 4, hãy chọn Cut points for 
n equal groups. Bạn cũng có thể 
xác định các số phân vị riêng 
biệt tại Percentiles (ví dụ, phân 
vị thứ 95, là trị số mà nằm dưới nó là 95% số lượng quan sát 
rơi vào). 
18/09/2013 70 Chương 3 - SPSS 
 Central Tendency: Các thống kê mô tả trung tâm của một 
phân bố bao gồm trung bình, trung vị, mode và tổng cộng các 
giá trị trong tập dữ liệu quan sát. 
18/09/2013 71 Chương 3 - SPSS 
 Giá trị trung bình (Mean): 
Là giá trị trung bình số học của 
một biến 
 Trung vị (Median): Là số 
nằm giữa (nếu lượng quan sát là 
lẻ) hoặc là giá trị trung bình của 
2 quan sát nằm giữa (nếu số 
lượng quan sát là chẵn). 
 Mode: Là giá trị có tần suất 
xuất hiện lớn nhất của một tập 
hợp các số đo. 
 Sum: Tổng cộng các giá trị 
trong tập dữ liệu quan sát 
 Độ lệch chuẩn (Standard 
deviation): Dùng để đo lường độ 
phân tán của dữ liệu xung quanh giá 
trị trung bình của nó. 
 Phương sai (Variance): Dùng để 
đo lường mức độ phân tán của một 
tập các giá trị quan sát xung quanh 
giá trị trung bình của tập quan sát đó. 
 Khoảng biến thiên (Range): Là 
khoảng cách giữa giá trị quan sát nhỏ 
nhất đến giá trị quan sát lớn nhất. 
 Sai số trung bình mẫu (Standard 
Error of Mean): Được dùng để đo 
• Dispersion: Các thống kê đo đạc độ lớn của sự biến thiên 
hoặc sự trải rộng trong dữ liệu, gồm: độ lệch chuẩn, phương 
sai, khoảng biến thiên, giá trị nhỏ nhỏ, giá trị lớn nhất và sai số 
chuẩn. 
18/09/2013 72 Chương 3 - SPSS 
của mẫu nghiên cứu này so với mẫu nghiên cứu khác. 
lường sự khác biệt về giá trị trung bình 
18/09/2013 
13 
• Distribution: Skewness {Độ lệch} và Kurtosis {độ nhọn} 
là các thống kê mô tả hình dạng và độ cân xứng của một phân 
bố.Kích chọn các ô vuông để chọn các đại lượng thống kê cần 
tính (như hình trên) rồi nhấn nút Continue để trở lại hộp thoại 
Frequencies. 
18/09/2013 73 Chương 3 - SPSS 
 Skewness (Độ lệch): gọi là hệ 
số bất đối xứng, nó đánh giá sự 
phân phối các giá trị có cân đối 
đối với giá trị trung bình hay 
không, 
 Kurtosis (độ nhọn): đánh giá 
đường mật độ phân phối của dãy 
số liệu có nhọn hơn hay tù hơn 
đường mật độ chuẩn tắc (dương 
là nhọn hơn, âm là tù hơn). Nếu 
trong khoảng [-2,2] thì có thể coi số liệu xấp xỉ chuẩn 
- Kích chọn các ô vuông để chọn các đại lượng thống kê cần 
tính (như hình trên) rồi nhấn nút Continue để trở lại hộp thoại 
Frequencies. 
-Tại hộp thoại Frequencies, kích chọn nút OK, ta có kết quả 
như sau: 
Theo kết quả ta thấy: giá trị 
trung vị (Median) của c3 là 3, 
có nghĩa là khi số liệu về số 
người sử dụng dịch vụ trong 
Ngân hàng được sắp xếp theo 
thứ tự tăng dần thì có 50% 
trường hợp nằm dưới giá trị 3 
và 50% trường hợp nằm 
trên giá trị 3; và Mode = 3 
tức là sử dụng dịch vụ trong 
Ngân hàng thường gặp 
nhất là 3. 
18/09/2013 74 Chương 3 - SPSS 
2/ Lập bảng tổng hợp nhiều biến 
 b) Bảng kết hợp 2 biến định tính 
 - Được sử dụng khi ta cần xem xét tần suất của các giá trị 
của một biến định tính theo mối quan hệ với một biến khác. 
Ví dụ: xác định số người trong độ tuổi từ 17 đến 25 có bao 
nhiêu nam, bao nhiêu nữ và chiếm bao nhiêu %? 
 - Để lập bảng kết 
hợp 2 biến định tính 
ta có thể dùng lệnh 
Analyze-Descriptive 
Statistics-Crostabs, 
xuất hiện hộp thoại 
Crostabs. 
75 18/09/2013 
3- Các phép xử lý dữ liệu căn bản 
Chương 3 - SPSS 
- Đưa biến tuoiMH vào ô Rows để tạo nên các dòng của bảng. 
- Đưa biến gioitinh vào ô Columns để tạo nên các cột của bảng (cột 
thường là các biến có ít giá trị hơn). 
- Kích chọn nút Cells xuất hiện hộp thoại Crosstabs: Cell Display 
để xác định các đại lượng thống kê 
- Chọn Column để tính phần trăm theo 
cột (giới tính) và kích chọn Continue để 
trở về hộp thoại Crosstabs. 
-Trong hộp thoại Crosstabs, kích chọn 
nút OK ta có kết quả như sau: 
18/09/2013 76 Chương 3 - SPSS 
Chú ý: nếu trong hộp thoại 
Crosstabs: Cell Display 
không chọn mục nào 
trong khung Pecentages 
thì kết quả như sau: 
18/09/2013 77 
c) Bảng kết hợp 3 biến định tính: 
 Giả sử xác định mối quan 
hệ giữa Thu nhập cá nhân, 
trình độ học vấn và giới tính. 
 - Vào Analyze-Descriptive 
Statistics-Crosstabs 
 - Đưa các biến tncn vào 
ô Rows, biến hocvan vào ô 
Columns, biến gioitinh vào ô 
Layer 1 of 1. 
Chương 3 - SPSS 
- Kích chọn nút Cells trong hộp thoại Crosstabs: Cell Display 
chọn Column để tính tỷ lệ % theo trình độ học vấn. 
- Trong hộp thoại Crosstabs, kích chọn nút OK ta có kết quả 
như sau: 
18/09/2013 78 Chương 3 - SPSS 
18/09/2013 
14 
d) Bảng kết hợp 1 biến định tính và 1 biến định lượng: 
 Giả sử xác định mối quan hệ giữa số người sử dụng dịch vụ 
ngân hàng trong gia đình theo từng thành phố 
 - Vào Analyze-Descriptive Statistics- Explore xuất hiện 
hộp thoại Explore. 
+ Đưa biến định 
lượng c3 vào ô 
Dependent List. 
+ Đưa biến diachi 
vào ô Factor List. 
Kích chọn nút 
OK ta có kết quả 
như sau: 
18/09/2013 79 Chương 3 - SPSS 18/09/2013 80 
Kết quả ta có 
số lượng người 
sử dụng dịch vụ 
ngân hàng 
trung bình trong 
gia đình ở Hà 
Nội là 3.5, còn 
ở Thành phố 
HCM là 2.62. 
Chương 3 - SPSS 
2/ Lập bảng tổng hợp nhiều biến 
 e) Bảng kết hợp 2 biến định tính và 1 biến định lượng 
 - Giả sử xác định mối quan hệ giữa số người sử dụng dịch 
vụ Ngân hàng tại từng thành phố, chi tiết theo từng nhóm thu 
nhập gia đình. 
 - Vào Analyze - Compear Mean - Means xuất hiện hộp 
thoại Means. 
+ Đưa biến định 
lượng c3 vào ô 
Dependent List. 
+ Đưa biến diachi 
vào ô Layer 1 of 1. 
 Nhấn nút Next, 
đưa biến tngd 
vào ô Layer 2 of 2. Kích chọn nút OK ta có kết quả như sau: 
 81 18/09/2013 
3- Các phép xử lý dữ liệu căn bản 
Chương 3 - SPSS 18/09/2013 82 
Kết quả ta có, tại Hà 
Nội nhóm thu nhập 
gia đình dưới 2 triệu 
có 1 quan sát và số 
lượng người sử 
dụng dịch vụ trung 
bình trong các hộ 
này là 1 người 
Chương 3 - SPSS 
3/ Trình bày kết quả bằng đồ thị 
 Kết quả được trình bầy dưới dạng đồ thị có ưu điểm là trực 
quan và dễ dàng so sánh. SPSS cung cấp các loại đồ thị cơ 
bản sau: 
 Biểu đồ thanh (Bar): thường được dùng để biểu diễn dữ liệu 
dưới dạng tần số hay tần suất %. 
 Biểu đồ hình tròn (Pie): thường được dùng biểu diễn dữ liệu 
định tính dạng tần số hay % có ít giá trị. 
 Đồ thị đường gấp khúc (Line) và diện tích (Area): thường 
được áp dụng cho dữ liệu định lượng. 
 Biểu đồ Histograms: biểu đồ phân phối tần số thường được 
áp dụng cho các biến có giá trị liên tục. 
83 18/09/2013 
3- Các phép xử lý dữ liệu căn bản 
Chương 3 - SPSS 
3/ Trình bày kết quả bằng đồ thị: 
 Biểu đồ thanh (Bar): thường được dùng để biểu diễn dữ 
liệu dưới dạng tần số hay tần suất %. 
Chương 3 - SPSS 84 C18/09/2013 
Dùng để biểu diễn dữ liệu của 1 biến đơn (dạng 
đơn giản có các thanh riêng biệt). 
Dùng để biểu diễn dữ liệu của 1 biến theo mối quan 
hệ với biến khác (dạng từng nhóm thanh kề nhau). 
Dùng để biểu diễn dữ liệu như ở Clusterd nhưng các 
thanh trong nhóm nằm chồng lên nhau. 
Thể hiện một con số thống kê tổng hợp cho những 
nhóm trường hợp khác nhau. 
Thể hiện những con số thống kê tổng hợp cho những 
biến khác nhau trên cùng một đồ thị. 
Thể hiện giá trị thật của 1 biến trong từng tình huống cụ 
thể (không thể hiện những con số thống kê tổng hợp). 
3- Các phép xử lý dữ liệu căn bản 
18/09/2013 
15 
 Biểu đồ thanh biểu diễn một biến đơn 
 Ví dụ vẽ biểu đồ thanh biểu 
diễn dữ liệu của biến độ tuổi: 
 - Vào Graphs-Legacy Dialogs 
Bar Trong hộp thoại Bar 
Charts chọn Simple và 
Summaries for groups of 
cases, kích chọn nút Define 
xuất hiện hộp thoại bên: 
- Khung Bars Represent cho 
phép chọn các thông tin hiển 
thị trên các thanh của biến 
muốn vẽ đồ thị, với Number 
of case: hiển thị tần số (số 
lượng), % of case: hiển thị tần 
suất (%). Ở đây ta chọn 
Number of case. 
- Đưa biến tuoiMH vào khung 
Category Axis. 
18/09/2013 85 Chương 3 - SPSS 
- Nhấn nút Titles 
để nhập tên cho đồ thị 
(nếu muốn). Cuối cùng 
nhấn nút OK, ta có kết 
quả đồ thị như sau: 
18/09/2013 86 
 Ta có trục hoành của đồ thị cho ta thông tin về các nhóm độ 
tuổi, độ cao của trục tung cho ta thông tin về số lượng người 
trong từng nhóm độ tuổi. 
 Từ đồ thị ta thấy số lượng người trong nhóm tuổi từ 36 đến 
45, từ 46 đến 60 xấp xỉ nhau và chiếm phần lớn, số lượng 
người nhóm từ 26 đến 35 là ít nhất. 
Chương 3 - SPSS 
 Biểu đồ thanh kết hợp nhiều biến: Ví dụ vẽ biểu đồ Bar biểu 
diễn mối quan hệ giữa 
trình độ học vấn và 
thành phố. 
- Vào Graphs-Legacy- 
Dialogs-Bar trong hộp 
thoại Bar Charts chọn 
Clustered và Summaries 
for groups of cases rồi 
kích chọn nút Define. 
- Trong hộp thoại Define 
Clustered Bars: Summaries 
for Groups of Cases: đưa 
biến hocvan vào khung 
Category Axis, đưa biến 
Diachi vào khung Define 
Clusters by. Kích chọn 
OK, ta có kết quả đồ thị 
như sau: 
18/09/2013 87 Chương 3 - SPSS 18/09/2013 88 
Từ đồ thị ta thấy số lượng người có trình độ học vấn ở bậc 
đại học và sau đại học của thành phố Hà Nội cao hơn của 
thành phố Hồ Chí Minh. 
Chương 3 - SPSS 
89 18/09/2013 
6.4. Các kỹ thuật phân tích và xử lý dữ liệu căn bản Hiệu chỉnh đồ thị: nhấn đúp vào đồ thị để mở cửa sổ SPSS 
Chart Editor để hiêụ chỉnh 
Chương 2 - SPSS 
Chương 3 - SPSS 
3/ Trình bày kết quả bằng đồ thị: 
 Biểu đồ bánh (Pie): 
 Biểu đồ bánh thể hiện thông tin về kết cấu rất tốt, nó giúp 
hình thành được cảm nhận về tổng thể và bộ phận của vấn để. 
Vì thế, có thể so sánh được các biểu hiện của các biến hay các 
biến với nhau hoặc các giá trị riêng biệt. 
 Các số thống kê được sử dụng trong đồ thị Pie là tần số, tần 
suất và tổng cộng. 
 SPSS cho phép chỉnh sửa màu sắc hoặc có thể tách riêng 
từng phần của đồ thị như sau: 
- Kích đúp chuột vào đồ thị để mở cửa sổ SPSS Chart Editor 
- Kích chuột vào miếng muốn tách khi đó đường viền của nó 
xuất hiện các chấm vuông 
- Vào Elements- Explode Slice kết quả miếng đã được chọn 
sẽ tự động tách riêng ra. 
90 18/09/2013 
3- Các phép xử lý dữ liệu căn bản 
Chương 3 - SPSS 
18/09/2013 
16 
18/09/2013 91 
Ví dụ: vẽ biểu đồ Pie minh họa trình độ học vấn. 
Chương 3 - SPSS 
3/ Trình bày kết quả bằng đồ thị: 
 Đồ thị dạng đƣờng (Line) và diện tích (Area) 
 Đồ thị loại này có quan hệ rất gần với đồ thị Bar. Cả 3 dạng 
đồ thị đều thể hiện tần số, giá trị của dữ liệu và các số thống kê 
cho mỗi biểu hiện riêng biệt của một biến 
92 18/09/2013 
3- Các phép xử lý dữ liệu căn bản 
Chương 3 - SPSS 
CHƢƠNG I – CÁC VẤN ĐỀ CƠ BẢN CỦA TIN HỌC 
Phải 
trả lời 
các 
câu hỏi 
sau 
Ý nghĩa của phân tích dữ liệu? 
Phần mềm SPSS có ưu/nhược điểm gì? 
Phân biệt ý nghĩa của các cửa sổ: Data View, 
Data Editor và Variable View. 
Liệt kê các phép xử lý trên biến. 
Có mấy bảng tổng hợp nhiều biến? 
Nếu vận dụng Excel và SPSS để quản lý dữ 
liệu thì ta sẽ thực hiện được những yêu cầu 
nào? 
TỔNG KẾT CHƢƠNG III 
18/09/2013 Chương 3 - SPSS 93 
Kết thúc Chương III 
18/09/2013 Chương 3 - SPSS 94 

File đính kèm:

  • pdfbai_giang_tin_hoc_can_ban_chuong_3_spss.pdf