Bài giảng Tin học ứng dụng - Phần 2: Tin học ứng dụng trong kinh tế - Chương 5: Ứng dụng công cụ phân tích dữ liệu
XÁC ĐỊNH VẤN ĐỀ NGHIÊN CỨU
▪Yêu cầu
• Xác định rõ ràng và chính xác mục tiêu, phạm
vi, nội dung nghiên cứu
• Xác định (các) biến số cần phân tích, dự báo
▪Kết quả
• Giúp việc thu thập dữ liệu hiệu quả, chính xác
7THU THẬP DỮ LIỆU
▪Yêu cầu
• Xác định phạm vi tổng thể nghiên cứu, đơn vị
điều tra, đơn vị báo cáo
• Xác định mẫu quan sát phục vụ suy diễn thống
kê
▪Kết quả
• Dữ liệu thu thập đáp ứng mục tiêu, phạm vi, nội
dung nghiên cứu
Bạn đang xem 20 trang mẫu của tài liệu "Bài giảng Tin học ứng dụng - Phần 2: Tin học ứng dụng trong kinh tế - Chương 5: Ứng dụng công cụ phân tích dữ liệu", để tải tài liệu gốc về máy hãy click vào nút Download ở trên
Tóm tắt nội dung tài liệu: Bài giảng Tin học ứng dụng - Phần 2: Tin học ứng dụng trong kinh tế - Chương 5: Ứng dụng công cụ phân tích dữ liệu
PHẦN 4 TIN HỌC ỨNG DỤNG TRONG PHÂN TÍCH DỮ LIỆU Khoa Hệ thống thông tin quản lý Trường ĐH Ngân hàng TP. HCM BÀI GIẢNG MÔN TIN HỌC ỨNG DỤNG Chương 5 ỨNG DỤNG CÔNG CỤ PHÂN TÍCH DỮ LIỆU MỤC TIÊU ▪Biết được một số công cụ phân tích dữ liệu thông dụng ▪Hiểu và áp dụng được thang đo và dữ liệu để giải quyết một số mô hình thực tế ▪Sử dụng được phần mềm SPSS phục vụ cho phân tích dữ liệu nghiên cứu. C Ô N G C Ụ P H Â N T Í C H D Ữ L I Ệ U GIỚI THIỆU1 CÁC CÔNG CỤ PHÂN TÍCH DỮ LIỆU2 ỨNG DỤNG SPSS3 GIỚI THIỆU1 CÁC CÔNG CỤ PHÂN TÍCH DỮ LIỆU2 ỨNG DỤNG SPSS3 QUY TRÌNH PHÂN TÍCH DỮ LIỆU Xác định vấn đề nghiên cứu Thu thập dữ liệu Xử lý dữ liệu Phân tích dữ liệu Báo cáo kết quả XÁC ĐỊNH VẤN ĐỀ NGHIÊN CỨU ▪Yêu cầu • Xác định rõ ràng và chính xác mục tiêu, phạm vi, nội dung nghiên cứu • Xác định (các) biến số cần phân tích, dự báo ▪Kết quả • Giúp việc thu thập dữ liệu hiệu quả, chính xác 7 THU THẬP DỮ LIỆU ▪Yêu cầu • Xác định phạm vi tổng thể nghiên cứu, đơn vị điều tra, đơn vị báo cáo • Xác định mẫu quan sát phục vụ suy diễn thống kê ▪Kết quả • Dữ liệu thu thập đáp ứng mục tiêu, phạm vi, nội dung nghiên cứu 8 XỬ LÝ DỮ LIỆU ▪Yêu cầu • Lưu trữ dữ liệu trên máy tính một cách hợp lý, đầy đủ và chính xác • Loại bỏ sai sót trong thu thập dữ liệu và nhập liệu ▪Kết quả • Dữ liệu đầy đủ, chính xác, sẵn sàng cho việc phân tích thống kê 9 PHÂN TÍCH DỮ LIỆU ▪Yêu cầu • Khám phá ý nghĩa thống kê của dữ liệu nghiên cứu • Xây dựng mối tương quan giữa các biến liên quan đến các vấn đề kinh tế, xã hội trong tương lai ▪Kết quả • Kết quả phân tích là chứng cứ thống kê có cơ sở cho việc hiểu biết, gia tăng tri thức và ra quyết định 10 BÁO CÁO KẾT QUẢ ▪Yêu cầu • Phản ánh kết quả phân tích dữ liệu • Thể hiện tính không chắn chắn của nghiên cứu do phân tích mẫu dữ liệu nghiên cứu hạn chế ▪Kết quả • Báo cáo chính xác, đầy đủ, khách quan 11 DỮ LIỆU VÀ THANG ĐO 12 Dữ liệu Dữ liệu định tính Thang đo danh nghĩa Thang đo thứ bậc Dữ liệu định lượng Thang đo khoảng cách Thang đo tỷ lệ ▪ Dữ liệu định tính • Phản ánh tính chất, sự hơn kém • Thể hiện bằng chuỗi hoặc số • Không tính được trị trung bình ▪ Dữ liệu định lượng • Phản ánh mức độ, mức độ hơn kém • Thể hiện bằng số chuỗi hoặc số • Tính được giá trị trung bình 13 PHÂN LOẠI DỮ LIỆU ▪ Dữ liệu định tính • Ví dụ —Giới tính —Tình trạng hôn nhân ▪ Dữ liệu định lượng • Ví dụ —Thu nhập —Độ tuổi 14 PHÂN LOẠI DỮ LIỆU THANG ĐO ▪Công cụ mã hóa tình trạng/mức độ của các đơn vị khảo sát theo từng đặc trưng được xem xét ▪Thường thực hiện bằng ký số với thứ tự tăng dần từ trên xuống ▪Các loại thang đo 1. Thang đo danh nghĩa (nominal scale) 2. Thang đo thứ bậc (ordinal scale) 3. Thang đo khoảng (interval scale) 4. Thang đo tỷ lệ (ratio scale) 15 1. THANG ĐO DANH NGHĨA ▪Phân loại đối tượng và đặt tên cho các biểu hiện, ấn định cho chung một ký số tương ứng ▪Ý nghĩa • Các con số chỉ dùng để phân loại đối tượng • Không thể sắp xếp, so sánh ▪Các phép toán thống kê • Phép đếm • Tính tần suất • Xác định giá trị mô hình 16 V.D., THANG ĐO DANH NGHĨA ▪Câu hỏi khảo sát • Tình trạng nhà ở hiện tại? Ở nhà thuê Ở nhà cha mẹ Ở ký túc xá • Các biểu hiện trên có thể được mã hóa 1 = Ở nhà thuê 2 = Ở nhà cha mẹ 3 = Ở ký túc xá 17 2. THANG ĐO THỨ BẬC ▪Phân loại đối tượng và đặt tên cho các biểu hiện, ấn định cho chung một ký số tương ứng, được sắp xếp theo một quy ước nào đó ▪Ý nghĩa • Các con số được sắp xếp theo thứ bậc/sự hơn kém • Không xác định khoảng cách giữa các con số ▪Các phép toán thống kê • Số trung vị, số mô hình • Khoảng, khoảng tứ trung vị 18 V.D., THANG ĐO THỨ BẬC ▪Câu hỏi khảo sát: • Mức độ hài lòng của khách hàng? Hài lòng Bình thường Không hài lòng • Cách biểu hiện trên có thể được quy ước 3 = Hài lòng 2 = Bình thường 1 = Không hài lòng 19 3. THANG ĐO KHOẢNG ▪Phân loại đối tượng và đặt tên cho các biểu hiện, ấn định cho chung một ký số tương ứng, sắp xếp với một khoảng cách nhất định giữa các giá trị ▪Ý nghĩa • Các con số được sắp xếp theo thứ bậc/sự hơn kém • Xác định khoảng cách giữa các con số ▪Các phép toán thống kê • Số trung vị, số mô hình, khoảng, khoảng tứ trung vị • Khoảng biến thiên, số trung bình, độ lệch chuẩn • Có thể thực hiện tính (+, -); không hỗ trợ chia (/) 20 V.D., THANG ĐO KHOẢNG ▪Câu hỏi khảo sát: • Tầm quan trọng của các yếu tố sau đây đối với chất lượng đào tạo đại học? 21 Các thành phần Không quan trọng Rất quan trọng 1 2 3 4 5 Chương trình đào tạo Cơ sở vật chất Phương pháp giảng dạy Đội ngũ giáo viên Công tác hỗ trợ sinh viên 4. THANG ĐO TỶ LỆ ▪Phân loại đối tượng và đặt tên cho các biểu hiện, ấn định cho chung một ký số tương ứng, được sắp xếp với một khoảng cách nhất định giữa các giá trị ▪Ý nghĩa • Các con số được sắp xếp theo thứ bậc/sự hơn kém • Xác định khoảng cách giữa các con số ▪Các phép toán thống kê • Số trung vị, số mode, khoảng, khoảng tứ trung vị • Khoảng biến thiên, số trung bình, độ lệch chuẩn • Hỗ trợ phép tính (+, -, /) 22 V.D., THANG ĐO TỶ LỆ ▪Câu hỏi khảo sát: • Độ tuổi? —Nguời 40 tuổi gấp 2 lần tuổi so với người 20 tuổi, nhưng chỉ bằng 2/3 lần tuổi so với người 60 tuổi • Thu nhập bình quân? —Người thu nhập 20 triệu/tháng gấp đôi so với người thu nhập 10 triệu/tháng 23 MÃ HÓA SỐ LIỆU • Mục đích • Chuyển đổi thông tin đã thu thập thành dạng thích hợp cho việc phân tích trên máy tính • Nguyên tắc • Thông tin từng đối tượng thể hiện trong một hàng • Mỗi cột ứng với một câu hỏi trong công cụ thu thập • Mỗi câu trả lời được mã hóa trên một ô của bảng tính • Câu trả lời được mã hóa bằng số, hạn chế bằng chữ 24 V.D: MÃ HÓA SỐ LIỆU 25 V .D : M Ã H Ó A S Ố L IỆ U Mô tả Giá trị - ý nghĩa Tuổi 1 – 01-30 2 – 31-60 3 – 61-99 Giới tính 1 – Nam 2 – Nữ 3 – Khác Trình độ học vấn 1 – Không biết chữ 2 – Tiểu học 3 – Trung học cơ sở 4 – Trung học phổ thông 5 – Trung cấp nghề 6 – Đại học 7 – Sau đại học 9 – Không trả lời 26 NHẬP SỐ LIỆU ▪Mục đích • Cung cấp bộ dữ liệu phục vụ cho việc phân tích ▪Nguyên tắc • Kiểm tra sự lặp lại hoặc các giá trị không có ý nghĩa • Hạn chế đến mức thấp nhất các lỗi nhập liệu • Chọn chiến lược nhập liệu phù hợp và làm sạch dữ liệu ▪Phương pháp • Nhập liệu, kiểm tra và xử lý một số lỗi trên Excel • Chuyển dữ liệu từ Excel sang SPSS để phân tích 27 CÁC CHIẾN LƯỢC NHẬP LIỆU ▪Nhập toàn bộ số liệu 2 lần bởi 2 người độc lập ▪Nhập toàn bộ số liệu 2 lần bởi cùng 1 người ▪Nhập số liệu 1 lần, và nhập 20% ngẫu nhiên lần 2 ▪Nhập toàn bộ số liệu 1 lần duy nhất 28 GIỚI THIỆU1 CÁC CÔNG CỤ PHÂN TÍCH DỮ LIỆU2 ỨNG DỤNG SPSS3 CÁC PHẦN MỀM THÔNG DỤNG ▪MS Excel ▪SPSS ▪EViews ▪Stata ▪R 30 MS EXCEL ▪MS Excel sử dụng rộng rãi trong kế toán, phân tích thống kê, phân tích kinh doanh ▪Đặc điểm • Thực hiện nhiều phép tính phức tạp • Thư viện hàm phong phú, chuyên sâu về thống kê • Tích hợp nhiều công cụ phân tích, xử lý số liệu • Chức năng quản trị cơ sở dữ liệu, biểu đồ 31 CÁC CÔNG CỤ EXCEL ▪Goal Seek ▪Data Table ▪Solver ▪Scenario Manager ▪Analysis ToolPak ▪Currency Tool ▪VBA 32 SPSS ▪SPSS (Statistical Package for the Social Sciences) ▪Phần mềm thống kê được sử dụng rộng rãi trong các nghiên cứu điều tra xã hội học và kinh tế lượng ▪Đặc điểm ▪Phát triển từ 1968 tại Đại học Stanford, thương mại từ 1975, IBM mua lại 2009 ▪Hoạt động trên Windows, Mac OS, Linux, Unix ▪Phiên bản mới nhất (02/2018): SPSS 25 33 ƯU VÀ NHƯỢC ĐIỂM CỦA SPSS ▪Ưu điểm • Giao diện thân thiện, dễ sử dụng • Thực hiện thao tác tính toán đơn giản • Hỗ trợ xử lý và phân tích dữ liệu • Có thế mạnh về phân tích nhân tố, phương sai, hồi quy • Khả năng lập bảng biểu dữ liệu, báo cáo đa dạng, linh hoạt ▪Nhược điểm • Không có khả năng lập trình • Không cho phép xử lý cùng lúc nhiều tập tin dữ liệu • Thiếu một số chức năng phân tích thống kê chuyên sâu 34 EVIEWS ▪EViews (Econometric Views) ▪Phần mềm kinh tế lượng ▪Đặc điểm • Sử dụng các dữ liệu có sẵn - dữ liệu thứ cấp • Dùng cho dữ liệu chuỗi, dữ liệu chéo, dữ liệu mảng • Thao tác linh hoạt, quản lý dễ dàng, kết quả nhanh • Phiên bản mới nhất (02/2018): EViews 10 35 CÁC ỨNG DỤNG EVIEWS ▪Thống kê mô tả dữ liệu ▪Phân tích tác động của các yếu tố kinh tế ▪Dự báo cho tương lai yếu tố cần nghiên cứu ▪Thực hiện xếp hạng tín dụng trong ngân hàng ▪Tính giá trị rủi ro cổ phiếu dựa trên tỉ suất sinh lời ▪Phân tích tương quan giữa các yếu tố kinh tế 36 STATA ▪STATA (Data Analysis and Statistical Software) • Phần mềm sử dụng trong kinh tế lượng và thống kê ▪Đặc điểm • Kết hợp tính dễ sử dụng với sức mạnh thống kê • Thực hiện thao tác bằng lệnh, soạn thảo chương trình • Không cho phép xử lý cùng lúc nhiều tập tin dữ liệu • Mạnh về phân tích hồi qui • Phiên bản mới nhất (02/2018): Stata 16 37 CÁC ỨNG DỤNG STATA ▪Quản lý dữ liệu ▪Phân tích thống kê ▪Vẽ đồ thị ▪Mô phỏng ▪Hiệu chỉnh chức năng 38 R39 GIỚI THIỆU1 CÁC CÔNG CỤ PHÂN TÍCH DỮ LIỆU2 ỨNG DỤNG SPSS3 TỔNG QUAN VỀ SPSS ▪Khởi động SPSS ▪Giao diện SPSS ▪Tập tin SPSS ▪Làm việc với Data ▪Làm việc với Viewer ▪Tiếng Việt trong SPSS ▪Thay đổi mặc định của chương trình 41 KHỞI ĐỘNG SPSS 42 Mở hướng dẫn sử dụng Mở Data Editor Thực hiện Script có sẵn Tạo Script mới Mở file dữ liệu có sẵn Mở file không phải SPSS GIAO DIỆN SPSS • Data Editor dạng bảng tính để định nghĩa, nhập, hiệu chỉnh và thể hiện dữ liệu • Viewer thể hiện kết quả phân tích dữ liệu • Multidimention pivot table kết quả dạng bảng trụ • High revolution graphics kết quả phân tích dạng đồ thị • Database access truy xuất dữ liệu CSDL bên ngoài SPSS • Data transformation biến đổi dữ liệu gốc cho phù hợp với mục đích nghiên cứu 43 V.D., GIAO DIỆN SPSS 44 GIAO DIỆN SPSS (THỰC ĐƠN) ▪Data • Định nghĩa đặc trưng của biến; kiểm tra tính hợp lệ của dữ liệu; sắp xếp, biến đổi biến/quan sát; phân tách/kết hợp các tập tin dữ liệu 45 GIAO DIỆN SPSS (THỰC ĐƠN) ▪Transform • Tạo biến mới từ biến có sẵn; thiết lập các chuỗi dữ liệu thời gian; xử lý các trường hợp quan sát thiếu dữ liệu 46 GIAO DIỆN SPSS (THỰC ĐƠN) ▪Analyze • Các công cụ phân tích dữ liệu (phân tích thống kê mô tả, kiểm định trung bình tổng thể, phân tích tương quan, phân tích hồi quy, kiểm định tham số/phi tham số) 47 GIAO DIỆN SPSS (THỰC ĐƠN) ▪Graphs • Xây dựng các loại biểu đồ 48 LÀM VIỆC VỚI TẬP TIN SPSS ▪Tạo mới tập tin SPSS ▪Mở tập tin SPSS có sẵn ▪Lưu tập tin SPSS 49 Spss1.sav Spss2.spv CÁC LOẠI TẬP TIN DỮ LIỆU SPSS • Các định dạng tập tin SPSS • Dữ liệu: *.sav hoặc *.sys • Cú pháp: *.sps • Kết quả: *.spv • Script: *.wwd hoặc *.sbs. • SPSS còn đọc tập tin từ các định dạng khác • *.xls (Excel) • *.txt (Text) • *.dta (Stata) • *.wf1 (EViews)... 50 TẠO TẬP TIN MỚI • Khởi động SPSS Type in Data OK • Từ cửa sổ hiện có SPSS File New Data 51 MỞ TẬP TIN CÓ SẴN • Nhấn hai lần vào biểu tượng của tập tin SPSS • Khởi động SPSS Open an existing OK • Từ cửa sổ hiện có SPSS File Open Data 52 V.D., MỞ TẬP TIN TỪ EXCEL LƯU TẬP TIN • Tập tin đang mở Ctrl + S • Tập tin mới File Save Save File As tên tập tin 54 LÀM VIỆC VỚI DATA EDITOR ▪Data Editor thể hiện như một bảng tính: • Data View thể hiện trị số dữ liệu thực hoặc các nhãn trị số được xác định • Variable View thể hiện thông tin định nghĩa biến —Nhãn biến, nhãn trị số biến, loại dữ liệu, thang đo, và các trị số khuyết thiếu 55 DATA VIEW 56 HIỆU CHỈNH DỮ LIỆU - DATA VIEW ▪Thay đổi trị số của dữ liệu ▪Cắt, sao chép, dán các trị số ▪Thêm/xóa các đối tượng ▪Thêm/xóa các biến ▪Thay đổi trật tự các biến 57 VARIABLE VIEW 58 CÁC QUY TẮC KHAI BÁO BIẾN ▪Tên biến ▪Kiểu dữ liệu ▪Nhãn trị số của biến 59 Name Label TÊN BIẾN • Tên bắt đầu bằng một ký chữ, các ký tự còn lại có thể là chữ, số, hoặc ký tự đặc biệt (@, #, _, $), và không kết thúc bởi dấu chấm (.) • Biến không trùng lắp, không phân biệt chữ hoa/thường • Độ dài biến không quá 8 ký tự 60 KIỂU DỮ LIỆU • Xác định loại dữ liệu với từng biến • Mặc định là kiểu số (chiều dài 8, 2 số thập phân) 61 NHÃN TRỊ SỐ CỦA BIẾN • Chỉ định nhãn mô tả đối với từng trị số của biến • Nhãn chỉ số của biến có chiều dài tối đa 60 62 LÀM VIỆC VỚI VIEWER ▪Mục đích • Thể hiện kết quả ứng với thao tác/thủ tục trên dữ liệu ▪Các tính năng của Viewer • Hỗ trợ xem kết quả thao tác trên dữ liệu • Điều khiển cách thức hiển thị kết quả • Lưu kết quả tài liệu theo tổ chức, định dạng thích hợp 63 V.D: SPSS VIEWER 64 THAY ĐỔI MẶC ĐỊNH CHƯƠNG TRÌNH • Edit Options Thay đổi thông số Apply OK 65 những bước chập chững vào thế giới số XỬ LÝ DỮ LIỆU TRÊN BIẾN 1. Mã hóa biến với Recode 2. Chuyển định dạng của biến với Count value 3. Tính toán giá trị của biến với Compute 4. Xử lý câu hỏi có nhiều lựa chọn trả lời... 66 những bước chập chững vào thế giới số 1. MÃ HÓA BIẾN (RECODE) • Mục đích • Biến đổi trị số dữ liệu bằng cách mã hóa lại • Điều kiện áp dụng • Giảm số biểu hiện của 1 biến định tính xuống chỉ còn 2/3 loại biểu hiện cơ bản • Chuyển biến định lượng thành biến định tính. 67 những bước chập chững vào thế giới số MÃ HÓA BIẾN (TT) • Quy trình thực hiện • Transform Recode Into Different Variables • Chọn biến muốn mã hóa lại • Đặt tên cho biến mới Name Change • Giá trị cho biến cũ và mới Old and New Values Add Continute OK 68 những bước chập chững vào thế giới số V.D: MÃ HÓA BIẾN VỚI RECODE (SPSS) những bước chập chững vào thế giới số V.D., THIẾT LẬP GIÁ TRỊ BIẾN MỚI những bước chập chững vào thế giới số 2. CHUYỂN ĐỊNH DẠNG BIẾN (COUNT VALUE) • Mục đích • Chuyển biến dạng Category nhiều trị số thành biến dạng Dichotomy có 2 trị số 71 •Ví dụ • Payroll biến phân loại, cho biết tên ngân hàng quản lý tài khoản lương của người được hỏi • ABC_Payroll biến phân loại, cho biết người được hỏi có nhận lương qua ngân hàng ABC hay không... những bước chập chững vào thế giới số CHUYỂN ĐỊNH DẠNG BIẾN (TT) • Quy trình thực hiện • Transform Count Value within Cases • Khai báo tên và nhãn của biến muốn phân loại • Cung cấp Category có liên quan tới Dichotomy • Define Value Cung cấp trị số mã hóa của Category có liên quan tới Dichotomy • Gán tên các giá trị của biến Dichotomy 72 những bước chập chững vào thế giới số CHUYỂN ĐỊNH DẠNG BIẾN VỚI COUNT VALUE 73 những bước chập chững vào thế giới số 3. TÍNH TOÁN GIÁ TRỊ (COMPUTE) • Mục đích • Rút ngắn thời gian nhập liệu và gán giá trị cho biến • Điều kiện áp dụng • Tạo biến mới không điều kiện • Tạo biến mới từ các cấu trúc của các biến đã nhập 74 •Ví dụ • Tính giá trị trung bình của các biến FE1, FE2, FE3, FE4 những bước chập chững vào thế giới số TÍNH TOÁN GIÁ TRỊ (TT) • Quy trình thực hiện • Transform Compute • Chọn các biến muốn tính toán • Target Variable Type & Label đặt tên biến mới • Numeric Expression nhập giá trị gán cho biến mới • If Include if case satisfies condition để thiết đặt điều kiện biến 75 những bước chập chững vào thế giới số TÍNH TOÁN GIÁ TRỊ VỚI COMPUTE (SPSS) những bước chập chững vào thế giới số 4. CÂU HỎI NHIỀU LỰA CHỌN TRẢ LỜI • Mục đích • Mã hóa câu hỏi có nhiều lựa chọn trả lời • Điều kiện áp dụng • Đây là trường hợp phức tạp và cần thực hiện nhi ... ị trung bình của 2 nhóm tổng thể 3. So sánh trị trung bình nhiều nhóm tổng thể 144 những bước chập chững vào thế giới số ▪Một số yêu cầu về dữ liệu: • Các biến liên tục (thang đo khoảng/tỷ lệ) • Các quan sát độc lập • Các biến có phân phối chuẩn • Phương sai đồng nhất • Không có trường hợp bất thường KIỂM ĐỊNH TRUNG BÌNH TỔNG THỂ 145 những bước chập chững vào thế giới số 1. KIỂM ĐỊNH TRUNG BÌNH 1 TỔNG THỂ ▪Bước 1: Giả thuyết Ho: “Giá trị trung bình của tổng thể bằng giá trị cho trước” ▪Bước 2: Lọc các trường hợp thỏa điều kiện (nếu có)... ▪Bước 3: Thực hiện kiểm định One-Sample T-Test ▪Bước 4: So sánh p-value (Sig.) với giá trị • Sig. > : Chấp nhận Ho • Sig. : Bác bỏ Ho 146 One-Sample T-Test những bước chập chững vào thế giới số 1. KIỂM ĐỊNH TRUNG BÌNH 1 TỔNG THỂ • Ví dụ: Kiểm định giả thuyết “Độ tuổi trung bình của khách hàng trả lương qua thẻ VCB là 35” • Quy trình thực hiện ─ Select Case lọc các trường hợp trả lương qua thẻ VCB ─ Analyze Compare Means One-Sample T- Test ─ Cung cấp biến kiểm định, giá trị trung bình kỳ vọng ─ Chọn độ tin cậy 147 những bước chập chững vào thế giới số V.D., KIỂM ĐỊNH TRUNG BÌNH 1 TỔNG THỂ 148 Giả thuyết H0: Tuổi trung bình của chủ thẻ lương VCB là 35 những bước chập chững vào thế giới số KIỂM ĐỊNH TRUNG BÌNH 1 TỔNG THỂ (SPV) 149 Số lượng quan sát Giá trị trung bình Giá trị kiểm định t Mức ý nghĩa = 0.00 < 0.05 Bác bỏ giả thuyết H0 KẾT LUẬN: Tuổi trung bình của chủ thẻ lương VCB trên 35 Giả thuyết H0: Tuổi trung bình của chủ thẻ lương VCB là 35 những bước chập chững vào thế giới số 2. KIỂM ĐỊNH TRUNG BÌNH 2 TỔNG THỂ a. Mẫu độc lập (Independent) b. Mẫu phụ thuộc hoặc theo từng cặp (Paired) 150 những bước chập chững vào thế giới số TRUNG BÌNH CỦA 2 TỔNG THỂ - ĐỘC LẬP ▪Bước 1: Giả thuyết Ho: “Giá trị trung bình của 2 biến tổng thể là như nhau” ▪Bước 2: Thực hiện Independent-Samples T-Test Independent-Sample T-Test 151 những bước chập chững vào thế giới số TRUNG BÌNH CỦA 2 TỔNG THỂ - ĐỘC LẬP ▪Bước 3: Tìm Sig. với kiểm định sự bằng nhau của 2 phương sai tổng thể Levene: • Nếu Sig. < thì phương sai giữa 2 nhóm là khác nhau dùng kết quả “Equal variances not assumed” • Nếu Sig. thì phương sai giữa 2 nhóm là bằng nhau dùng kết quả “Equal variances assumed” ▪Bước 4: So sánh Sig. của kiểm định t ở bước 3 với : • Sig. > : Chấp nhận Ho • Sig. : Bác bỏ Ho 152 những bước chập chững vào thế giới số TRUNG BÌNH CỦA 2 TỔNG THỂ - ĐỘC LẬP • Ví dụ: Kiểm định giả thuyết “Tuổi trung bình của khách hàng nam và nữ là ngang nhau” • Quy trình thực hiện – Analye Compare Means Independent- samples T Test – Cung cấp các biến định lượng (tính trung bình), biến định tính (phân thành 2 nhóm độc lập) – Chỉ định 2 nhóm cần so sánh... 153 những bước chập chững vào thế giới số V.D., TRUNG BÌNH CỦA 2 TỔNG THỂ - ĐỘC LẬP 154 những bước chập chững vào thế giới số TRUNG BÌNH CỦA 2 TỔNG THỂ - ĐỘC LẬP (SPV) 155 Kiểm định sự bằng nhau về phương sai của 2 mẫu (Levenve’s Test) Sig. < 5% phương sai 2 mẫu khác nhau “Equal variances not assumed” Sig. > 5% phương sai 2 mẫu bằng nhau “Equal variances assumed” Giả thuyết H0: Tuổi trung bình giữa nam và nữ là bằng nhau những bước chập chững vào thế giới số TRUNG BÌNH CỦA 2 TỔNG THỂ - ĐỘC LẬP (SPV) 156 Kết quả kiểm định sự bằng nhau về trị trung bình của 2 mẫu Sig. > 5% phương sai 2 mẫu bằng nhau “Equal variances assumed” KẾT LUẬN: Tuổi trung bình giữa nam và nữ là khác nhau Mức ý nghĩa = 0.00 < 0.05 Bác bỏ giả thuyết H0 những bước chập chững vào thế giới số TRUNG BÌNH CỦA 2 TỔNG THỂ - TỪNG CẶP ▪Bước 1: Giả thuyết Ho: “Không có sự khác nhau về trị 2 trung bình tổng thể” (Khác biệt giữa 2 trung bình là bằng 0) ▪Bước 2: Thực hiện Paired-Samples T-Test ▪Bước 3: So sánh Sig. của kiểm định t ở bước 2 với : • Sig. > : Chấp nhận Ho • Sig. : Bác bỏ Ho Paired-Sample T-Test 157 những bước chập chững vào thế giới số TRUNG BÌNH CỦA 2 TỔNG THỂ - TỪNG CẶP • Ví dụ: Cảm nhận của khách hàng trước và sau khi ngân hàng triển khai cam kết chất lượng dịch vụ (SLA) • Quy trình thực hiện ─ Analye Compare Means Paired-Samples T-Test ─ Cung cấp cặp biến phối hợp ─ Điều chỉnh độ tin cậy (nếu cần)... 158 những bước chập chững vào thế giới số V.D., TRUNG BÌNH CỦA 2 TỔNG THỂ - TỪNG CẶP 159 những bước chập chững vào thế giới số TRUNG BÌNH CỦA 2 TỔNG THỂ - TỪNG CẶP (SPV) 160 Giả thuyết H0: Cảm nhận của khách hàng là không đổi KẾT LUẬN: Cảm nhận của khách hàng có thay đổi Mức ý nghĩa = 0.00 < 0.05 Bác bỏ giả thuyết H0 những bước chập chững vào thế giới số những bước chập chững vào thế giới số PHÂN TÍCH TƯƠNG QUAN Tương quan 2 biến (Bivariate) 1. Tương quan Pearson 2. Tương quan Spearman 162 những bước chập chững vào thế giới số 1. TƯƠNG QUAN 2 BIẾN ▪Tương quan Pearson • Áp dụng trong trường hợp mẫu có phân phối chuẩn • Lượng hóa mối liên hệ tuyến tính giữa 2 biến định lượng • Mối liên hệ giữa 2 biến có thể [-1, 1] – r > 0: liên hệ tuyến tính thuận – r < 0: liên hệ tuyến tính nghịch – r = 0: không có liên hệ hoặc liên hệ phi tuyến • Mối liên hệ này có tính chất đối xứng. 163 r những bước chập chững vào thế giới số ▪Hệ số tương quan giữa hai biến x và y: 𝑟𝑥𝑦 = 𝑐𝑜𝑣(𝑥, 𝑦) 𝑣𝑎𝑟 𝑥 ∗ 𝑣𝑎𝑟 𝑦 Trong đó: – cov(x,y): hiệp phương sai của x và y – var(x): phương sai của x – var(y): phương sai của y 164 TƯƠNG QUAN 2 BIẾN những bước chập chững vào thế giới số r = –0.90 r = 0.00 r = 0.90 TƯƠNG QUAN 2 BIẾN 165 những bước chập chững vào thế giới số A. TƯƠNG QUAN PEARSON ▪Giả thuyết: H0 và H1, và hệ số tương quan (r) • Kiểm định 2 phía (two-tailed) – H0: r = 0 - không có mối tương quan – H1: r ≠ 0 - có mối tương quan • Kiểm định 1 phía (one-tailed) ─ H0: r = 0 - không có mối tương quan ─ H1: r > 0 - có mối tương quan thuận ─ H1: r < 0 - có mối tương quan nghịch 166 những bước chập chững vào thế giới số ▪Một số yêu cầu về dữ liệu: • 2 biến liên tục (thang đo khoảng/tỷ lệ) • Các quan sát có giá trị trên cả 2 biến • Các quan sát độc lập • Các biến có phân phối chuẩn • Không có trường hợp bất thường TƯƠNG QUAN PEARSON 167 những bước chập chững vào thế giới số TƯƠNG QUAN PEARSON ▪Ví dụ, • Mục tiêu nghiên cứu: Có mối quan hệ như thế nào giữa độ tuổi và thu nhập. • Câu hỏi nghiên cứu: Độ tuổi và thu nhập có mối quan hệ với nhau hay không? • Các biến: Độ tuổi và thu nhập (2 biến định lượng). • H0: “Độ tuổi và thu nhập không có liên hệ với nhau” những bước chập chững vào thế giới số TƯƠNG QUAN PEARSON • Quy trình thực hiện ─Analyze Correlate Bivariate ─Chọn biến vào Variables ─Tại Correlation Coefficients Pearson Test of Significance OK 169 những bước chập chững vào thế giới số V.D., TƯƠNG QUAN PEARSON 170 những bước chập chững vào thế giới số V.D., TƯƠNG QUAN PEARSON (SPV) Hệ số tương quan giữa 2 biến là r = 0.670 H0: Độ tuổi và thu nhập không có liên hệ với nhau KẾT LUẬN: Độ tuổi và thu nhập có liên hệ với nhau Mức ý nghĩa sig. = 0.000 < 0.05 Bác bỏ giả thuyết H0 171 những bước chập chững vào thế giới số B. TƯƠNG QUAN SPEARMAN ▪ Tương quan - Spearman • Rank Correlation Coefficient • Áp dụng trong trường hợp tổng thể không có phân phối chuẩn 172 những bước chập chững vào thế giới số những bước chập chững vào thế giới số PHÂN TÍCH HỒI QUY 1.Hồi quy tuyến tính đơn biến 2.Hồi quy tuyến tính đa biến (bội) 174 𝑌 = 𝛽0 + σ(𝛽𝑖 ∗ 𝑋𝑖) những bước chập chững vào thế giới số PHÂN TÍCH HỒI QUY ▪Mô hình hóa mối quan hệ tuyến tính giữa 1 biến phụ thuộc (Y) với nhiều biến độc lập (𝑋𝑖) ▪Không có tính đối xứng như tương quan • Ví dụ, Các yếu tố ảnh hưởng đến chất lượng KTX BUH... 175 những bước chập chững vào thế giới số 1. HỒI QUY TUYẾN TÍNH ĐƠN • Mô hình tổng quát Trong đó – 𝑌𝑖: giá trị dự đoán thứ i của biến phụ thuộc – 𝑋𝑖: giá trị quan sát thứ i của biến độc lập – 𝛽0 và 𝛽1: các hệ số hồi quy - theo phương pháp OLS – 𝜀𝑖: phần dư, biến độc lập ngẫu nhiên N(0,2) 176 𝒀𝒊 = 𝜷𝟎 + 𝜷𝟏 ∗ 𝑿𝒊 +𝜺𝒊 những bước chập chững vào thế giới số V.D: ĐỒ THỊ HỒI QUY TUYẾN TÍNH ĐƠN 177 Y X những bước chập chững vào thế giới số HỒI QUY TUYẾN TÍNH ĐƠN ▪Một số giả định và yêu cầu về dữ liệu • 2 biến liên tục (thang đo khoảng/tỷ lệ) • Các quan sát có giá trị trên cả 2 biến • Tồn tại quan hệ tuyến tính giữa 2 biến • Các giá trị của Y độc lập với nhau • Phân phối chuẩn của Y với phương sai không đổi • Các giá trị trung bình 𝜇 𝑌 𝑋 nằm trên đường thẳng • Phần dư có phân phối chuẩn 178 những bước chập chững vào thế giới số HỒI QUY TUYẾN TÍNH ĐƠN • Quy trình thực hiện ─Analyze Regression Linear ─Chọn biến vào Dependent và Independent ─Kiểm định các giả định Statistics ─Biểu đồ Plots OK 179 những bước chập chững vào thế giới số V.D: HỒI QUY TUYẾN TÍNH ĐƠN 180 những bước chập chững vào thế giới số V.D., HỒI QUY TUYẾN TÍNH ĐƠN (SPV) Đo lường mức độ phù hợp của mô hình đối với mẫu (R2) Mức độ phù hợp của mô hình với tổng thể (F lớn, sig. < 0.05) Mức ý nghĩa của các hệ số hồi quy sig. = 0.00 < 0.05 Hệ số hồi quy 𝒀𝒊 = 𝟎. 𝟗𝟕𝟒 + 𝟎. 𝟐𝟑𝟐 ∗ 𝑿𝒊 + 𝜺 Phương pháp nhập một lần những bước chập chững vào thế giới số HỒI QUY TUYẾN TÍNH ĐƠN (SPV) ▪Variables Entered/Removed • Model: cho phép chạy nhiều mô hình mỗi lần thực hiện hồi quy, cột Model là số thứ tự của mô hình. • Variables Entered: cho phép nhập các biến vào theo khối (blocks) và thực hiện hồi quy theo từng bước (stepwise) • Variables Removed: liệt kê các biến bị loại bỏ khỏi hồi quy, cột này thường trống trừ khi thực hiện hồi quy theo từng bước. • Method: phương pháp. V.d., từng bước, nhập một lần những bước chập chững vào thế giới số ▪Model Summary • Model: số thứ tự của mô hình hồi quy • R: tương quan giữa biến độc lập và biến phụ thuộc • R-Squared: mức độ biến thiên của biến phụ thuộc được giải thích bởi biến độc lập • Adjusted R-Square: mức độ biến thiên của biến phụ thuộc được giải thích bởi biến độc lập – V.d., 44.8% (R2 = 0.448) sự biến thiên của chất lượng KTX được giải thích bởi chất lượng nhân viên KTX. HỒI QUY TUYẾN TÍNH ĐƠN (SPV) những bước chập chững vào thế giới số • R-Squared tăng khi thêm 1 biến độc lập (X) vào mô hình, dù biến thêm vào không có ý nghĩa thống kê • Adjusted R-Squared chỉ tăng khi biến độc lập (X) có ý nghĩa thống kê và ảnh hưởng đến biến phụ thuộc (Y) • R-Squared không có giá trị âm • Adjusted R-Squared có thể âm khi R-Squared gần giá trị 0 R2 VÀ R2 HIỆU CHỈNH R2 184 những bước chập chững vào thế giới số ▪ANOVA • Sum of squares: tổng bình phương • df: bậc tự do, Residual = n – 1 • Mean Square: Sum of Squares/df • F và Sig.: kiểm định F và p-value – F = Mean Square (Regression)/Mean Square (Residual). – Giả thuyết H0: “tất cả các hệ số hồi quy của mô hình bằng 0” – Sig. < α: mô hình hồi quy có ý nghĩa thống kê. HỒI QUY TUYẾN TÍNH ĐƠN (SPV) những bước chập chững vào thế giới số ▪Coefficients • B: các hệ số hồi quy tuyến tính. • Std. Error: sai số chuẩn cho các hệ số • Beta: các hệ số được chuẩn hóa. • t và Sig.: Kiểm định t và p-value ─ Sig. > α: không có ý nghĩa thống kê (loại bỏ b/beta tương ứng) ─ Sig. < α: có ý nghĩa thống kê (giữ lại b/beta tương ứng) HỒI QUY TUYẾN TÍNH ĐƠN (SPV) những bước chập chững vào thế giới số những bước chập chững vào thế giới số 2. HỒI QUY TUYẾN TÍNH BỘI • Mô hình tổng quát Trong đó – 𝑌𝑖: giá trị dự đoán thứ i của biến phụ thuộc – Xk𝑖: giá trị quan sát thứ i của biến độc lập thứ k – 𝑖: các hệ số hồi quy riêng phần - theo phương pháp OLS – 𝜀𝑖: phần dư, biến độc lập ngẫu nhiên N(0,2). 188 𝒀𝒊 = 𝜷𝟎 + 𝜷𝟏 ∗ 𝑿𝟏𝒊 + 𝜷𝟐 ∗ 𝑿𝟐𝒊 +⋯+ 𝜷𝐩 ∗ 𝑿𝐩𝒊 + 𝜺𝒊 những bước chập chững vào thế giới số HỒI QUY TUYẾN TÍNH BỘI ▪Một số giả định và yêu cầu về dữ liệu • Các biến độc lập - phụ thuộc liên tục (thang đo khoảng/tỷ lệ) • Các quan sát có giá trị độc lập • Tồn tại quan hệ tuyến tính giữa các biến độc lập - phụ thuộc • Các giá trị của Y độc lập với nhau • Phân phối chuẩn của Y với phương sai không đổi • Không tồn tại đa cộng tuyến giữa các biến độc lập • Phần dư có phân phối chuẩn 189 những bước chập chững vào thế giới số V.D: HỒI QUY TUYẾN TÍNH BỘI • Xác định mức độ tác động của các yếu tố có ảnh hưởng đến ý định mua nước hoa ở TP. HCM. 190 Các yếu tố nhân khẩu học Tính hữu dụng Ý định mua hàng Chất lượng thông tin Sự tin cậy của thông tin Nhu cầu thông tin H1+ H2+ H3+ H4+ H5 những bước chập chững vào thế giới số ▪Quy trình thực hiện A. Xem xét ma trận hệ số tương quan B. Xây dựng phương trình hồi quy C. Kiểm định các giả thuyết D. Giải thích các hệ số hồi quy E. Xác định tầm quan trọng của các biến F. Lựa chọn các biến độc lập cho mô hình G. Dò tìm các vi phạm giả định cần thiết [5] 191 HỒI QUY TUYẾN TÍNH BỘI những bước chập chững vào thế giới số A. MA TRẬN HỆ SỐ TƯƠNG QUAN 192 những bước chập chững vào thế giới số MA TRẬN HỆ SỐ TƯƠNG QUAN (SPV) 193 Hệ số tương quan giữa hai biến độc lập thấp & không có ý nghĩa Hệ số tương quan giữa biến phụ thuộc và các biến độc lập tương đối cao & có ý nghĩa KẾT LUẬN: Có thể sử dụng các biến độc lập trong mô hình những bước chập chững vào thế giới số B. XÂY DỰNG MÔ HÌNH HỒI QUY 194 • Quy trình thực hiện ─Analyze Regression Linear ─Chọn biến vào Dependent và các biến Independent ─Kiểm định các giả định Statistics ─Biểu đồ Plots OK những bước chập chững vào thế giới số XÂY DỰNG MÔ HÌNH HỒI QUY 195 những bước chập chững vào thế giới số PHƯƠNG TRÌNH HỒI QUY Hệ số xác định tổng thể R2 = 0.717, nên các biến độc lập giải thích được khoảng 71,7 % sự biến thiên của biến phụ thuộc 𝒀 = 2. 𝟐𝟑𝟐 + 𝟎. 𝟏𝟏𝟓 ∗ 𝑿𝟏 + 𝟎. 𝟔𝟕𝟕 ∗ 𝑿𝟐 + 𝜺 196 Hệ số hồi quy những bước chập chững vào thế giới số C. KIỂM ĐỊNH CÁC GIẢ THUYẾT (SPV) Mức độ phù hợp của mô hình với tổng thể (F lớn, sig. < 0.05) Các biến đều có ý nghĩa trong mô hình (sig. < 0.05) KẾT LUẬN: Các giả thuyết đều được ủng hộ (không bác bỏ) 197 những bước chập chững vào thế giới số E. TẦM QUAN TRỌNG CÁC BIẾN (SPV) 198 Xác định tầm quan trọng của các biến trong mô hình những bước chập chững vào thế giới số TẦM QUAN TRỌNG CÁC BIẾN (SPV) 199 2 biến này có ảnh hưởng đối với mô hình lớn hơn các biến còn lại những bước chập chững vào thế giới số F. LỰA CHỌN CÁC BIẾN ĐỘC LẬP ▪Mục đích • Lựa chọn hiệu quả các biến đưa vào mô hình ▪Thực hiện • Tăng dần số lượng các biến và kiểm tra mức độ phù hợp của mô hình 200 những bước chập chững vào thế giới số LỰA CHỌN CÁC BIẾN ĐỘC LẬP 201 Lựa chọn các biến độc lập những bước chập chững vào thế giới số LỰA CHỌN CÁC BIẾN ĐỘC LẬP (SPV) KẾT LUẬN: Mô hình 2 biến tốt hơn hẳn so với mô hình 1 biến Hệ số xác định tổng thể (R2) thay đổi F2 >> F1 những bước chập chững vào thế giới số G. HIỆN TƯỢNG ĐA CỘNG TUYẾN 203 Xem xét hiện tượng đa cộng tuyến (VIF) những bước chập chững vào thế giới số HIỆN TƯỢNG ĐA CỘNG TUYẾN (SPV) KẾT LUẬN: Không xảy ra hiện tượng đa cộng tuyến Nếu VIF < 10: Các biến độc lập không có tương quan với nhau những bước chập chững vào thế giới số Q&A 206 HẾT
File đính kèm:
- bai_giang_tin_hoc_ung_dung_phan_2_tin_hoc_ung_dung_trong_kin.pdf