Bài giảng Nghiên cứu khoa học - Chương 4: Xử lý và phân tích dữ liệu - Nguyễn Thị Minh Thu
Khái niệm và lợi ích hiệu chỉnh và mã
hóa dữ liệu
• Hiệu chỉnh là kiểm tra dữ liệu và thông tin theo yêu cầu
• Mã hóa là thay đổi số liệu ‘nguyên thủy’ về một dạng
ngắn gọn hơn để có thể lưu trong máy tính và xử lý
được dễ dàng bằng các mã số hoặc ký hiệu thích hợp
(Xây dựng bộ mã hóa).
• Các lợi ích của mã hóa dữ liệu
- Giảm công suất, không gian lưu trữ
- Nếu mã hóa số lượng vừa phải có thể giúp nâng cao giá
trị của số liệu
- Giúp cho các phương pháp phân tích định lượng
Bạn đang xem 20 trang mẫu của tài liệu "Bài giảng Nghiên cứu khoa học - Chương 4: Xử lý và phân tích dữ liệu - Nguyễn Thị Minh Thu", để tải tài liệu gốc về máy hãy click vào nút Download ở trên
Tóm tắt nội dung tài liệu: Bài giảng Nghiên cứu khoa học - Chương 4: Xử lý và phân tích dữ liệu - Nguyễn Thị Minh Thu
CHƯƠNG 4 XỬ LÝ VÀ PHÂN TÍCH DỮ LIỆU NGUYỄN THỊ MINH THU NỘI DUNG 4.1. Xử lý dữ liệu 4.2. Một số phương pháp phân tích dữ liệu 4.3. Trình bày kết quả xử lý và phân tích 4.1. Xử lý dữ liệu 4.1.1. Hiệu chỉnh và mã hóa dữ liệu 4.1.2. Đánh giá chất lượng dữ liệu 4.1.3. Xác định các mối liên hệ 3 3 4.1.1. Hiệu chỉnh và mã hóa dữ liệu 4 a) Khái niệm và lợi ích hiệu chỉnh và mã hóa dữ liệu • Hiệu chỉnh là kiểm tra dữ liệu và thông tin theo yêu cầu • Mã hóa là thay đổi số liệu ‘nguyên thủy’ về một dạng ngắn gọn hơn để có thể lưu trong máy tính và xử lý được dễ dàng bằng các mã số hoặc ký hiệu thích hợp (Xây dựng bộ mã hóa). • Các lợi ích của mã hóa dữ liệu - Giảm công suất, không gian lưu trữ - Nếu mã hóa số lượng vừa phải có thể giúp nâng cao giá trị của số liệu - Giúp cho các phương pháp phân tích định lượng 5 b) Kỹ thuật mã hóa dữ liệu Lựa chọn mã hóa, thang đo gắn cho từng dữ liệu • Các loại thang đo: • Định danh/danh nghĩa (Norminal Scale) • Thứ bậc (Ordinal Scale) • Khoảng (Interval Scale) • Tỷ lệ (Ratio Scale) • Các mã số: Đánh dấu, ký hiệu, cho điểm • Lựa chọn số lượng và giới hạn của từng hành vi của thông tin. • Gắn thang đo, mã số cho từng hành vi của thông tin 6 c) Những chú ý khi mã hóa dữ liệu • Người sử dụng cần phải biết mã của dữ liệu • Nếu người sử dụng không biết mã của số liệu thì không thể phân tích được • Thí dụ Mã hóa thông tin về giới: 1 là nam; 2 là nữ • Mức độ chính xác của dữ liệu mã hóa • Ví dụ: Mã hóa thông tin về mức độ kinh tế Hộ giàu: thu nhập/1 người > 2,5 triệu/tháng; Hộ nghèo: < 0,5 triệu/tháng • Mã hóa thường thể hiện bằng số • Ví dụ: Nghèo 1, Cận nghèo 2, Khá 3, Giàu 4 7 4.1.2. Đánh giá chất lượng dữ liệu 8 a) Thế nào là đánh giá chất lượng số liệu • Tại sao số liệu phải ĐÁNG TIN CẬY và số liệu phải THỰC? • Có thể biết được thông qua kiểm định số liệu • Đánh giá chất lượng số liệu giúp người sử dụng và nhà quản lý chắc chắn rằng số liệu “tốt” có thể sử dụng cho NC • Tiêu chí đánh giá chất lượng số liệu - Tính chính xác - Hợp lí - Thời gian (trước, sau, mới?) - Đầy đủ - Mức hiện diện (có sẵn) - Mức độ chi tiết 9 10 D÷ liÖu thø cÊp cã tr¶ lêi ®-îc c¸c vÊn ®Ò nghiªn cøu kh«ng C¸c th«ng tin cã chÝnh x¸c kh«ng C¸c ®¬n vÞ ®o l-êng cã phï hîp víi thiÕt kÕ nghiªn cøu kh«ng C¸c d÷ liÖu thø cÊp cã phï hîp víi thêi gian nghiªn cøu kh«ng C¸c d÷ liÖu thø cÊp cã ¸p dông víi tæng thÓ nghiªn cøu kh«ng Cã Cã Cã Cã Cã Sö dông Dõng Kh«ng Cã thÓ xö lý l¹i th«ng tin cho phï hîp kh«ng Kh«ng Kh«ng Kh«ng Kh«ng Dõng Kh«ng Dõng Đánh giá chất lượng thông tin thứ cấp Phương pháp đánh giá chất lượng số liệu Phương pháp đánh giá chất lượng số liệu sơ cấp • Tình trạng bình thường • Kiểm tra số liệu có thể sử dụng trong điều kiện bình thường với những số liệu “bình thường” • Tình trạng “cực đoan” • Kiểm tra mức độ chính xác của số liệu nhưng ở mức thấp hơn hoặc cao hơn trong khoảng số liệu cần • Tình trạng “sai” • Kiểm tra với số liệu sai • Kiểm tra số liệu trong mọi tình trạng Mọi người và với các phương pháp khác nhau, kiếm tra thường xuyên theo các tiêu chí để hạn chế tới mức thấp nhất các sai số 11 12 12 4.1.3. Tổng hợp dữ liệu Thế nào là tổng hợp dữ liệu? - Tập trung - Hệ thống hoá (phân loại) - Sắp xếp - Trình bày một cách khoa học các dữ liệu thu thập được Mục đích: Khái quát đặc trưng của từng nhóm, toàn bộ tổng thể Tổng hợp thông tin trên EXCEL C1 C11 C12 C13 C14 C15 C111 C112 C113 C114 C141 C142 C143 NGuyÔn v¨n hé 1 C1 Nh©n khÈu vµ lao ®éng 2 C11 Tªn chñ hé 3 C12 Th«n 4 C13 X· 5 C111 Giíi tÝnh 6 C112 Tuæi 7 C113 Tr×nh ®é v¨n ho¸ 8 C114 Tr×nh ®é chuyªn m«n 9 C14 Sè nh©n khÈu cña hé 10 C141 Sè nh©n khÈu d-íi 16 tuæi 11 C142 Sè nh©n khÈu tõ 16 ®Õn 45 tuæi 12 C143 Sè nh©n khÈu tõ trªn 45 tuæi 13 C15 Tr×nh ®é v¨n ho¸ cña nh©n khÈu trong hé 14 C151 Sè nh©n khÈu cã tr×nh ®é v¨n ho¸ tiÓu häc c¬ së 15 C152 Sè nh©n khÈu cã tr×nh ®é v¨n ho¸ trung häc c¬ së 16 C153 Sè nh©n khÈu cã tr×nh ®é v¨n ho¸ trung häc phæ th«ng 17 C16 Tr×nh ®é chuyªn m«n nghiÖp vô cña nh©n khÈu trong hé 18 C161 Sè nh©n khÈu cã tr×nh ®é s¬ cÊp 19 C162 Sè nh©n khÈu cã tr×nh ®é trung cÊp 20 C163 Sè nh©n khÈu cã tr×nh ®é ®¹i häc 21 C2 §Êt ®ai 22 Mã hoá các biến trên EXCEL 4.2. Phân tích thông tin 4.2.1. Phân tích thông tin định tính 4.2.2. Phân tích thông tin định lượng 4.2.3. Phân tích thông tin thứ cấp 15 15 4.2.1. Phân tích thông tin định tính Một số phương pháp chính a) Nghiên cứu tình huống b) Tổng quan lịch sử c) Phân tích điểm mạnh yếu (SWOT) d) Phân tích thông tin thứ cấp e) Xếp hạng theo thứ tự ưu tiên f) Cây vấn đề, cây giải pháp 16 a) Nghiên cứu tình huống * Thế nào là nghiên cứu tình huống? (Murray, 1938) Nghiên cứu tình huống là nghiên cứu kỹ một người như một “chủ thể” thống nhất – chứ không phải là một phần trong dân số Nghiên cứu tình huống là nghiên cứu sâu hay rất kỹ về một đơn vị nhằm làm rõ hơn những vấn đề nghiên cứu * Điểm mạnh • Sâu và chi tiết • Bao quát cả những sự việc phức tạp * Điểm yếu • Vấn đề khái quát: Có ý kiến chủ quan • Kết quả có thể bị chệch và có ấn tượng chủ quan • Làm cho mối quan hệ phức tạp giữa các biến số Kỹ thuật thể hiện: Viết, hộp 17 b) Tổng quan lịch sử Tổng quan lịch sử hay tổng quan tài liệu nghiên cứu • Là tóm tắt những hiểu biết về những vấn đề, những lĩnh vực có liên quan đến đề tài hay nội dung NC • Nêu mẫu thuẫn, ưu nhược điểm của các quan điểm NC • Xem lại chương 3 phần phương pháp thu thập thông tin bằng phương pháp nghiên cứu tài liệu theo trình tự: 1.Lựa chọn câu hỏi NC 2.Lựa chọn các cơ sở dữ liệu, bài báo, tài liệu để tìm 3.Lựa chọn nội dung, từ khóa để tìm 4.Nghiên cứu tài liệu và Thực hiện tổng quan 5.Khái quát hóa kết quả 18 c) Phân tích điểm mạnh, yếu, cơ hội, thách thức • Strengths (mạnh), Weaknesses (yếu), Opportunities (cơ hội), Threats (thách thức) - SWOT - Phân tích SWOT • Phân tích SWOT là phương pháp xác định các điểm mạnh (ưu điểm), các điểm yếu (nhược điểm) và đồng thời tìm ra các cơ hội và thách thức mà chúng ta có thể có được hoặc phải đối mặt (với vấn đề nghiên cứu) • Là phân tích một hiện tượng dưới quan điểm hệ thống từ bên trong (S, W) ra bên ngoài (O, T) hay đồng thời kết hợp cả trong và ngoài • Đây là công cụ sử dụng nhiều trong phân tích các hiện tượng dưới dạng định tính – xã hội, chính sách • Có thể sử dụng cả trong thảo luận hoặc cá nhân tự nghiên cứu 19 Phân tích SWOT • Mạnh (S) • Khả năng bên trong Chúng ta có cái gì (hiện tại)? • Yếu (W) • Sự thiếu khả năng bên trong Chúng ta thiếu cái gì (hiện tại)? • Cơ hội (O) • Những điểm tích cực từ hoàn cảnh bên ngoài Chúng ta có thể nhận được cái gì (tương lai)? • Thách thức (T) • Những điểm tiêu cực từ hoàn cảnh bên ngoài Chúng ta có thể mất cái gì (tương lai)? 20 21 Các đặc tính Tích cực Tiêu cực Bên trong Có thể kiểm soát S – Mạnh Tạo ra lợi thế cạnh tranh W- Yếu Khả năng xuất hiện vấn đề Bên ngoài Ngoài tầm kiểm soát O – Cơ hội Tiềm năng cho tăng trưởng T-Thách thức Có thể cản trở sự tiến bộ Phân tích SWOT 22 4 ô của ma trận SWOT S – Mạnh W – Yếu O – Cơ hội T – Thách thức Tận dụng Chuyển Chuyển 23 Phân tích SWOT SWOT Cơ hội thực hiện (O) Thách thức/ Nguy cơ (T) Mặt mạnh (S) Tận dụng cơ hội để phát huy thế mạnh (O/S) Tận dụng mặt mạnh để giảm thiểu nguy cơ (S/T) Mặt yếu (W) Nắm bắt cơ hội để khắc phục mặt yếu (O/W) Giảm thiểu mặt yếu để ngăn chặn nguy cơ (W/T) 24 Phân tích SWOT SWOT Cơ hội thực hiện (O) Thách thức/ Nguy cơ (T) Mặt mạnh (S) Tận dụng cơ hội để phát huy thế mạnh (O/S) Tận dụng mặt mạnh để giảm thiểu nguy cơ (S/T) Mặt yếu (W) Nắm bắt cơ hội để khắc phục mặt yếu (O/W) Giảm thiểu mặt yếu để ngăn chặn nguy cơ (W/T) 25 Phân tích SWOT SWOT Cơ hội thực hiện (O) Thách thức/ Nguy cơ (T) Mặt mạnh (S) Tận dụng cơ hội để phát huy thế mạnh (O/S) Tận dụng mặt mạnh để giảm thiểu nguy cơ (S/T) Mặt yếu (W) Nắm bắt cơ hội để khắc phục mặt yếu (O/W) Giảm thiểu mặt yếu để ngăn chặn nguy cơ (W/T) 8 bước xây dựng ma trận SWOT (1) 1. Liệt kê các điểm mạnh chủ yếu 2. Liệt kê những điểm yếu cơ bản (tiêu biểu) bên trong 3. Liệt kê các cơ hội chính 4. Liệt kê các mối đe doạ chủ yếu bên ngoài 5. Kết hợp S-O và đề xuất phương án chiến lược phát huy điểm mạnh để nắm bắt cơ hội. 26 8 bước xây dựng ma trận SWOT (2) 6. Kết hợp W-O để đề ra phương án chiến lược khắc phục điểm yếu bằng cách tận dụng cơ hội. 7. Kết hợp W-T và đề xuất phương án chiến lược nhằm tối thiểu hoá tác dụng của điểm yếu và phòng thủ trước các mối đe doạ từ bên ngoài. 8. Kết hợp S-T và đề xuất phương án chiến lược lợi dụng thế mạnh của mình để đối phó với nguy cơ đe doạ từ bên ngoài. Nguồn: htt://www.nguoikinhdoanh.com) 27 4.2.2. Phân tích thông tin định lượng 1. Thống kê mô tả 2. Thống kê phân tích • Kiểm định thống kê • Phân tích phương sai • Phân tích tương quan • Phân tích hồi qui tuyến tính • Hồi qui phi tuyến (KTL) 3. Mô hình hóa * Mô hình KTL và Toán kinh tế • Mô phỏng • Mô hình cân đối • Mô hình khác • 4. Các phương pháp phân tích khác 28 a) Thống kê mô tả 29 Các chỉ tiêu phân tích thống kê mô tả • Mode • Trung vị • Trung bình • Tổng số • Tần số • Tần suất 30 • Khoảng biến động • Độ lệch bình quân • Phương sai • Độ lệch chuẩn • Hệ số biến động • Độ nghiêng • Độ tù Thống kê mô tả • Thống kê mô tả là các chỉ tiêu thống kê mức độ cho 1 biến định lượng • Mode, trung vị, trung bình (có 3 phương pháp tính số bình quân), tổng số, tần số, tần suất • Biến động về lượng của 1 biến được đo bằng các chỉ tiêu • Khoảng biến động • Độ lệch chuẩn (mô-men bậc 1) • Phương sai (mô-men bậc 2) • Độ nghiêng (skewness, mô-men bậc 3) • Độ tù (Kurtonis, mô-men bậc 4) 31 32 Tóm tắt • Trung bình số học • Phương sai • Đo độ phân tán của số bình quân • Độ lệch chuẩn • Căn bậc2 của phương sai n i iX n X 1 1 n i i XX n s 1 222 )( 1 1 n i i XX n s 1 2)( 1 1 33 Phân phối của trung bình mẫu • Mẫu được chọn từ tổng thể • Sử dụng phân phối của trung bình mẫu • Phân phối của trung bình mẫu có • Bình quân P sai Độ lệch chuẩn • Chứng minh nXXXX nnn 2 2 ... 2 2 2 2 2 111 21 x n x 2 2 n x nX n X n X n X 111 ...21 2 2 ... 2 2 2 2 2 111 nnn X )( 1 ) 1 ( 22 2 2 nn nX b) Thống kê so sánh (Kiểm định giả thuyết) 34 1.Kiểm định giả thuyết về sự khác nhau giữa 2 số trung bình của 2 tổng thể a. LÊy mÉu tõng cÆp + Bµi to¸n n quan s¸t sÏ ®îc lÊy mÉu theo tõng cÆp phèi hîp tõ 2 tæng thÓ sè liÖu X vµ Y nh sau: Quan s¸t X Y X-Y 1 X1 Y1 X1-Y1 2 X2 Y2 X2-Y2 3 X3 Y3 X3-Y3 . . . . . . . . . . . . n Xn Yn Xn-Yn Trung binh x y Ď Ph¬ng sai 2x 2 y S 2 d §é lÖch chuÈn x y Sd x Trung binh cña tæng thÓ X y Trung binh cña tæng thÓ Y Ď lµ trung binh cña tæng thÓ sai lÖch X - Y Sd lµ ®é lÖch chuÈn cña tæng thÓ X-Y Gi¶ sö tæng thÓ c¸c sai lÖch gi÷a X vµ Y (X-Y) cã ph©n phèi chuÈn. Ta cÇn kiÓm ®Þnh gi¶ thuyÕt sau: Ho: x - y = Do (Do lµ gi¸ trÞ cho tríc Do=0) H1: x - y Do Hay: Ho: x - y = 0 ; H1: x - y 0 Nguyªn t¾c kiÓm ®Þnh Trong ®ã: Do : gi¸ trÞ cô thÓ cho tríc Ď - Do T = ------------ Ď: lµ trung binh cña tæng thÓ sai lÖch X - Y Sd --------- n: sè ®¬n vÞ mÉu quan s¸t n T: Tiªu chuÈn kiÓm ®Þnh (T thùc nghiÖm) - T×m T lý thuyÕt víi bËc tù do lµ n-1; /2. Ta cã thÓ tra b¶ng ph©n phèi Student víi n-1 vµ /2; hoÆc t×m hµm TINV(n-1, ). - So s¸nh T thùc nghiÖm víi T lý thuyÕt” NÕu T T (n-1, /2) ta chÊp nhËn gi¶ thuyÕt Ho, NÕu T > T (n-1, /2) ta b¸c bá gi¶ thuyÕt Ho vµ khi ®ã: - NÕu Ď > Do th× (x - y) >0 - NÕu Ď < Do th× (x - y) <0 Gia thuyÕt B¸c bá Ho khi Ho : x - y = Do H1 : x - y Do T> Tn-1, /2 hoÆc T< - T(n-1, /2) Hay T > T(n-1, /2) + ThÝ dô: C«ng ty VINAMILK ¸p dông c«ng nghÖ míi trong chÕ biÕn s÷a chua. H·y kiÓm ®Þnh xem n¨ng suÊt lao ®éng cña c«ng nh©n sau khi sö dông c«ng nghÖ míi víi c«ng nghÖ cò cã kh¸c nhau kh«ng víi møc ý nghÜa lµ 5% ? x Trung binh cña 10 c«ng nh©n theo c«ng nghÖ cò = 56,30 y Trung binh cña 10 c«ng nh©n theo c«ng nghÖ míi = 61,20 Ď lµ trung binh cña tæng thÓ sai lÖch X – Y = - 4,9 Sd lµ ®é lÖch chuÈn cña tæng thÓ X-Y = 4,4833 Ta cÇn kiÓm ®Þnh gia thuyÕt sau: Ho: x - y = Do =0 H1: x - y Do 0 Thø tù c«ng nh©n quan s¸t NSLD (kg/ngµy) X-Y Tríc khi X Sau khi Y 1 50 52 -2 2 48 46 2 3 45 50 -5 4 60 65 -5 5 70 78 -8 6 62 61 1 7 55 58 -3 8 62 70 -8 9 58 67 -9 10 53 65 -12 Trung b×nh 56.30 61.20 -4.90 Ph¬ng sai 57.57 97.07 20.10 §é lÖch chuÈn 7.59 9.85 4.4833 TÝnh T kiÓm ®Þnh Ď - Do 4,9 - 0 4,9 T = ------------ = --------------- = ---------------- = 3,456 Sd 4,4833 1,4177 --------- ---------------- n 10 Tim T lý thuyÕt víi bËc tù do lµ 9; = 0,025: Ta t×m hµm TINV(9, 0,05)= 2,262; Nh vËy, T kiÓm ®Þnh = 3,456 >T lý thuyÕt = 2,262 ta b¸c bá Ho, nghÜa lµ n¨ng suÊt lao ®éng cña c«ng nh©n sau khi ¸p dông c«ng nghÖ míi kh¸c víi c«ng nghÖ cò. Vi Ď = 4,9 > Do nªn x - y > 0, nghÜa lµ ë møc ý nghÜa 5% ¸p dông c«ng nghÖ míi ®· lµm t¨ng n¨ng suÊt so víi c«ng nghÖ cò. b. Trưêng hîp lÊy mÉu ®éc lËp + Bµi to¸n: Gia sö ta cã nx vµ ny lµ sè ®¬n vÞ mÉu ®îc chän ngÉu nhiªn, ®éc lËp tõ hai tæng thÓ X vµ Y cã ph©n phèi chuÈn, thÓ hiÖn ë bang sau: x Trung b×nh cña tæng thÓ X y Trung b×nh cña tæng thÓ Y x , ŷ lµ trung b×nh cña 2 mÉu chän ngÉu nhiªn tõ 2 tæng thÓ X ; Y 2 x vµ 2 y lµ ph¬ng sai cña tæng thÓ X vµ Y Víi møc ý nghÜa , ta cÇn kiÓm ®Þnh gia thuyÕt sau: Ho: x - y = Do (Do lµ gi¸ trÞ cho tríc Do=0) H1: x - y Do Hay: Ho: x - y = 0 ; H1: x - y 0 Quan s¸t X Y 1 X1 Y1 2 X2 Y2 3 X3 Y3 . . . . . . n Xn Yn Sè quan s¸t nx ny Trung b×nh mÉu x ŷ Trung b×nh x y Ph¬ng sai 2x 2 y §é lÖch chuÈn x y + Nguyªn t¾c kiÓm ®Þnh: cã 2 trêng hîp x¶y ra Trong ®ã: Do : gi¸ trÞ cô thÓ cho tríc (Do =0) x – ŷ - Do Z = -------------------- x,, ŷ lµ trung b×nh cña 2 mÉu 2 x vµ 2 y lµ ph¬ng sai cña tæng thÓ 2x 2 y X vµ Y ------ + ------ nx ,ny : sè ®¬n vÞ mÉu quan s¸t cña táng nx ny thÓ X vµ Y Z: Tiªu chuÈn kiÓm ®Þnh (Z thùc nghiÖm) 1). NÕu nx ,ny 30 , víi X, Y tu©n theo ph©n phèi chuÈn vµ 2 x 2 y . TÝnh tiªu chuÈn kiÓm ®Þnh Z (Z thùc nghiÖm) - T×m Z lý thuyÕt: T×m Z /2 b»ng c¸ch tra b¶ng hoÆc dïng hµm NORMSINV víi /2 trong EXCEL + NÕu Z Z /2 ta chÊp nhËn gi¶ thuyÕt Ho, coi x - y = Do + NÕu Z > Z /2 ta b¸c bá gi¶ thuyÕt Ho, coi x - y Do vµ khi ®ã : NÕu x > ŷ ta xem x > y NÕu x < ŷ ta xem x < y ThÝ dô: Mét tr¹i chan nu«i gµ tiÕn hµnh thÝ nghiÖm sö dông 2 lo¹i thøc ăn A vµ B trªn cïng mét gièng. Sau mét thêi gian thö nghiÖm cho ăn, ngêi ta ®iÒu tra 50 con nu«i b»ng thøc ăn A vµ 40 con nu«i b»ng thøc ăn B thu ®îc c¸c sè liÖu sau: Bang : Mét sè chØ tiªu cña 2 mÉu thÝ nghiÖm cho ăn 2 lo¹i thøc ăn A vµ B DiÔn giai ĐVT Thøc an A Thøc an B 1. Sè ®¬n vÞ mÉu quan s¸t con 50 40 2. Khèi lîng trung binh 1 con Kg/con 2,2 1,2 3. Đé lÖch chuÈn Kg/con 1,25 1,02 Yªu cÇu: Anh chi h·y cho biÕt khèi lưîng trung bình 1 con sö dông ë 2 lo¹i thøc ăn sau thêi gian nu«i cã kh¸c nhau kh«ng víi møc ý nghÜa lµ 5%? x – ŷ -D o 2,2-1,2- 0 1 Z= -------------------- = ------------------------------ = -------------- = 4,179 0,2392 2x 2 y 1,25 2 1,022 ------ + ------ ------- + -------- nx ny 50 40 Giai: - Gäi x vµ y lµ khèi lîng trung binh 1 con sau khi nu«i sö dông thøc ăn A vµ B; - DÆt gia thuyÕt: Ho : x - y = 0 H1 : x - y 0 - TÝnh tiªu chuÈn kiÓm ®Þnh Z - Tim Z lý thuyÕt qua hµm NORMSINV víi = 0,025 trong EXCEL ta ®îc Z lý thuyÕt = 1,96. - Z = 4,179 > Z /2 = 1,96 ta b¸c bá gia thuyÕt Ho, coi x - y 0. V× x =2,2 kg/con > ŷ = 1,2 kg/con nªn ta xem x > y, chøng tá khèi l- îng trung b×nh 1 con nu«i b»ng thøc an A lín h¬n nu«i b»ng thøc an B. c) Phân tích tương quan 43 44 Quan hệ tương quan • Là quan hệ tuyến tính giữa 2 biến độc lập • Có thể dự báo giá trị 1 biến khi biết giá trị của biến kia • Hệ số tương quan nằm trong khoảng -1 đến 1 • Giá trị -1 và 1 là tương quan hoàn hảo, rất chặt, tuyến tính giữa 2 biến • Giá trị 0 là không có tương quan, không có mối quan hệ 45 Tương quan – mức độ và xu hướng Xãm Giãi tÝnh Tr×nh ®é Tæng diÖn Tuæi Sè khÈu lao ®éng tæng vèn thu nhËp 1 n¨m Xãm 1 Giãi tÝnh 0.391 1.000 Tr×nh ®é -0.253 -0.218 1.000 Tæng diÖn -0.372 -0.377 0.087 1.000 Tuæi 0.511 0.359 -0.312 -0.420 1.000 Sè khÈu 0.209 0.069 -0.389 -0.331 0.370 1.000 Sè lao ®éng 0.444 0.215 -0.343 -0.423 0.435 0.797 1.000 tæng vèn -0.097 -0.309 0.261 0.347 -0.328 -0.010 0.048 1.000 thu nhËp 1 n¨m 0.120 0.001 0.064 -0.110 -0.183 0.208 0.481 0.749 1 Phân tích tương quan 47 Ưu và nhược điểm của tương quan • Có thể đo được mối quan hệ giữa các biến mà rất khó làm thực nghiệm (chỉ số IQ và tình trạng việc làm/nghề nghiệp) • Không xác định được mối quan hệ nhân – quả • Có thể biến thứ 3 có ảnh hưởng • Hướng có thể chưa rõ ràng • R mang tính định tính 48 d) Phân tích hồi qui y = 15,843Ln(x) - 6,8698 R2 = 0,771 0 10 20 30 40 0 5 10 15 Dien tich s a n l u o n g y Log. (y) Regression Statistics Multiple R 0.871779 R Square 0.759998 Adjusted R Square0.729998 Standard Error10.03797 Observations 19 ANOVA df SS MS F Significance F Regression 2 5105.162 2552.581 25.33305 1.1E-05 Residual 16 1612.175 100.7609 Total 18 6717.337 CoefficientsStandard Error t Stat P-value Lower 95%Upper 95% Intercept -14.32992 6.906661 -2.074798 0.054496 -28.97139 0.311542 Sè lao ®éng 7.218543 1.982913 3.640373 0.002203 3.014955 11.42213 tæng vèn 0.512103 0.086259 5.936809 2.09E-05 0.329242 0.694964 Các phương pháp phân tích định lượng khác 1. Mô hình hóa (kết hợp KTL + Toán + các môn khác) 2. Mô hình tối ưu 3. Phân tích ngành hàng, 4. Phân tích ma trận chính sách (PAM) 5. Phân tích lợi thế so sánh 6. Phân tích tài chính Xem lại các môn học liên quan và sẽ vận dụng ở chương sau 50 4.2.3. Phân tích thông tin thứ cấp • Sử dụng thông tin thứ cấp cho nghiên cứu? Số liệu thứ cấp 52 • Số liệu được thu thập không phải cho mục đích của NC hiện tại • Phân tích số liệu/ thông tin đã có • Số liệu thu thập cho sử dụng chung • Nhà NC có ảnh hưởng nhỏ đến dạng số liệu (làm thế nào điều tra,...) • Không nên nhầm với : Phân tích “thứ cấp” – là phân tích một phân tích khác – như kiểm tra tính chính xác Số liệu thứ cấp • Lợi ích • Chi phí và thời gian • Sự sẵn có • Đỡ tốn kém • Không đòi hỏi thời gian nhiều 53 Số liệu thứ cấp • Bất lợi: Có thể không đáp ứng nhu cầu của NC hiện tại về • Đơn vị tính • Các khái niệm, định nghĩa khác • Thời gian • Hạn chế: Tính chính xác • Ai thu thập? • Tại sao lại thu thập? • Thu thập thế nào? 54 4.3. Trình bày kết quả xử lý & phân tích thông tin • (Xem lại Bài giảng Nguyên lý thống kê kinh tế) 55 Trình bày số liệu, thông tin 4 kiểu trình bày kết quả xử lý và phân tích • Số liệu độc lập • Bảng số liệu • Sơ đồ, hình • Đồ thị Mục đích • Tất cả các kiểu trình bày đều nhằm mục đích giúp người đọc dễ hiểu kết quả phân tích • Đây chỉ là cách khác nhau – mục đích như nhau 56 Yêu cầu khi trình bày kết quả xử lý và phân tích thông tin Mỗi hình thức trình bày đều có: • Bao gồm tiêu đề mô tả • Tên của tất cả các biến và đơn vị đo • Các biến độc lập ở trục hoành • Biến phụ thuộc ở trục tung • Nguồn số liệu trong ghi chú • Chỉ rõ kiểm định thống kê ở cuối bảng • Luôn có số quan sát, số mẫu • Chỉ rõ nếu dùng phần trăm. 57
File đính kèm:
- bai_giang_nghien_cuu_khoa_hoc_chuong_4_xu_ly_va_phan_tich_du.pdf