Bài giảng Nghiên cứu khoa học - Chương 4: Xử lý và phân tích dữ liệu - Nguyễn Thị Minh Thu

Khái niệm và lợi ích hiệu chỉnh và mã

hóa dữ liệu

• Hiệu chỉnh là kiểm tra dữ liệu và thông tin theo yêu cầu

• Mã hóa là thay đổi số liệu ‘nguyên thủy’ về một dạng

ngắn gọn hơn để có thể lưu trong máy tính và xử lý

được dễ dàng bằng các mã số hoặc ký hiệu thích hợp

(Xây dựng bộ mã hóa).

• Các lợi ích của mã hóa dữ liệu

- Giảm công suất, không gian lưu trữ

- Nếu mã hóa số lượng vừa phải có thể giúp nâng cao giá

trị của số liệu

- Giúp cho các phương pháp phân tích định lượng

pdf 57 trang kimcuc 16360
Bạn đang xem 20 trang mẫu của tài liệu "Bài giảng Nghiên cứu khoa học - Chương 4: Xử lý và phân tích dữ liệu - Nguyễn Thị Minh Thu", để tải tài liệu gốc về máy hãy click vào nút Download ở trên

Tóm tắt nội dung tài liệu: Bài giảng Nghiên cứu khoa học - Chương 4: Xử lý và phân tích dữ liệu - Nguyễn Thị Minh Thu

Bài giảng Nghiên cứu khoa học - Chương 4: Xử lý và phân tích dữ liệu - Nguyễn Thị Minh Thu
CHƯƠNG 4
XỬ LÝ VÀ PHÂN TÍCH DỮ LIỆU
NGUYỄN THỊ MINH THU
NỘI DUNG
4.1. Xử lý dữ liệu
4.2. Một số phương pháp phân tích
dữ liệu
4.3. Trình bày kết quả xử lý và phân
tích
4.1. Xử lý dữ liệu
4.1.1. Hiệu chỉnh và mã hóa dữ liệu
4.1.2. Đánh giá chất lượng dữ liệu
4.1.3. Xác định các mối liên hệ
3
3
4.1.1. Hiệu chỉnh và mã hóa
dữ liệu
4
a) Khái niệm và lợi ích hiệu chỉnh và mã
hóa dữ liệu
• Hiệu chỉnh là kiểm tra dữ liệu và thông tin theo yêu cầu
• Mã hóa là thay đổi số liệu ‘nguyên thủy’ về một dạng
ngắn gọn hơn để có thể lưu trong máy tính và xử lý
được dễ dàng bằng các mã số hoặc ký hiệu thích hợp
(Xây dựng bộ mã hóa).
• Các lợi ích của mã hóa dữ liệu
- Giảm công suất, không gian lưu trữ
- Nếu mã hóa số lượng vừa phải có thể giúp nâng cao giá
trị của số liệu
- Giúp cho các phương pháp phân tích định lượng
5
b) Kỹ thuật mã hóa dữ liệu
Lựa chọn mã hóa, thang đo gắn cho từng
dữ liệu
• Các loại thang đo:
• Định danh/danh nghĩa (Norminal Scale)
• Thứ bậc (Ordinal Scale)
• Khoảng (Interval Scale)
• Tỷ lệ (Ratio Scale)
• Các mã số: Đánh dấu, ký hiệu, cho điểm
• Lựa chọn số lượng và giới hạn của từng hành
vi của thông tin.
• Gắn thang đo, mã số cho từng hành vi của
thông tin
6
c) Những chú ý khi mã hóa dữ liệu
• Người sử dụng cần phải biết mã của dữ liệu
• Nếu người sử dụng không biết mã của số liệu
thì không thể phân tích được
• Thí dụ Mã hóa thông tin về giới: 1 là nam; 2 là
nữ
• Mức độ chính xác của dữ liệu mã hóa
• Ví dụ: Mã hóa thông tin về mức độ kinh tế
Hộ giàu: thu nhập/1 người > 2,5 triệu/tháng; Hộ
nghèo: < 0,5 triệu/tháng
• Mã hóa thường thể hiện bằng số
• Ví dụ: Nghèo 1, Cận nghèo 2, Khá 3, Giàu 4
7
4.1.2. Đánh giá chất lượng dữ
liệu
8
a) Thế nào là đánh giá chất lượng 
số liệu
• Tại sao số liệu phải ĐÁNG TIN CẬY và số liệu phải THỰC?
• Có thể biết được thông qua kiểm định số liệu
• Đánh giá chất lượng số liệu giúp người sử dụng và nhà
quản lý chắc chắn rằng số liệu “tốt” có thể sử dụng
cho NC
• Tiêu chí đánh giá chất lượng số liệu
- Tính chính xác
- Hợp lí
- Thời gian (trước, sau, mới?)
- Đầy đủ
- Mức hiện diện (có sẵn)
- Mức độ chi tiết
9
10
D÷ liÖu thø cÊp cã tr¶ lêi 
®-îc c¸c vÊn ®Ò nghiªn cøu 
kh«ng 
C¸c th«ng tin cã chÝnh x¸c 
kh«ng 
C¸c ®¬n vÞ ®o l-êng cã phï 
hîp víi thiÕt kÕ nghiªn cøu 
kh«ng 
C¸c d÷ liÖu thø cÊp cã phï 
hîp víi thêi gian nghiªn cøu 
kh«ng 
C¸c d÷ liÖu thø cÊp cã ¸p dông 
víi tæng thÓ nghiªn cøu kh«ng 
Cã 
Cã 
Cã 
Cã 
Cã 
Sö 
dông 
Dõng 
Kh«ng 
Cã thÓ 
xö lý 
l¹i 
th«ng 
tin 
cho phï 
hîp 
kh«ng 
Kh«ng 
Kh«ng 
Kh«ng 
Kh«ng 
Dõng 
Kh«ng 
Dõng 
Đánh giá chất lượng thông tin thứ cấp
Phương pháp đánh giá chất lượng số liệu
Phương pháp đánh giá chất lượng số liệu sơ cấp
• Tình trạng bình thường
• Kiểm tra số liệu có thể sử dụng trong điều
kiện bình thường với những số liệu “bình
thường”
• Tình trạng “cực đoan”
• Kiểm tra mức độ chính xác của số liệu nhưng
ở mức thấp hơn hoặc cao hơn trong khoảng
số liệu cần
• Tình trạng “sai”
• Kiểm tra với số liệu sai
• Kiểm tra số liệu trong mọi tình trạng
Mọi người và với các phương pháp khác nhau, kiếm
tra thường xuyên theo các tiêu chí để hạn chế tới
mức thấp nhất các sai số
11
12
12
4.1.3. Tổng hợp dữ liệu
Thế nào là tổng hợp dữ liệu?
- Tập trung
- Hệ thống hoá (phân loại)
- Sắp xếp
- Trình bày một cách khoa học các dữ liệu
thu thập được
Mục đích: Khái quát đặc trưng của từng
nhóm, toàn bộ tổng thể
Tổng hợp thông tin trên EXCEL
C1
C11 C12 C13 C14 C15
C111 C112 C113 C114 C141 C142 C143
NGuyÔn v¨n hé
1 C1 Nh©n khÈu vµ lao ®éng
2 C11 Tªn chñ hé
3 C12 Th«n
4 C13 X·
5 C111 Giíi tÝnh
6 C112 Tuæi
7 C113 Tr×nh ®é v¨n ho¸
8 C114 Tr×nh ®é chuyªn m«n
9 C14 Sè nh©n khÈu cña hé
10 C141 Sè nh©n khÈu d-íi 16 tuæi
11 C142 Sè nh©n khÈu tõ 16 ®Õn 45 tuæi
12 C143 Sè nh©n khÈu tõ trªn 45 tuæi
13 C15 Tr×nh ®é v¨n ho¸ cña nh©n khÈu trong hé
14 C151 Sè nh©n khÈu cã tr×nh ®é v¨n ho¸ tiÓu häc c¬ së
15 C152 Sè nh©n khÈu cã tr×nh ®é v¨n ho¸ trung häc c¬ së
16 C153 Sè nh©n khÈu cã tr×nh ®é v¨n ho¸ trung häc phæ th«ng
17 C16 Tr×nh ®é chuyªn m«n nghiÖp vô cña nh©n khÈu trong hé
18 C161 Sè nh©n khÈu cã tr×nh ®é s¬ cÊp
19 C162 Sè nh©n khÈu cã tr×nh ®é trung cÊp
20 C163 Sè nh©n khÈu cã tr×nh ®é ®¹i häc
21 C2 §Êt ®ai
22
Mã hoá các biến trên EXCEL
4.2. Phân tích thông tin
4.2.1. Phân tích thông tin định tính
4.2.2. Phân tích thông tin định lượng
4.2.3. Phân tích thông tin thứ cấp
15
15
4.2.1. Phân tích thông tin định tính
Một số phương pháp chính
a) Nghiên cứu tình huống
b) Tổng quan lịch sử
c) Phân tích điểm mạnh yếu (SWOT)
d) Phân tích thông tin thứ cấp
e) Xếp hạng theo thứ tự ưu tiên
f) Cây vấn đề, cây giải pháp
16
a) Nghiên cứu tình huống
* Thế nào là nghiên cứu tình huống? (Murray, 1938)
Nghiên cứu tình huống là nghiên cứu kỹ một người như một
“chủ thể” thống nhất – chứ không phải là một phần trong
dân số
Nghiên cứu tình huống là nghiên cứu sâu hay rất kỹ về một
đơn vị nhằm làm rõ hơn những vấn đề nghiên cứu
* Điểm mạnh
• Sâu và chi tiết
• Bao quát cả những sự việc phức tạp
* Điểm yếu
• Vấn đề khái quát: Có ý kiến chủ quan
• Kết quả có thể bị chệch và có ấn tượng chủ quan
• Làm cho mối quan hệ phức tạp giữa các biến số
Kỹ thuật thể hiện: Viết, hộp
17
b) Tổng quan lịch sử
Tổng quan lịch sử hay tổng quan tài liệu nghiên cứu
• Là tóm tắt những hiểu biết về những vấn đề, những
lĩnh vực có liên quan đến đề tài hay nội dung NC
• Nêu mẫu thuẫn, ưu nhược điểm của các quan điểm
NC
• Xem lại chương 3 phần phương pháp thu thập
thông tin bằng phương pháp nghiên cứu tài liệu
theo trình tự:
1.Lựa chọn câu hỏi NC
2.Lựa chọn các cơ sở dữ liệu, bài báo, tài liệu để tìm
3.Lựa chọn nội dung, từ khóa để tìm
4.Nghiên cứu tài liệu và Thực hiện tổng quan
5.Khái quát hóa kết quả
18
c) Phân tích điểm mạnh, yếu, cơ
hội, thách thức
• Strengths (mạnh), Weaknesses (yếu), Opportunities (cơ
hội), Threats (thách thức) - SWOT - Phân tích SWOT
• Phân tích SWOT là phương pháp xác định các điểm
mạnh (ưu điểm), các điểm yếu (nhược điểm) và đồng
thời tìm ra các cơ hội và thách thức mà chúng ta có
thể có được hoặc phải đối mặt (với vấn đề nghiên cứu)
• Là phân tích một hiện tượng dưới quan điểm hệ thống
từ bên trong (S, W) ra bên ngoài (O, T) hay đồng thời
kết hợp cả trong và ngoài
• Đây là công cụ sử dụng nhiều trong phân tích các hiện
tượng dưới dạng định tính – xã hội, chính sách
• Có thể sử dụng cả trong thảo luận hoặc cá nhân tự
nghiên cứu
19
Phân tích SWOT
• Mạnh (S)
• Khả năng bên trong
Chúng ta có cái gì (hiện tại)?
• Yếu (W)
• Sự thiếu khả năng bên trong
Chúng ta thiếu cái gì (hiện tại)?
• Cơ hội (O) 
• Những điểm tích cực từ hoàn cảnh bên ngoài
Chúng ta có thể nhận được cái gì (tương lai)?
• Thách thức (T)
• Những điểm tiêu cực từ hoàn cảnh bên ngoài
Chúng ta có thể mất cái gì (tương lai)?
20
21
Các đặc
tính
Tích cực Tiêu cực
Bên trong
Có thể 
kiểm soát
S – Mạnh
Tạo ra lợi thế cạnh tranh
W- Yếu
Khả năng xuất hiện
vấn đề
Bên ngoài
Ngoài tầm 
kiểm soát
O – Cơ hội
Tiềm năng cho tăng 
trưởng
T-Thách thức
Có thể cản trở
sự tiến bộ
Phân tích SWOT
22
4 ô của ma trận SWOT
S – Mạnh W – Yếu
O – Cơ hội T – Thách thức
Tận
dụng
Chuyển
Chuyển
23
Phân tích SWOT
SWOT Cơ hội 
thực hiện (O)
Thách thức/
Nguy cơ (T)
Mặt mạnh (S)
Tận dụng cơ hội
để phát huy thế
mạnh (O/S)
Tận dụng mặt 
mạnh để giảm 
thiểu nguy cơ
(S/T)
Mặt yếu (W)
Nắm bắt cơ hội 
để khắc phục 
mặt yếu (O/W)
Giảm thiểu mặt
yếu để ngăn
chặn nguy cơ
(W/T)
24
Phân tích SWOT
SWOT Cơ hội 
thực hiện (O)
Thách thức/
Nguy cơ (T)
Mặt mạnh (S)
Tận dụng cơ hội
để phát huy thế
mạnh
(O/S)
Tận dụng mặt 
mạnh để giảm 
thiểu nguy cơ
(S/T)
Mặt yếu (W)
Nắm bắt cơ hội 
để khắc phục 
mặt yếu 
(O/W)
Giảm thiểu mặt
yếu để ngăn chặn
nguy cơ
(W/T)
25
Phân tích SWOT
SWOT Cơ hội 
thực hiện (O)
Thách thức/
Nguy cơ (T)
Mặt mạnh (S)
Tận dụng cơ hội
để phát huy thế
mạnh
(O/S)
Tận dụng mặt 
mạnh để giảm 
thiểu nguy cơ
(S/T)
Mặt yếu (W)
Nắm bắt cơ hội 
để khắc phục 
mặt yếu 
(O/W)
Giảm thiểu mặt
yếu để ngăn
chặn nguy cơ
(W/T)
8 bước xây dựng ma trận SWOT (1)
1. Liệt kê các điểm mạnh chủ yếu
2. Liệt kê những điểm yếu cơ bản (tiêu biểu) 
bên trong
3. Liệt kê các cơ hội chính
4. Liệt kê các mối đe doạ chủ yếu bên ngoài
5. Kết hợp S-O và đề xuất phương án chiến
lược phát huy điểm mạnh để nắm bắt cơ hội.
26
8 bước xây dựng ma trận SWOT (2)
6. Kết hợp W-O để đề ra phương án chiến lược khắc
phục điểm yếu bằng cách tận dụng cơ hội.
7. Kết hợp W-T và đề xuất phương án chiến lược
nhằm tối thiểu hoá tác dụng của điểm yếu và
phòng thủ trước các mối đe doạ từ bên ngoài.
8. Kết hợp S-T và đề xuất phương án chiến lược lợi
dụng thế mạnh của mình để đối phó với nguy cơ
đe doạ từ bên ngoài.
Nguồn: htt://www.nguoikinhdoanh.com)
27
4.2.2. Phân tích thông tin định lượng
1. Thống kê mô tả
2. Thống kê phân tích
• Kiểm định thống kê
• Phân tích phương sai
• Phân tích tương quan
• Phân tích hồi qui tuyến tính
• Hồi qui phi tuyến (KTL)
3. Mô hình hóa
* Mô hình KTL và Toán kinh tế
• Mô phỏng
• Mô hình cân đối
• Mô hình khác
• 4. Các phương pháp phân tích khác
28
a) Thống kê mô tả
29
Các chỉ tiêu phân tích thống kê mô 
tả
• Mode
• Trung vị
• Trung bình
• Tổng số
• Tần số
• Tần suất
30
• Khoảng biến động
• Độ lệch bình quân
• Phương sai
• Độ lệch chuẩn
• Hệ số biến động
• Độ nghiêng
• Độ tù
Thống kê mô tả
• Thống kê mô tả là các chỉ tiêu thống kê mức độ cho 1 
biến định lượng
• Mode, trung vị, trung bình (có 3 phương pháp tính số
bình quân), tổng số, tần số, tần suất
• Biến động về lượng của 1 biến được đo bằng các chỉ
tiêu
• Khoảng biến động
• Độ lệch chuẩn (mô-men bậc 1)
• Phương sai (mô-men bậc 2)
• Độ nghiêng (skewness, mô-men bậc 3)
• Độ tù (Kurtonis, mô-men bậc 4)
31
32
Tóm tắt
• Trung bình số học
• Phương sai
• Đo độ phân tán của số bình
quân
• Độ lệch chuẩn
• Căn bậc2 của phương sai

n
i
iX
n
X
1
1

 
n
i
i XX
n
s
1
222 )(
1
1


 
n
i
i XX
n
s
1
2)(
1
1

33
Phân phối của trung bình mẫu
• Mẫu được chọn từ tổng thể
• Sử dụng phân phối của trung bình mẫu
• Phân phối của trung bình mẫu có
• Bình quân P sai Độ lệch chuẩn
• Chứng minh
nXXXX
nnn
2
2
...
2
2
2
2
2 111
21  
 x
n
x
2
2  
n
x

 
nX
n
X
n
X
n
X
111
...21 
2
2
...
2
2
2
2
2 111 
nnn
X 
)(
1
)
1
( 22
2
2 
nn
nX 
b) Thống kê so sánh (Kiểm định
giả thuyết)
34
1.Kiểm định giả thuyết về sự khác nhau giữa 2 số trung
bình của 2 tổng thể
a. LÊy mÉu tõng cÆp
+ Bµi to¸n
n quan s¸t sÏ ®îc lÊy mÉu theo tõng cÆp phèi hîp tõ 2 tæng thÓ sè liÖu X 
vµ Y nh sau:
Quan s¸t X Y X-Y
1 X1 Y1 X1-Y1
2 X2 Y2 X2-Y2
3 X3 Y3 X3-Y3
. . . .
. . . .
. . . .
n Xn Yn Xn-Yn
Trung binh x y Ď
Ph¬ng sai 2x 
2
y S
2
d
§é lÖch chuÈn  x y Sd
x Trung binh cña tæng thÓ X
y Trung binh cña tæng thÓ Y
Ď lµ trung binh cña tæng thÓ sai lÖch X - Y
Sd lµ ®é lÖch chuÈn cña tæng thÓ X-Y
Gi¶ sö tæng thÓ c¸c sai lÖch gi÷a X vµ Y 
(X-Y) cã ph©n phèi chuÈn. Ta cÇn kiÓm
®Þnh gi¶ thuyÕt sau:
Ho: x - y = Do (Do lµ gi¸ trÞ cho tríc
Do=0)
H1: x - y Do
Hay:
Ho: x - y = 0 ; H1: x - y 0
Nguyªn t¾c kiÓm ®Þnh
Trong ®ã: Do : gi¸ trÞ cô thÓ cho tríc
Ď - Do
T = ------------ Ď: lµ trung binh cña tæng thÓ sai lÖch X - Y 
Sd
--------- n: sè ®¬n vÞ mÉu quan s¸t 
n T: Tiªu chuÈn kiÓm ®Þnh (T thùc nghiÖm) 
- T×m T lý thuyÕt víi bËc tù do lµ n-1; /2. Ta cã thÓ tra b¶ng ph©n phèi
Student víi n-1 vµ /2; hoÆc t×m hµm TINV(n-1, ).
- So s¸nh T thùc nghiÖm víi T lý thuyÕt”
NÕu T T (n-1, /2) ta chÊp nhËn gi¶ thuyÕt Ho,
NÕu T > T (n-1, /2) ta b¸c bá gi¶ thuyÕt Ho vµ khi ®ã:
- NÕu Ď > Do th× (x - y) >0
- NÕu Ď < Do th× (x - y) <0
Gia thuyÕt B¸c bá Ho khi
Ho : x - y = Do 
H1 : x - y Do
T> Tn-1, /2 hoÆc T< - T(n-1, /2)
Hay T > T(n-1, /2)
+ ThÝ dô: C«ng ty VINAMILK ¸p dông c«ng nghÖ míi trong
chÕ biÕn s÷a chua. H·y kiÓm ®Þnh xem n¨ng suÊt lao ®éng
cña c«ng nh©n sau khi sö dông c«ng nghÖ míi víi c«ng
nghÖ cò cã kh¸c nhau kh«ng víi møc ý nghÜa lµ 5% ?
x Trung binh cña 10 c«ng nh©n 
theo c«ng nghÖ cò = 56,30
y Trung binh cña 10 c«ng 
nh©n theo c«ng nghÖ míi = 
61,20
Ď lµ trung binh cña tæng thÓ sai 
lÖch X – Y = - 4,9
Sd lµ ®é lÖch chuÈn cña tæng thÓ
X-Y = 4,4833
Ta cÇn kiÓm ®Þnh gia thuyÕt 
sau:
Ho: x - y = Do =0
H1: x - y Do 0
Thø tù c«ng 
nh©n quan s¸t
NSLD (kg/ngµy) X-Y
Tríc khi X Sau khi
Y
1 50 52 -2
2 48 46 2
3 45 50 -5
4 60 65 -5
5 70 78 -8
6 62 61 1
7 55 58 -3
8 62 70 -8
9 58 67 -9
10 53 65 -12
Trung b×nh 56.30 61.20 -4.90
Ph¬ng sai 57.57 97.07 20.10
§é lÖch chuÈn 7.59 9.85 4.4833
TÝnh T kiÓm ®Þnh
Ď - Do 4,9 - 0 4,9
T = ------------ = --------------- = ---------------- = 3,456 
Sd 4,4833 1,4177
--------- ----------------
n 10
Tim T lý thuyÕt víi bËc tù do lµ 9; = 0,025: Ta t×m hµm 
TINV(9, 0,05)= 2,262;
Nh vËy, T kiÓm ®Þnh = 3,456 >T lý thuyÕt = 2,262 ta b¸c 
bá Ho, nghÜa lµ n¨ng suÊt lao ®éng cña c«ng nh©n sau khi 
¸p dông c«ng nghÖ míi kh¸c víi c«ng nghÖ cò.
Vi Ď = 4,9 > Do nªn x - y > 0, nghÜa lµ ë møc ý nghÜa 5% 
¸p dông c«ng nghÖ míi ®· lµm t¨ng n¨ng suÊt so víi c«ng 
nghÖ cò.
b. Trưêng hîp lÊy mÉu ®éc lËp
+ Bµi to¸n:
Gia sö ta cã nx vµ ny lµ sè ®¬n vÞ mÉu ®îc chän ngÉu nhiªn, ®éc lËp tõ
hai tæng thÓ X vµ Y cã ph©n phèi chuÈn, thÓ hiÖn ë bang sau:
x Trung b×nh cña tæng thÓ X
y Trung b×nh cña tæng thÓ Y
x , ŷ lµ trung b×nh cña 2 mÉu chän ngÉu 
nhiªn tõ 2 tæng thÓ X ; Y
2 x vµ 
2
y lµ ph¬ng sai cña tæng thÓ X vµ Y
Víi møc ý nghÜa , ta cÇn kiÓm ®Þnh gia 
thuyÕt sau:
Ho: x - y = Do (Do lµ gi¸ trÞ cho tríc 
Do=0)
H1: x - y Do
Hay:
Ho: x - y = 0 ; H1: x - y 0
Quan s¸t X Y
1 X1 Y1
2 X2 Y2
3 X3 Y3
. . .
. . .
n Xn Yn
Sè quan s¸t nx ny
Trung b×nh mÉu x ŷ
Trung b×nh x y
Ph¬ng sai 2x 
2
y
§é lÖch chuÈn  x y
+ Nguyªn t¾c kiÓm ®Þnh: cã 2 trêng hîp x¶y ra 
Trong ®ã: Do : gi¸ trÞ cô thÓ cho tríc (Do =0)
x – ŷ - Do
Z = -------------------- x,, ŷ lµ trung b×nh cña 2 mÉu
2 x vµ 
2
y lµ ph¬ng sai cña tæng thÓ 
2x 
2
y X vµ Y
------ + ------ nx ,ny : sè ®¬n vÞ mÉu quan s¸t cña táng 
nx ny thÓ X vµ Y
Z: Tiªu chuÈn kiÓm ®Þnh (Z thùc nghiÖm) 
1). NÕu nx ,ny 30 , víi X, Y tu©n theo ph©n phèi chuÈn vµ 
2 x 
2
y
. TÝnh tiªu chuÈn kiÓm ®Þnh Z (Z thùc nghiÖm)
- T×m Z lý thuyÕt:
T×m Z /2 b»ng c¸ch tra b¶ng hoÆc dïng hµm NORMSINV víi /2 trong EXCEL
+ NÕu Z Z /2 ta chÊp nhËn gi¶ thuyÕt Ho, coi x - y = Do 
+ NÕu Z > Z /2 ta b¸c bá gi¶ thuyÕt Ho, coi x - y Do vµ khi ®ã :
NÕu x > ŷ ta xem x > y
NÕu x < ŷ ta xem x < y
ThÝ dô: Mét tr¹i chan nu«i gµ tiÕn hµnh thÝ nghiÖm sö dông 2 
lo¹i thøc ăn A vµ B trªn cïng mét gièng. Sau mét thêi gian 
thö nghiÖm cho ăn, ngêi ta ®iÒu tra 50 con nu«i b»ng thøc ăn
A vµ 40 con nu«i b»ng thøc ăn B thu ®îc c¸c sè liÖu sau:
Bang : Mét sè chØ tiªu cña 2 mÉu thÝ nghiÖm cho ăn 2 lo¹i 
thøc ăn A vµ B
DiÔn giai ĐVT Thøc an A Thøc an B
1. Sè ®¬n vÞ mÉu quan s¸t con 50 40
2. Khèi lîng trung binh 1 con Kg/con 2,2 1,2
3. Đé lÖch chuÈn Kg/con 1,25 1,02
Yªu cÇu: Anh chi h·y cho biÕt khèi lưîng trung bình 1 con
sö dông ë 2 lo¹i thøc ăn sau thêi gian nu«i cã kh¸c nhau
kh«ng víi møc ý nghÜa lµ 5%?
x – ŷ -D
o
2,2-1,2- 0 1
Z= -------------------- = ------------------------------ = -------------- = 4,179 
0,2392
2x 
2
y 1,25
2 1,022
------ + ------ ------- + --------
nx ny 50 40
Giai: 
- Gäi x vµ y lµ khèi lîng trung binh 1 con sau khi nu«i sö 
dông thøc ăn A vµ B;
- DÆt gia thuyÕt: Ho : x - y = 0 
H1 : x - y 0
- TÝnh tiªu chuÈn kiÓm ®Þnh Z
- Tim Z lý thuyÕt qua hµm NORMSINV víi = 0,025 trong EXCEL ta ®îc Z
lý thuyÕt = 1,96.
- Z = 4,179 > Z /2 = 1,96 ta b¸c bá gia thuyÕt Ho, coi x - y 0.
V× x =2,2 kg/con > ŷ = 1,2 kg/con nªn ta xem x > y, chøng tá khèi l-
îng trung b×nh 1 con nu«i b»ng thøc an A lín h¬n nu«i b»ng thøc an B.
c) Phân tích tương quan
43
44
Quan hệ tương quan
• Là quan hệ tuyến tính giữa 2 biến độc lập
• Có thể dự báo giá trị 1 biến khi biết giá trị của
biến kia
• Hệ số tương quan nằm trong khoảng -1 đến 1
• Giá trị -1 và 1 là tương quan hoàn hảo, rất
chặt, tuyến tính giữa 2 biến
• Giá trị 0 là không có tương quan, không có
mối quan hệ
45
Tương quan – mức độ và xu hướng
Xãm Giãi tÝnh Tr×nh ®é Tæng diÖn Tuæi Sè khÈu lao ®éng tæng vèn thu nhËp 1 n¨m
Xãm 1
Giãi tÝnh 0.391 1.000
Tr×nh ®é -0.253 -0.218 1.000
Tæng diÖn -0.372 -0.377 0.087 1.000
Tuæi 0.511 0.359 -0.312 -0.420 1.000
Sè khÈu 0.209 0.069 -0.389 -0.331 0.370 1.000
Sè lao ®éng 0.444 0.215 -0.343 -0.423 0.435 0.797 1.000
tæng vèn -0.097 -0.309 0.261 0.347 -0.328 -0.010 0.048 1.000
thu nhËp 1 n¨m 0.120 0.001 0.064 -0.110 -0.183 0.208 0.481 0.749 1
Phân tích tương quan
47
Ưu và nhược điểm của tương quan
• Có thể đo được mối quan hệ giữa các biến mà
rất khó làm thực nghiệm (chỉ số IQ và tình trạng
việc làm/nghề nghiệp)
• Không xác định được mối quan hệ nhân – quả
• Có thể biến thứ 3 có ảnh hưởng
• Hướng có thể chưa rõ ràng
• R mang tính định tính
48
d) Phân tích hồi qui
y = 15,843Ln(x) - 6,8698
R2 = 0,771
0
10
20
30
40
0 5 10 15
Dien tich
s
a
n
 l
u
o
n
g
y
Log. (y)
Regression Statistics
Multiple R 0.871779
R Square 0.759998
Adjusted R Square0.729998
Standard Error10.03797
Observations 19
ANOVA
df SS MS F Significance F
Regression 2 5105.162 2552.581 25.33305 1.1E-05
Residual 16 1612.175 100.7609
Total 18 6717.337
CoefficientsStandard Error t Stat P-value Lower 95%Upper 95%
Intercept -14.32992 6.906661 -2.074798 0.054496 -28.97139 0.311542
Sè lao ®éng 7.218543 1.982913 3.640373 0.002203 3.014955 11.42213
tæng vèn 0.512103 0.086259 5.936809 2.09E-05 0.329242 0.694964
Các phương pháp phân tích định
lượng khác
1. Mô hình hóa (kết hợp KTL + Toán + các môn 
khác)
2. Mô hình tối ưu
3. Phân tích ngành hàng, 
4. Phân tích ma trận chính sách (PAM)
5. Phân tích lợi thế so sánh
6. Phân tích tài chính
Xem lại các môn học liên quan và sẽ vận dụng ở chương 
sau
50
4.2.3. Phân tích thông tin thứ cấp
• Sử dụng thông tin thứ cấp cho nghiên cứu?
Số liệu thứ cấp
52
• Số liệu được thu thập không phải cho mục
đích của NC hiện tại
• Phân tích số liệu/ thông tin đã có
• Số liệu thu thập cho sử dụng chung
• Nhà NC có ảnh hưởng nhỏ đến dạng số liệu
(làm thế nào điều tra,...)
• Không nên nhầm với : Phân tích “thứ cấp” –
là phân tích một phân tích khác – như kiểm
tra tính chính xác
Số liệu thứ cấp
• Lợi ích
• Chi phí và thời gian
• Sự sẵn có
• Đỡ tốn kém
• Không đòi hỏi thời gian nhiều
53
Số liệu thứ cấp
• Bất lợi: Có thể không đáp ứng nhu cầu của
NC hiện tại về
• Đơn vị tính
• Các khái niệm, định nghĩa khác
• Thời gian
• Hạn chế: Tính chính xác
• Ai thu thập?
• Tại sao lại thu thập?
• Thu thập thế nào?
54
4.3. Trình bày kết quả xử lý & phân
tích thông tin
• (Xem lại Bài giảng Nguyên lý thống kê kinh tế)
55
Trình bày số liệu, thông tin
4 kiểu trình bày kết quả xử lý và phân tích
• Số liệu độc lập
• Bảng số liệu
• Sơ đồ, hình
• Đồ thị
Mục đích
• Tất cả các kiểu trình bày đều nhằm mục đích
giúp người đọc dễ hiểu kết quả phân tích
• Đây chỉ là cách khác nhau – mục đích như
nhau
56
Yêu cầu khi trình bày kết quả xử lý và
phân tích thông tin
Mỗi hình thức trình bày đều có: 
• Bao gồm tiêu đề mô tả
• Tên của tất cả các biến và đơn vị đo
• Các biến độc lập ở trục hoành
• Biến phụ thuộc ở trục tung
• Nguồn số liệu trong ghi chú
• Chỉ rõ kiểm định thống kê ở cuối bảng
• Luôn có số quan sát, số mẫu
• Chỉ rõ nếu dùng phần trăm.
57

File đính kèm:

  • pdfbai_giang_nghien_cuu_khoa_hoc_chuong_4_xu_ly_va_phan_tich_du.pdf