Bài tập Nguyên lý thống kê kinh tế

Câu 5: Theo em, dựa vào dấu của các hệ số hồi qui và sự hiểu biết của em về qui luật cung cầu, các biến độc lập hợp qui luật là thu nhập và giá thịt gà, biến không hợp qui luật là giá thịt heo và thịt bò.

Cụ thể là:

- Khi thu nhập của một người tăng lên họ có thể có nhiều nhu cầu hơn, họ có thể mua nhiều thứ hơn nên việc mua các loại thịt nói chung và thịt gà nói riêng là nhu cầu bình thường không quá xa xỉ.

- Khi giá của thịt gà tăng lên làm cho lượng cầu giảm đó là điều tất nhiên vì những thực phẩm khác cũng có thể đáp ứng nhu cầu của người tiêu dùng nên họ thay thế thịt gà bằng những loại thực phẩm khác làm lượng cầu thịt gà giảm.

=> 2 trường hợp này là hợp qui luật cung cầu.

- Theo lý thuyết cung cầu, nếu giá hàng hóa tăng thì cầu giảm, lượng tiêu dùng các hàng hóa thay thế tăng. Nếu xét trường hợp giá thịt heo và thịt bò tăng thì lượng cầu của thịt heo và thịt bò sẽ giảm, người tiêu dùng sẽ tìm loại thịt khác thay thế, không ít thì nhiều thì lượng cầu của thịt gà sẽ tăng. Tuy vậy trong đề thì lượng cầu thịt gà lại giảm là hết sức vô lý, sai qui luật.

 

doc 33 trang thom 08/01/2024 760
Bạn đang xem 20 trang mẫu của tài liệu "Bài tập Nguyên lý thống kê kinh tế", để tải tài liệu gốc về máy hãy click vào nút Download ở trên

Tóm tắt nội dung tài liệu: Bài tập Nguyên lý thống kê kinh tế

Bài tập Nguyên lý thống kê kinh tế
BÀI TẬP NGUYÊN LÝ THỐNG KÊ KINH TẾ
Giáo viên: Huỳnh Thị Kim Uyên
Họ và tên: 
MSSV: 
Lớp: KT1390A2
Nhóm: B04
Phần I/ Phân tích phương sai (ANOVA)
I/ Phân tích phương sai một chiều.
Phân tích phương sai một chiều là phân tích dựa trên ảnh hưởng của một nhân tố.
Anova một chiều là kiểm định về sự bằng nhau của nhiều trung bình tổng thể có phân phối chuẩn, phương sai bằng nhau.
Bài tập 1:
Người ta tiến hành đo hàm lượng Alkaloid trung bình trong mướp đắng (Alkaloid trong mướp đắng có công hiệu lợi niệu hoạt huyết, tiêu viêm thoái nhiệt) ở 3 vùng khác nhau có số liệu như sau:
Vùng 1: 7,5	6,8	7,1	7,5	6,8	6,6	7,8
Vùng 2: 5,8	5,6	6,1	6,0	5,7
Vùng 3: 6,1	6,3	6,5	6,4	6,5	6,3
Hỏi hàm lượng Alkaloid ở những vùng khác nhau có khác nhau hay không? Với =5%.
Giải:
Bài tập này yêu cầu kiểm định về sự bằng và khác nhau giữa các trung bình tổng thể dựa trên ảnh hưởng của hàm lượng Alkaloid nên giải theo phân tích phương sai một chiều.
Cách 1: Cách thông thường (Tính tay)
Giả thuyết:
H: Hàm lượng Alkaloid ở 3 vùng như nhau.
H: Hàm lượng Alkaloid ở 3 vùng khác nhau.
Vùng 1
Vùng 2
Vùng 3
7,5
6,8
7,1
7,5
6,8
6,6
7,8
5,8
5,6
6,1
6,0
5,7
6,1
6,3
6,5
6,4
6,5
6,3
N
7
5
6
N=18
T
50,1
29,2
38,1
T=117,4
359,79
170,7
242,05
= 772,54
(Với i là biến chạy của dòng, j là biến chạy của cột)
SST= 772,54 - = 6,8311
SSA= + + - = 5,326968
SSE= SST – SSA = 1,50414
Bảng ANOVA:
Nguồn
SS
Df
MS
F
F
Yếu tố
Sai số
5,326968
1,50414
2
15
2,6635
0,1003
26,5615
3,68
Tổng cộng
6,8311
17
Quyết định: Ta có F = 26,5615 > F nên bác bỏ H chấp nhận H.
Kết luận: Với =5% hàm lượng Alkaloid có sai khác theo vùng.
Cách 2: Dùng Excel: 
(Vì em dùng Excel 2003 nên sử dụng Excel 2003)
Nếu trong menu Tools chưa có mục Data Analysis thì tiến hành cài Analysis ToolPak như sau: Tools \ Add-Ins \ chọn Analysis ToolPak\ OK.
Chọn Tools\ Data Analysis..
Nhập dữ liệu:
Chọn: Anova: Single Facter:
Chọn các mục như hình:
Khi đó sẽ hiện ra bảng kết quả là: 
Quyết định:
Cách 1: Ta so sánh cột F và F crit.
Vì F = 26,56148> F crit = 3,682316674 => Bác bỏ H chấp nhận H.
Cách 2: Đánh giá dựa vào P-value.
Ta có: p = 1,17756E-05 quá nhỏ => Bác bỏ H chấp nhận H.
	Kết luận: Với =5% hàm lượng Alkaloid có sai khác theo vùng.
	Bài tập 2:
	So sánh kết quả tăng trọng trung bình (kg) của trẻ 3 nhóm tuổi khác nhau sau khi sử dụng sản phẩm dinh dưỡng như nhau trong thời gian 1 năm
Nhóm 1: Trẻ từ 1 tháng tuổi đến 12 tháng tuổi.
	1,0	1,2	1,4	1,1	0,8	0,6
	Nhóm 2: Trẻ từ 12 tháng tuổi đến 24 tháng tuổi.
	2,0	1,8	1,9	1,2	1,4	1,0	1,5	1,8
	Nhóm 3: Trẻ từ 24 tháng tuổi đến 36 tháng tuổi.
	0,4	0,6	0,7	0,2	0,3	0,1	0,2
	Hãy so sánh kết quả tăng trọng của 3 nhóm tuổi trên có như nhau không với =1%.
	Giải:
Bài tập này yêu cầu kiểm định về sự bằng và khác nhau giữa các trung bình tổng thể dựa trên sự tăng trọng của từng nhóm tuổi khi sử dụng cùng một sản phẩm dinh dưỡng nên giải theo phân tích phương sai một chiều.
Giả thuyết:
H: Kết quả tăng trọng của 3 nhóm tuổi là như nhau.
H: Kết quả tăng trọng của 3 nhóm tuổi là khác nhau.
Nhóm 1
Nhóm 2
Nhóm 3
1,0
1,2
1,4
1,1
0,8
0,6
2,0
1,8
1,9
1,2
1,4
1,0
1,5
1,8
0,4
0,6
0,7
0,2
0,3
0,1
0,2
N
5
8
7
N=21
T
6,1
12,6
2,5
T=21,2
6,61
20,74
1,19
=28,54
(Với i là biến chạy của dòng, j là biến chạy của cột)
SST = 28,54 - = 7,1381
SSA = + + - = 6,77795
SSE = SST – SSA = 0,36014
Bảng ANOVA:
Nguồn
SS
Df
MS
F
F
Yếu tố
Sai số
6,77795
0,36014
2
18
3,38898
0,0200079
169,3816
6,01
Tổng cộng
7,1381
20
Quyết định: 
Ta có F = 169,3816 > F = 6,01 nên bác bỏ H chấp nhận H.
Kết luận: 
Với =1% kết quả tăng trọng của 3 nhóm tuổi là khác nhau.
	II/ Phân tích phương sai hai nhân tố không lặp (phân tích phương sai hai chiều có một quan sát trong cùng một ô)
	Phân tích phương sai hai nhân tố không lặp nhằm đánh giá sợ ảnh hưởng của 2 nhân tố trên các giá trị quan sát, đây là trường hợp mở rộng của phân tích phương sai một yếu tố.
	Bài tập 1: Chiết suất từ hoa hồng bằng 3 phương pháp khác nhau và 5 loại dung môi, ta có những kết quả sau:
 Phương pháp chiết suất
Dung môi
B1
B2
B3
A1
A2
A3
A4
A5
120
120
130
150
110
60
70
60
70
75
60
50
50
60
54
	Hãy xét ảnh hưởng của phương pháp chiết xuất và dung môi đến kết quả chiết suất hoa hồng với =1%.
	Giải: 
Đề bài yêu cầu phân tích sự ảnh hưởng của 2 yếu tố phương pháp và dung môi đến kết quả chiết suất. Ta áp dụng phân tích phương sai 2 nhân tố không lặp.
	Cách 1: Tính thông thường.
	Giả thiết:
- H: Dung môi không ảnh hưởng đến kết quả chiết suất.
	 Phương pháp không ảnh hưởng đến kết quả chiết suất.
- H: Dung môi ảnh hưởng đến kết quả chiết suất.
	 Phương pháp ảnh hưởng đến kết quả chiết suất.
 B
A
B1
B2
B3
T
A1
A2
A3
A4
A5
120
120
130
150
110
60
70
60
70
75
60
50
50
60
54
240
240
240
280
239
21600
21800
23000
31000
20641
T
630
335
274
T=1239
80300
22625
15116
=118041
(Với i là biến chạy của dòng, j là biến chạy của cột)
	= 308321
=584201
SST = 118041 - = 155699,6
SSA = - = 432,2667
SSB = - = 14498,8
SSE = SST – SSA – SSB = 768,5333
Nguồn
SS
Df
MS
F
Yếu tố A
Yếu tố B
Sai số
SSA=432,2667
SSB=14498,8
SSE=768,5333
4
2
8
MSA=108,0667
MSB=7249,4
MSE=96,0667
F= 1,1249
F= 75,4622
Tổng
SST= 155699,6
14
Quyết định + kết luận:
F= 1,1249 < F= 7,006 
=> Chấp nhận H
Với =1%, dung môi không ảnh hưởng đến kết quả chiết suất.
F= 75,4622 > F= 8,649
=> Bác bỏ H
Với =1%. Phương pháp ảnh hưởng đến kết quả chiết suất.
Cách 2: Excel
Nhập dữ liệu 
Chọn Tools\Data Analysis\Anova: Two-Factor without replication.
Làm theo các bước như hình:
Kết quả :
Anova: Two-Factor 
Without Replication
- Kiểm định theo cột:
Giả thiết: 
H: Phương pháp không ảnh hưởng đến kết quả chiết suất.
Quyết định: 
p=6,42093E-04% quá nhỏ => Bác bỏ H
Kết luận: Phương pháp ảnh hưởng đến kết quả chiết suất.
- Kiểm định theo hàng:
	Giả thiết: 
	H: Dung môi không ảnh hưởng đến kết quả chiết suất.
	Quyết định:
 p=40,9% quá lớn => Chấp nhận H hoàn toàn.
	Kết luận: Dung môi ảnh hưởng đến kết quả chiết suất.
	Bài tập 2:
4 chuyên gia tài chính được yêu cầu dự đoán về tốc độ tăng trưởng (%) trong năm tới của 5 công ty sản xuất bánh kẹo. Dự đoán được ghi nhận như sau:
Có thể nói rằng dự đoán tốc độ tăng trưởng trung bình là như nhau cho cả 5 công ty sản xuất bánh kẹo được không? =1%.
Giải:
Giả thiết:
H: Các chuyên gia dự đoán tốc độ tăng trưởng là như nhau.
	 Các công ty sản xuất bánh kẹo đều có tốc độ tăng trưởng là như nhau.
H: Các chuyên gia dự đoán tốc độ tăng trưởng khác nhau.
	 Các công ty sản xuất bánh kẹo đều có tốc độ tăng trưởng khác nhau.
 Chuyên gia
Công ty
A
B
C
D
T
1
2
3
4
5
8
14
11
9
12
12
10
9
13
10
8,5
9
12
10
10
13
11
10
13
10
41,5
44
42
45
42
449,25
498
446
519
444
T
54
54
49,5
57
T=214,5
606
594
497,25
659
=2356,25
(Với i là biến chạy của dòng, j là biến chạy của cột)
SST = 2356,25 - = 55,7375
SSA = - = 2,3
SSB = - = 5,7375
SSE = SST – SSA – SSB = 47,7
Nguồn
SS
Df
MS
F
Yếu tố A
Yếu tố B
Sai số
SSA=2,3
SSB=5,7375
SSE=47,7
4
3
12
MSA=0,575
MSB=1,9125
MSE=3,975
F= 0,1447
F= 0,4811
Tổng
SST= 55,7375
19
Quyết định + Kết luận:
- F= 0,1447 < F= 5,41 
=> Chấp nhận H
=> Với =1%. Các chuyên gia dự đoán tốc độ tăng trưởng là như nhau.
- F= 0,4811 < F = 5,95
=> Chấp nhận H
=> Với =1%. Các công ty sản xuất bánh kẹo có tốc độ tăng trưởng như nhau.
III/ Phân tích phương sai 2 nhân tố có lặp (có hơn một tham số trong một ô)
Trong phân tích phương sai 2 nhân tố có lặp, mỗi yếu tố cột và hàng có thể có nhiều quan sát. Vậy nên ngoài việc kiểm định trung bình theo cột, hàng bằng nhau thì chúng ta còn có thể xem xét sự tương tác giữa yếu tố hàng và cột có ảnh hưởng đến hiện tượng nghiên cứu hay không.
Bài tập 1:
Hàm lượng cafein (mg) trong cà phê thu hái trong 2 mùa (mùa khô và mùa mưa) mỗi mùa lấy mẫu 3 lần đầu – giữa – cuối mùa và từ 3 tỉnh ở Tây Nguyên (Kon Tum, Gia Lai, Lâm Đồng) thu được kết quả sau:
Mùa
Thời điểm
Tỉnh
Kon Tum
Gia Lai
Lâm Đồng
Khô
Đầu mùa
Giữa mùa
Cuối mùa
2,4
2,4
2,5
2,1
2,2
2,2
3,2
3,2
3,4
Mưa
Đầu mùa
Giữa mùa
Cuối mùa
2,5
2,5
2,6
2,2
2,3
2,3
3,4
3,5
3,5
(Với i là biến chạy của dòng, j là biến chạy của cột)
Hãy cho biết hàm lượng cafein có khác nhau theo từng mùa hay không? Nếu có thì yếu tố mùa và miền (tỉnh khác nhau) có sự tương tác với nhau hay không? Với =0,05.
Giải:
Với đề bài cho hàng và cột có hơn 1 quan sát, yêu cầu xem xét sự tương tác giữa các yếu tố (hàng và cột) có ảnh hưởng đến đối tượng nghiên cứu không, ta dùng phân tích phương sai 2 yếu tố có lặp.
Cách 1: Giải thông thường
Giả thiết:
H: 
Hàm lượng cafein trong cà phê của các tỉnh là như nhau.
Hàm lượng cafein trong cà phê ở 2 mùa mưa và mùa khô là như nhau.
Không có sự tương tác giữa tỉnh và mùa màng đến hàm lượng cafein trong cà phê.
H:
Hàm lượng cafein trong cà phê của các tỉnh khác nhau.
Hàm lượng cafein trong cà phê ở 2 mùa mưa và mùa khô khác nhau.
Có sự tương tác giữa tỉnh và mùa màng đến hàm lượng cafein trong cà phê.
 Tỉnh
Mùa
Kon Tum
Gia Lai
Lâm Đồng
T
Khô
2,4
2,4
2,5
7,3
2,1
2,2
2,2
6,5
3,2
3,3
3,3
9,8
23,6
Mưa
2,5
2,5
2,6
7,6
3,2
3,2
3,4
6,8
3,4
3,5
3,5
10,4
24,8
T
14,9
13,3
20,2
T=48,4
(Với i là biến chạy của dòng, j là biến chạy của cột)
- = 134,64
- = 23,6+ 24,8 = 1172
- = 14,9 + 13,3+ 20,2 = 806,94
- = 7,3 + 7,6 + 6,5 + 6,8 + 9,8 + 10,4 = 403,74
- T= 2342,56
SST = 134,64 - = 4,4978
SSA = - = 0,08
SSB = - = 4,3478
SSE= 134,64 - 0,06
SSAB = SST – SSA – SSB – SSE = 0,01
Bảng ANOVA
Nguồn
SS
Df
MS
F
Yếu tố A (mùa)
0,08
1
0,08
F=16
Yếu tố B (tỉnh)
4,3478
2
2,1739
F=434,78
Tương tác AB
0,01
2
0,005
F=1
Sai số
0,06
12
0,005
Tổng
4,4978
17
Quyết định + kết luận:
Ta có: 
- F=16 > F = 4,7472 
Bác bỏ H
Với =5%. Hàm lượng cafein khác nhau theo mùa.
- F=434,78 > F=3,8853
Bác bỏ H	
Với =5%. Hàm lượng cafein khác nhau theo từng tỉnh thành.
- F=1 < F = 3,8853
Chấp nhận H
=> Với =5%. Không có sự tương tác giữa mùa và miền (tỉnh thành) đến hàm lượng cafein trong cà phê.
Cách 2: Excel
* Nhập dữ liệu 
* Chọn Tools\Data Analysis\Anova: Two Factor With Replication
Chọn như hình:
Sau khi chạy chương trình máy tính sẽ hiện bảng ANOVA.
Kiểm định theo cột:
+ Giả thiết: 
H: Hàm lượng cafein trong cà phê ở 2 mùa mưa và mùa khô là như nhau.
H: Hàm lượng cafein trong cà phê ở 2 mùa mưa và mùa khô khác nhau.
+ Quyết định: Với =5% > p = 6,36194E-12 => Bác bỏ H
+ Kết luận: Với =5%, hàm lượng cafein trong cà phê ở 2 mùa mưa và mùa khô khác nhau.
Kiểm định theo hàng:
+ Giả thiết:
H: Hàm lượng cafein trong cà phê ở các tỉnh thành là như nhau.
H: Hàm lượng cafein trong cà phê ở các tỉnh thành khác nhau.
+ Quyết định: p = 0,001761696 quá nhỏ => Bác bỏ H.
+ Kết luận: Với =5%, hàm lượng cafein trong cà phê ở các tỉnh thành khác nhau.
Kiểm định về sự tương tác:
+ Giả thiết:
H: Không có sự tương tác giữa tỉnh và mùa màng đến hàm lượng cafein trong cà phê.
H: Có sự tương tác giữa tỉnh và mùa màng đến hàm lượng cafein trong cà phê.
+ Quyết định: F = 0,396569457 Chấp nhận H.
+ Kết luận:
Với =5%, không có sự tương tác giữa tỉnh và mùa màng đến hàm lượng cafein trong cà phê.
Bài tập 2:
Điều tra mức tăng trưởng chiều cao (cm) của cây lúa theo loại đất trồng và loại phân bón khác nhau trong 1 tháng có kết quả:
 Loại đất
Loại phân
1
2
3
4
A
5,5
5,5
6,0
4,5
4,5
4,0
3,5
4,0
3,0
6,0
5,0
4,0
B
5,6
7,0
7,0
5,0
5,5
5,0
4,0
5,0
4,5
5,5
4,5
6,0
Hỏi sự khác nhau của mức tăng trưởng về chiều cao của cây lúa theo từng loại đất và phân bón. Với =5%.
	Giải:
	Giả thiết:
H: 
Mức tăng trưởng theo chiều cao của cây lúa theo loại đất trồng là như nhau.
Mức tăng trưởng theo chiều cao của cây lúa theo loại phân bón là như nhau.
Không có sự tương tác giữa phân bón và loại đất đến sự tăng trưởng theo chiều cao của cây lúa.
H:
Mức tăng trưởng theo chiều cao của cây lúa theo loại đất trồng khác nhau.
Mức tăng trưởng theo chiều cao của cây lúa theo loại phân bón là khác nhau.
- Có sự tương tác giữa phân bón và loại đất đến sự tăng trưởng theo chiều cao của cây lúa.
 Đất
Phân
1
2
3
4
T
A
5,5
5,5
6,0
17
4,5
4,5
4,0
13
3,5
4,0
3,0
10,5
6,0
5,0
4,0
15
55,5
B
5,6
7,0
7,0
19,6
5,0
5,5
5,0
15,5
4,0
5,0
4,5
13,5
5,5
4,5
6,0
16
64,6
T
36,6
28,5
24
31
T=120,1
(Với i là biến chạy của dòng, j là biến chạy của cột)
- = 624,61
- = 7253,41
- = 3688,81
- = 1855,91
- T= 14424,01
SST = 624,61 - = 23,60958
SSA = - = 3,45042
SSB = - = 13,80125
SSE= 624,61 - = 5,9733
SSAB = SST – SSA – SSB – SSE = 0,38458
Bảng ANOVA
Nguồn
SS
Df
MS
F
Yếu tố A (mùa)
3,45042
1
3,45042
F=9,2423
Yếu tố B (tỉnh)
13,80125
3
4,60042
F=12,3227
Tương tác AB
0,38458
3
0,1282
F=0,3434
Sai số
5,9733
16
0,37333
Tổng
23,60958
23
Quyết định + Kết luận:
F=9,2423 < F=246,47 
Chấp nhận H
Với =5%, mức tăng trưởng theo chiều cao của cây lúa theo loại phân bón là như nhau.
F=12,3227 > F= 8,69
Bác bỏ H
Với =5%, mức tăng trưởng theo chiều cao của cây lúa theo loại đất trồng khác nhau
F=0,3434 < F= 8,69
Chấp nhận H
Với =5%, không có sự tương tác giữa phân bón và loại đất đến sự tăng trưởng theo chiều cao của cây lúa.
Phần II/ Kiểm định phi tham số
	I/ Kiểm định Wilcoxon (Kiểm định T)
Kiểm định sự bằng nhau của 2 trung bình tổng thể với mẫu từng cặp.
1/ Mẫu nhỏ (n<=20)
Bài tập:
Trong tháng trước và sau Tết Nguyên Đán, số lượng người mua giày dép tại 10 cửa hàng tại Cần Thơ được thống kê như sau:
Cửa hàng
1
2
3
4
5
6
7
8
9
10
Trước Tết
50
60
65
100
80
90
77
85
40
67
Sau Tết
45
55
68
90
80
85
80
75
48
60
Với mức ý nghĩa 5%, hãy kiểm định lượng người mua giày dép trước và sau Tết có thực sự khác nhau không?
Giải:
Giả thiết: 
	H: - = 0
	H: - 0
Giá trị kiểm định:
Cửa hàng
1
2
3
4
5
6
7
8
9
10
T
Trước Tết
50
60
65
100
80
90
77
85
40
67
Sau Tết
45
55
68
90
80
85
80
75
48
60
Chênh lệch
5
5
-3
10
0
5
-3
10
-8
7
Hạng +
4
4
8,5
4
1,5
8,5
6
36,5
Hạng -
1,5
7
8,5
T = min(T,T) = min(36,5;8,5)= 8,5
n=9
Quyết định:
T = 8,5 < T= 9
=> Bác bỏ giả thuyết H.
Kết luận:
Với =5%, lượng người mua giày dép trước và sau tết thực sự khác nhau.
2/ Mẫu lớn (n>20)
Bài tập:
Công ty sản xuất dầu gội đầu Sunsilk thực hiện một chiến dịch quảng cáo lớn nhằm tăng lượng mua hàng trong cả nước. Để kiểm tra chiến dịch quảng cáo có hiệu quả hay không, nhà sản xuất đã cử người điều tra trước và sau chiến dịch quảng cáo, mẫu là 200 người ở mỗi địa bàn trong 50 địa bàn dân cư (xã, phường) của thành phố Cần Thơ, những người được chọn sẽ được yêu cầu kể tên 5 loại dầu gội đầu.
Ở từng địa bàn, trước và sau khi thực hiện chiến dịch quảng cáo, số lần goohi đầu dầu gội Sunsilk được ghi nhận lại. Chênh lệch trước và sau quảng cáo của số lần gội cũng được tính toán, xếp hạng theo giá trị tuyệt đối của chúng (không có chênh lệch 0). Tổng cộng hạng của các chênh lệch dương có giá trị nhỏ hơn và bằng 625. Hãy xem xét xem sau chiến dịch quảng cáo dầu gội đầu Sunsilk có được khách hàng biết đến nhiều hơn trước hay không với mức ý nghĩa 5%?
Giải:
Giả thiết:
H: Khách hàng nhận biết nhãn hiệu gội đầu Sunsilk trước và sau quảng cáo là như nhau.
H: Sau chiến dịch quảng cáo, khách hàng biết đến dầu gội Sunsilk nhiều hơn.
Ta có: n=50>20 
=> Sử dụng Wilcoxon với mẫu lớn
Theo đề ta có: 
n=50, T=625
= = 637,5
= = 10731,25
=>=103,5917
Z = = -0,12067s
Vì bài này là kiểm định 2 đuôi nên:
Ta có =0,12067 < Z = 1,96
Chấp nhận H.
Kết luận: Khách hàng nhận biết nhãn hiệu gội đầu Sunsilk trước và sau quảng cáo là như nhau.
3/ Tài liệu tham khảo thêm về thực hiện kiểm định dấu và Wilcoxon trong SPSS.
Ví dụ: Điều trị 10 bệnh nhân có ferritin máu cao, với lượng ferritin máu trước và sau điều trị được ghi nhận trong bảng sau:
Bảng: Lượng ferritin máu (ng/ml) trước và sau điều trị:
Tổng hợp có:
7 (-): 7 trường hợp ferritin giảm sau điều trị.
2 (+): tăng ferritin sau điều trị.
1 trường hợp ferritin không thay đổi. 
Thực hiện kiểm định dấu và Wilcoxon trong SPSS. 
Nhập dữ liệu vào SPSS như sau: 
Có 3 cột: 
Cột 1: ID bệnh nhân.
Cột 2: Ferritin trước điều trị.
Cột 3: Ferritin sau điều trị.
Vào Analyze> Nonparametric Tests> 2 Related Samples
Mở màn hình Two-Related-Samples Tests. Dùng chuột bôi cả 2 biến Ferritin_T và Ferritin_S cùng lúc, nhắp chuyển cả hai (1 cặp) vào ô Test Pairs. Đánh dấu nháy vào 2 ô kiểm định Wilcoxon và ô kiểm định Sign.
Nhấn OK, cho kết quả sau đây: 
Bảng kết quả kiểm định dấu:
Chênh lệch mang dấu (-) là 7 (giảm ferritin máu sau điều trị) 
Chênh lệch mang dấu (+) là 2 (tăng ferritin máu sau điều trị) 
Bằng nhau (Ties) là 1 (ferritin không thay đổi sau điều trị) 
Mức ý nghĩa chính xác là 0,180. Không bác bỏ giả thuyết không. 
Kết luận: Không có sự khác biệt nồng độ ferritin trước và sau điều trị. 
Bảng kết quả kiểm định dấu và hạng Wilcoxon 
Thứ hạng trung bình chênh lệch (-): 6,00 
Thứ hạng trung bình chênh lệch (+): 1,50 
Đơn vị lệch chuẩn Z= -2,312 
Ý nghĩa thống kê (2 đuôi)=0,021 
Kết luận: Có sự khác biệt nồng độ ferritin trước và sau điều trị với p=0,021. 
II/ Kiểm định Mann – Whitney (Kiểm định U)
- Kiểm định sự bằng nhau của 2 trung bình tổng thể (mẫu độc lập).
- Kiểm định Mann - Whitney được sử dụng khi chỉ có hai tổng thể nghiên cứu. Kiểm định này cho phép ta xác định xem có phải các mẫu độc lập được lấy ra từ cùng một tổng thể chung hoặc từ các tổng thể khác nhau nhưng có chung một phân phối hay không.
1/ Mẫu nhỏ (n1, n2 < 10)
Bài tập:
Một nữ giáo sư bị phàn nàn là có xu hướng thiên vị các sinh viên nam khi chấm bài thi. Để kiểm tra điều phàn nàn này, ông chủ nhiệm khoa chọn một số bài thi của sinh viên nam và nữ để so sánh (điểm tối đa của mỗi bài là 100). 
Bảng điểm:
Sinh viên nam
75
77
88
66
91
97
84
99
Sinh viên nữ
65
72
81
64
90
80
44
83
Với mức ý nghĩa α =5% ,	hãy cho kết luận về điều phàn nàn nói	trên.
Giải:
Giả thiết: 
	H: - = 0
	H: - 0
Giá trị kiểm định:
Tổng
Sinh viên nam (A)
66
75
77
84
88
91
97
99
Sinh viên nữ (B)
44
64
65
72
80
81
83
90
Rank (A)
4
6
7
11
12
14
15
16
85
Rank (B)
1
2
3
5
8
9
10
13
51
U= 8x8 + - 85 = 15
F(U) = F= 13
=> =5% < 2F(U)
=> Chấp nhận H.
Kết luận: Với =5%, giáo viên nữ không có thiên vị sinh viên nam và nữ.
2/ Mẫu lớn (n1, n2 >10):
Bài tập:
Kiểm tra số biên lai phạt vi cảnh mà hai cảnh sát giao thông A và B xuất ra trong 11 ngày chọn ngẫu nhiên, ta có số liệu: 
Cảnh sát A
32
14
26
37
45
28
32
36
25
30
Cảnh sát B
44
37
24
33
27
41
29
25
34
30
32
Sử dụng tiêu chuẩn Mann-Whitney, với mức ý nghĩa α =5% hãy so sánh số biên lai trung bình mà hai cảnh sát xuất ra mỗi ngày.
Giải:
Giả thiết: 
	H: - = 0
	H: - 0
Giá trị kiểm định:
Tổng
Cảnh sát A
32
14
26
37
45
28
32
36
25
30
Cảnh sát B
44
37
24
33
27
41
29
25
34
30
32
Rank(A)
12
1
5
17,5
21
7
12
16
3,5
9,5
104,5
Rank(B)
20
17,5
2
14
6
19
8
3,5
15
9,5
12
126,5
U= 10x11 + - 104,5 = 60,5
U= 10x11 – 60,5 = 49,5
U = min(U, U)= 49,5
 = = 55
== 201,667
Z = = -0,3873
Quyết định: = 0,3873 < Z= 1,96 
Chấp nhận H.
Kết luận:
Với α =5%, biên lai trung bình của hai cảnh sát xuất ra mỗi ngày là như nhau.
3/ Tài liệu tham khảo thêm về kiểm định Mann-Whitney trong SPSS.
(Cùng đề với tài liệu tham khảo Wilcoxon)
Cách thực hiện Kiểm định Mann-Whitney trong SPSS. 
Vào Analyze> Nonparametric Tests> 2 Independent Samples:
Vào hộp thoại Two-Independent-Samples Tests, đánh dấu nháy vào ô Mann-
Whitney U. Nhắp chuyển FERRITIN vào ô Test Variable List 
Nhấp chuyển NHOM vào ô Grouping Variable, nhấn nút định nghĩa nhóm (Define Groups) với Group 1: 0 ; Group 2: 1.
Nhấn Continue, nhấn OK.
Ta có kết quả sau:
Bảng kết quả kiểm định Mann-Whitney:
Tổng hạng trung bình của nhóm 0 (không uống rượu) là 6,06 
Tổng hạng trung bình của nhóm 1 (có uống rượu) là 10,94 
Mann-Whitney U= 12,500 
Đơn vị lệch chuẩn (Z score)= -2,049 
Mức ý nghĩa quan sát (2 đuôi)=0,040 
Kết luận: Nồng độ ferritin giữa 2 nhóm có và không có uống rượu khác nhau, với p=0,04.
Phần III/ Bài tập yêu cầu:
Bài tập:
Lượng tiêu thụ thịt gà bình quân một người/ tuần (kg):
Bảng 1:
 Regression Statistics 
Multiple R	0,343
R Square	0,118
Adjusted R Square	0,108
Standard Error	0,147
Observations	360
Bảng 2:
ANOVA
	Df	SS	MS	 F	 Significance F
Regression	4	1,03	0,26	11,86	5E-09
Residual	355	7,70	0,02
Total	359	8,73
Bảng 3:
	 Coeficients	 Standard	 t Stat	 P-value	 Lower	 Upper
	 Error	 95%	 95%
Intercept 0,282	 0,121	 2,327	 0,021	 0,044 	 0,520
Thu nhập/người 0,010	 0,002	6,718 0,000	 0,007	 0,013
(triệu đồng)
Giá thịt heo -0,001 0,002 -0,329 0,742 -0,006 0,004
(1.000đ/kg)
Giá thịt bò -0,001 0,002 -0,314 0,754 -0,005 0,003
(1000đ/kg)
Giá thịt gà -0,003 0,002 -2,159 0,031 -0,007 0,000
(1000đ/kg)
Yêu cầu:
Hãy tóm tắt kết quả của hồi quy.
Hãy cho biết ý nghĩa của hệ số R.
Theo anh/ chị mô hình trên có ý nghĩa hay không? Tại sao?
4) Theo kết quả thống kê, hãy cho biết biến nào không ảnh hưởng đến lượng tiêu thụ thịt gà bình quân một người/tuần? Tại sao?
Đề nghị các anh chị hãy giải thích những biến có ý nghĩa.	
5) Với kiến thức kinh tế học đã có, dựa vào dấu của các hệ số hồi quy anh/chị hãy cho biết biến độc lập nào hợp với quy luật và biến độc lập nào không hợp quy luật? Vì sao?
Giải: 
Câu 1.Tóm tắt kết quả hồi qui:
Ta có: 
Y: Lượng tiêu thụ thịt gà bình quân 1 người/ tuần (kg).
X: thu nhập/ người (triệu đồng).
X: Giá thịt heo (1000 đ/ kg).
X: Giá thịt bò (1000 đ/ kg).
X: Giá thịt gà (1000 đ/ kg).
Phương trình hồi qui mẫu:
 = 0,282 + 0,010 X - 0,001 X - 0,001 X - 0,003 X.
- Khi các X=0 thì lượng tiêu thụ thịt gà bình quân 1 người/ tuần là 0,282 kg.
Trong điều kiện các yếu tố khác không đổi (X, X, X) thì khi thu nhập tăng lên 1 triệu đồng thì lượng tiêu thụ thịt gà sẽ tăng lên 0,010 kg.
Trong điều kiện các yếu tố khác không đổi (X, X, X) thì khi giá thịt heo tăng lên 1000 đ/kg thì lượng tiêu thụ thịt gà sẽ giảm 0,001 kg.
Trong điều kiện các yếu tố khác không đổi (X, X, X) thì khi giá thịt bò tăng lên 1000 đ/kg thì lượng tiêu thụ thịt gà sẽ giảm 0,001 kg.
Trong điều kiện các yếu tố khác không đổi (X, X, X) thì khi giá thịt gà tăng lên 1000 đ/kg thì lượng tiêu thụ thịt gà sẽ giảm 0,003 kg.
Câu 2. Ý nghĩa của hệ số R:
R Square = R = 0,118 cho ta biết 11,8% biến thiên của lượng tiêu thụ thịt gà có thể giải thích được bởi biến thiên của lượng thu nhập/ người, biến thiên giá thịt heo, biến thiên giá thịt bò và biến thiên giá thịt gà.
Câu 3. Từ bảng 2 ta thực hiện kiểm định trên mô hình hồi quy tuyến tính đa biến.
ANOVA
	Df	SS	MS	 F	 Significance F
Regression	4	1,03	0,26	11,86	5E-09
Residual	353	7,70	0,02
Total	359	8,73
Giả thuyết:
	H: = = 0 (phương trình hồi qui không có ý nghĩa)
	H: Có ít nhất một tham số 0. (phương trình hồi qui có ý nghĩa)
Giá trị kiểm định: 
	Ta có:
	 > Sig F = 5E-09.
=> Bác bỏ H.
Kết luận: Với . Phương trình hồi qui có ý nghĩa.
Câu 4: 
Bảng 3:
	 Coeficients	 Standard	 t Stat	 P-value	 Lower	 Upper
	 Error	 95%	 95%
Intercept 0,282	 0,121	 2,327	 0,021	 0,044 	 0,520
Thu nhập/người 0,010	 0,002	6,718 0,000	 0,007	 0,013
(triệu đồng)
Giá thịt heo -0,001 0,002 -0,329 0,742 -0,006 0,004
(1.000đ/kg)
Giá thịt bò -0,001 0,002 -0,314 0,754 -0,005 0,003
(1000đ/kg)
Giá thịt gà -0,003 0,002 -2,159 0,031 -0,007 0,000
(1000đ/kg)
a) Giả thuyết:
	H: = 0 (Biến thu nhập không có ý nghĩa trong mô hình hồi quy).
	H: 0 (Biến thu nhập có ý nghĩa trong mô hình hồi quy).
Giá trị kiểm định:
	Dựa vào bảng 3 ta có: p-value 1 = 0 < .
Bác bỏ H.
Kết luận:	
	Biến thu nhập có ý nghĩa trong mô hình hồi quy.
b) Giả thuyết:
	H: = 0 (Biến giá thịt heo không có ý nghĩa trong mô hình hồi quy).
	H: 0 (Biến giá thị heo có ý nghĩa trong mô hình hồi quy).
Giá trị kiểm định:
	Dựa vào bảng 3 ta có: p-value 2 = 0,742 > .
Chấp nhận H.
Kết luận:	
	Biến giá thịt heo không có ý nghĩa trong mô hình hồi quy.
c) Giả thuyết:
	H: = 0 (Biến giá thịt bò không có ý nghĩa trong mô hình hồi quy).
	H: 0 (Biến giá thị bò có ý nghĩa trong mô hình hồi quy).
Giá trị kiểm định:
	Dựa vào bảng 3 ta có: p-value 3 = 0,754 > .
Chấp nhận H.
Kết luận:	
	Biến giá thịt bò không có ý nghĩa trong mô hình hồi quy.
d) Giả thuyết:
	H: = 0 (Biến giá thịt bò không có ý nghĩa trong mô hình hồi quy).
	H: 0 (Biến giá thị bò có ý nghĩa trong mô hình hồi quy).
Giá trị kiểm định:
	Dựa vào bảng 3 ta có: p-value 4 = 0,031 < .
Bác bỏ H.
Kết luận:	
	Biến giá thị bò có ý nghĩa trong mô hình hồi quy.
Câu 5. 
Theo em, dựa vào dấu của các hệ số hồi qui và sự hiểu biết của em về qui luật cung cầu, các biến độc lập hợp qui luật là thu nhập và giá thịt gà, biến không hợp qui luật là giá thịt heo và thịt bò.
Cụ thể là:
Khi thu nhập của một người tăng lên họ có thể có nhiều nhu cầu hơn, họ có thể mua nhiều thứ hơn nên việc mua các loại thịt nói chung và thịt gà nói riêng là nhu cầu bình thường không quá xa xỉ.
Khi giá của thịt gà tăng lên làm cho lượng cầu giảm đó là điều tất nhiên vì những thực phẩm khác cũng có thể đáp ứng nhu cầu của người tiêu dùng nên họ thay thế thịt gà bằng những loại thực phẩm khác làm lượng cầu thịt gà giảm.
=> 2 trường hợp này là hợp qui luật cung cầu.
Theo lý thuyết cung cầu, nếu giá hàng hóa tăng thì cầu giảm, lượng tiêu dùng các hàng hóa thay thế tăng. Nếu xét trường hợp giá thịt heo và thịt bò tăng thì lượng cầu của thịt heo và thịt bò sẽ giảm, người tiêu dùng sẽ tìm loại thịt khác thay thế, không ít thì nhiều thì lượng cầu của thịt gà sẽ tăng. Tuy vậy trong đề thì lượng cầu thịt gà lại giảm là hết sức vô lý, sai qui luật.
Phụ lục:
Phần I/ Phân tích phương sai (ANOVA)
I/ Phân tích phương sai 1 chiều 	1-6
II/Phân tích phương sai 2 nhân tố không lặp	6-11
III/ Phân tích phương sai 2 nhân tố có lặp	11-18
Phần II/ Kiểm định phi tham số
I/ Kiểm định Wilcoxon
1) Mẫu nhỏ	18-19
2) Mẫu lớn	19-20
3) Tài liệu tham khảo	20-24
II/ Kiểm định Mann-Whitney
1) Mẫu nhỏ	24
2) Mẫu lớn	25
3) Tài liệu tham khảo	26-28
Phần III/ Bài tập yêu cầu.
Bài tập	28-32
Phụ lục	33

File đính kèm:

  • docbai_tap_nguyen_ly_thong_ke_kinh_te.doc