Bài giảng Kinh tế lượng - Chương 4: Kiểm định giả thuyết thống kê với phương trình hồi qui đơn biến - Đinh Thị Thanh Bình

KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ

 Ví dụ như một viện nghiên cứu nông nghiệp cho

rằng giống lúa mới SYM05 có năng suất trung

bình 9 tấn/ha. Để đánh giá nhận định này, ta thiết

lập giả thiết sau:

H

0: µ = 9

H

1: µ ≠ 9

 Với µ là năng suất trung bình thực tế của giống lúa này

 µ0 = 9 là năng suất trung bình của giống lúa này theo

báo cáo của viện nghiên cứu.

23

 H

0 gọi là giả thiết thống kê (giả thiết không- null

hypothesis)

 H

1 gọi là giả thiết đối (alternative hypothesis).

 Nếu sau khi kiểm định ta chấp nhận H0 (xem H0 là

đúng) thì đánh giá nhận định của viện nghiên cứu là

đúng. Còn nếu ta bác bỏ H0 (xem H0 là sai) thì cho

rằng nhận định của viện nghiên cứu là sai.

pdf 35 trang kimcuc 8520
Bạn đang xem 20 trang mẫu của tài liệu "Bài giảng Kinh tế lượng - Chương 4: Kiểm định giả thuyết thống kê với phương trình hồi qui đơn biến - Đinh Thị Thanh Bình", để tải tài liệu gốc về máy hãy click vào nút Download ở trên

Tóm tắt nội dung tài liệu: Bài giảng Kinh tế lượng - Chương 4: Kiểm định giả thuyết thống kê với phương trình hồi qui đơn biến - Đinh Thị Thanh Bình

Bài giảng Kinh tế lượng - Chương 4: Kiểm định giả thuyết thống kê với phương trình hồi qui đơn biến - Đinh Thị Thanh Bình
TS. Đinh Thị Thanh Bình 
Khoa Kinh Tế Quốc Tế- Đại học Ngoại thương 
Chương 4 
 Kiểm định giả thuyết thống kê với phương 
trình hồi qui đơn biến 
1 
2 
 KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ 
 Ví dụ như một viện nghiên cứu nông nghiệp cho 
rằng giống lúa mới SYM05 có năng suất trung 
bình 9 tấn/ha. Để đánh giá nhận định này, ta thiết 
lập giả thiết sau: 
 H0: µ = 9 
 H1: µ ≠ 9 
 Với µ là năng suất trung bình thực tế của giống lúa này 
 µ0 = 9 là năng suất trung bình của giống lúa này theo 
báo cáo của viện nghiên cứu. 
2 
3 
 H0 gọi là giả thiết thống kê (giả thiết không- null 
hypothesis) 
 H1 gọi là giả thiết đối (alternative hypothesis). 
 Nếu sau khi kiểm định ta chấp nhận H0 (xem H0 là 
đúng) thì đánh giá nhận định của viện nghiên cứu là 
đúng. Còn nếu ta bác bỏ H0 (xem H0 là sai) thì cho 
rằng nhận định của viện nghiên cứu là sai. 
 KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ 
4 
 Để kiểm định giả thiết xem chấp nhận hay bác bỏ H0 
thì người ta phải dựa vào kết quả khảo sát trên mẫu và 
đưa ra quyết định dựa trên mẫu. Có bốn trường hợp có 
thể xảy ra: 
Quyết định chủ quan 
Thực tế khách quan Bác bỏ H0 Chấp nhận H0 
H0 sai 
Đúng Sai lầm loại II 
H0 đúng 
Sai lầm loại I Đúng 
5 
 Xác suất xảy ra sai lầm loại I thường được xét nhỏ 
hơn hoặc bằng một giá trị số α cho trước, và α gọi 
là mức ý nghĩa của kiểm định. Xác suất xảy ra sai 
lầm loại II thường ký hiệu là β: 
 P(sai lầm loại I) = P(bác bỏ H0/H0 đúng) ≤ α 
 P(sai lầm loại II) = P(chấp nhận H0/H0 sai) = 
β 
 Tư tưởng của kiểm định là tìm cơ sở để bác bỏ giả 
thiết H0. Nếu có đủ cơ sở để bác bỏ thì ta bác bỏ 
H0, còn nếu không có đủ cơ sở để bác bỏ thì ta 
phải chấp nhận H0. 
 5 
KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ 
1. Phân bố xác suất của các ước lượng OLS 
Giả thiết 6: Sai số u độc lập với các biến X và có phân 
phối chuẩn: 
6 
2(0, )u N 
Định lý 4.1: Với giả thiết từ 1-6, 
or [( , ar( )]
 ( ) / ( ) or (0,1)
jj j
jj j
N mal V
sd N mal
 
  
Định lý 4.2: Với giả thiết từ 1-6, 
trong đó k là số lượng biến độc lập 
7 
1
( ) / ( )
n kjj j
se t  
2. Kiểm định giả thuyết về hệ số hồi quy 
 Có ba dạng giả thuyet kiểm định như sau về hệ số 
hồi quy: 
- Hai phía: 
- Phía phải: 
- Phía trái: 
 Trong đó, βi nhận giá trị là β0 hoặc β1 (trong phạm 
vi mô hình hồi quy đơn mà ta đang xét). 
 là giả thiết về giá trị thực của βi, 
8 
*
1
*
0
:
:
ii
ii
H
H


*
1
*
0
:
:
ii
ii
H
H


*
1
*
0
:
:
ii
ii
H
H


*
i
Các thông số cần thiết 
 Thống kê T 
 Mức ý nghĩa 
 Hệ số tin cậy 
 Giá trị tới hạn (critical value): c 
9 
(1 ) 
2.1. Ước lượng khoảng: một vài tư tưởng 
 Ta biết rằng và là ước lượng điểm (point 
estimators) của β0 và β1 nhưng do các dao động 
của việc lấy mẫu lặp lại nên các ước lượng điểm có 
thể khác với giá trị thực mặc dù trung bình giá trị 
của các ước lượng và bằng với giá trị thực β0 
và β1. 
 Do đó người ta muốn xây dựng một khoảng xung 
quanh giá trị ước lượng điểm với lòng tin rằng giá 
trị thực sẽ nằm trong khoảng đó với một độ tin cậy 
nhất định. 
 Cách làm này gọi là ước lượng khoảng. 
10 
0ˆ 1ˆ
0ˆ 1ˆ
 Khoảng tin cậy của hệ số β1 
 Với các giả thiết 1-6, ta có: 
11 
2
1 11 1
1
ˆˆ ( ) ( )
ˆ( )
ix x
T
se
  
 

1 2n k n
T Tt t 
Khoảng tin cậy của hệ số β1 
 Xác định giá trị tới hạn để diện tích trong 
phân phối của T nằm giữa và 
 Khoảng tin cậy chứa β1 với xác suất bằng là: 
12 
/2c 
/2c /2c 
/2 /2( ) 1P c T c 
/2
1 1
( )c se  
(1 ) 
(1 ) 
Khoảng tin cậy của hệ số β1 
 Khoảng tin cậy bên phải: 
 Khoảng tin cậy bên trái: 
13 
11
( ), )( c se   
11
( )( , c se   
Khoảng tin cậy của hệ số β0 
 Tương tự như trên ta có thể xây dựng được khoảng 
tin cậy cho hệ số β0 như sau: 
Trong đó: 
14 
/2
0 0
( )c se  
1 2 1/2
1
0 2 1/2
1
( )
( )
( ( ) )
n
i
i
n
i
i
n X
se
XX




Khoảng tin cậy của hệ số β0 
 Khoảng tin cậy bên phải: 
 Khoảng tin cậy bên trái: 
15 
00
( ), )( c se   
00
( )( , c se   
Kết luận của phương pháp khoảng tin cậy 
 Đối với kiểm định hai phía: Nếu giá trị không 
rơi vào khoảng này thì ta bác bỏ giả thiết H0. 
 Đối với kiểm định phía phải: Nếu giá trị không 
rơi vào khoảng này thì ta bác giả thiết H0. 
 Đối với kiểm định phía trái: Nếu giá trị không 
rơi vào khoảng này thì ta bác giả thiết H0. 
16 
/2
ˆ ˆ[ ( )]j jc se  
ˆ ˆ[ ( ), ]j jc se   
ˆ ˆ[ , ( )]j jc se   
*
i
*
i
*
i
2.2. Phương pháp giá trị tới hạn 
 Bước 1: Tính giá trị 
 Bước 2: Tra bảng t-student với mức ý nghĩa α/2 (nếu 
là kiểm định hai phía) hoặc mức ý nghĩa α (nếu là 
kiểm định một phía) để có giá trị tới hạn hoặc 
 Bước 3: So sánh với giá trị tới hạn. Quy tắc quyết 
định như sau: 
 17 
/2c c 
*
0
ˆ
ˆ( )
j j
j
T
se
 

0T
 2.2. Phương pháp giá trị tới hạn 
Quy tắc quyết định 
18 
Loại giả 
thuyết 
H0 H1 Miền bác bỏ H0 
Hai phía 
Phía phải 
Phía trái 
*
j j
  
*
#
j j
  0 /2T c 
*
j j
  
*
j j
  0T c 
*
j j
  
*
j j
  
0T c 
2.3. Phương pháp giá trị p-value 
 Bước 1: tính giá trị 
 Bước 2: tính p-value = P (|T| > t0), trong đó T là 
đại lượng ngẫu nhiên có phân phối t-student với 
(n-2) bậc tự do. t0 là giá trị cụ thể của T. 
 Bước 3: nếu cho trước mức ý nghĩa α, quy tắc 
quyết định sẽ là: 
• Kiểm định hai phía: p-value < α: bác bỏ H0 
• Kiểm định một phía: p-value/2 < α: bác bỏ H0 
19 
*ˆ
ˆ( )
j j
j
T
se
 

 3. Kiểm định giả thuyết về phương sai của nhiễu 
 Phương pháp tiến hành kiểm định giả thiết tương tự 
như kiểm định giả thiết về hệ số hồi quy. Bảng 2.06 
trình bày một cách tóm tắt các loại giả thiết, phương 
pháp kiểm định và quy tắc quyết định. 
 Trong giả thiết H0, là giá trị số cho trước và: 
20 
2
0
2
2
22
0
ˆ( 2)
n
n
T



00
( | )p value P T t H 
3.1. Khoảng tin cậy của phương sai 
 Phương sai của tổng thể chính là phương sai của 
thành phần nhiễu ui mà ta kí hiệu là σ
2. 
 Với giả thiết về phân phối chuẩn của nhiễu, ta có 
thống kê: 
21 
2
2
22
ˆ
( 2) n kT n


 
3.2. Khoảng tin cậy của phương sai 
 Xác định giá trị tới hạn để diện tích trong 
phân phối của nằm giữa và 
 Khoảng tin cậy chứa là: 
22 
/2c 
1 /2c /2c 
1 ( /2) /2( ) 1P c T c 
2
2
1 ( /2)
/2 1 /2
( 2) ( 2)n n c
c c

T
(1 ) 
(1 ) 2
Bảng 4.1 Kiểm định giả thiết về phương sai của nhiễu 
23 
giả 
thiết 
H0 H1 Phương 
pháp 
Miền bác bỏ H0 
Hai 
phía 
σ
2
 = 2
0 σ
2
 ≠ 2
0 
Khoảng tin 
cậy 
2
2
2
0
/2 1 /2
ˆ
[( 2) ,( 2) ]n n
c c 
 

Giá trị tới 
hạn 2
T c hoặc 1
2
T c 
p-value p-value < α/2 hoặc p-
value > 1- α/2 
Phía 
phải 
σ
2
 = 2
0 σ
2
> 2
0 
Khoảng tin 
cậy 
2
2
0
ˆ
[( 2) , ]n
c 

 
Giá trị tới 
hạn 
T c 
p-value p-value < α 
Phía 
trái 
σ
2
 = 2
0 σ
2
< 2
0 
Khoảng tin 
cậy 
2
2
0
1
ˆ
[ ,( 2) ]n
c 


Giá trị tới 
hạn 1
T c 
p-value p-value> 1- α 
4. Kiểm định sự phù hợp của mô hình hồi quy 
 5.1. Các tổng bình phương độ lệch 
 5.2. Hệ số xác định (đơn) 
 5.3. Kiểm định sự phù hợp của mô hình hồi quy 
24 
25 
 SST (Total Sum of Squares - Tổng bình phương sai số 
tổng cộng) 
 SSE: (Explained Sum of Squares - Bình phương sai số 
được giải thích) 
 SSR: (Residual Sum of Squares - Tổng bình phương các 
phần dư) 
4.1. CÁC TỔNG BÌNH PHƯƠNG ĐỘ LỆCH 
2( )iSST Y Y 
2ˆ( )iSSE Y Y 
2
2
1
n
i
i
SSR ui iY Y
  
SSE 
SSR 
SRF 
SST 
Y 
X 
Yi 
Xi 
iYˆ
26 
Hình 4.2: Ý nghĩa hình học của SST, SSR và SSE 
4.2. HỆ SỐ XÁC ĐỊNH R2 
1
SSE SSR
SST SST
27 
Ta chứng minh được: SST = SSE + SSR 
28 
Trong mô hình 2 biến: 
2
2
1
2 1
2
1
ˆ ( )
( )
n
i
n
i
i
R
i
XX
YY

 
 
4.2. HỆ SỐ XÁC ĐỊNH R2 
2 1
SSE SSR
R
SST SST
Hệ số xác định R2: đo mức độ phù hợp của hàm hồi quy 
mẫu. 
4.3. Hệ số xác định (đơn) 
Nếu chia cả tử và mẫu của phân số trên cho mẫu n (hoặc (n-
1) nếu là mẫu nhỏ) thì ta sẽ được : 
 và là phương sai mẫu của X và Y. 
 r2 đo tỷ lệ hay số phần trăm của toàn bộ sai lệch của Y với 
giá trị trung bình của chúng được giải thích bằng mô hình 
(hay biến độc lập). 
 r2 nằm trong đoạn [0,1] 
29 
2
2
2 2 2
1 1 22
( )
( 1)ˆ ˆ[ ]
( )
( 1)
i
x
yi
Sn
r
S
n
X X
Y Y
 


2
xS
2
yS
6.3.2. 
4.4. Kiểm định sự phù hợp của mô hình hồi quy 
 Để đánh giá mức độ thích hợp của mô hình hồi 
quy, nghĩa là mô hình hồi quy giải thích được bao 
nhiêu % sự thay đổi của biến phụ thuộc Y, thì ta sử 
dụng hệ số xác định r2. 
 Hệ số r2 càng gần 1 bao nhiêu thì mô hình hồi quy 
càng có ý nghĩa bấy nhiêu. 
30 
4.4. Kiểm định mô hình 
 Chúng ta quan tâm đến việc đánh giá xem giá trị của r2 
khác 0 có ý nghĩa thống kê hay không. Nghĩa là ta tiến 
hành kiểm định giả thiết: 
 Đối với mô hình hồi quy hai biến, giả thiết trên tương 
đương với giả thiết: 
 Ta sẽ tiến hành kiểm định giả thiết này dựa vào giá trị của 
F được tính theo công thức. 
 31 
2
0
2
1
: 0
: 0
H R
H R
0 1
1 1
: 0
: 0
H
H


 4.4.1. Phương pháp giá trị tới hạn 
 Bước 1: Tính 
 Bước 2: Tra bảng F với mức ý nghĩa α và hai bậc 
tự do (1, n-k-1) ta được giá trị tới hạn cα, (1, n-k-1) 
 Bước 3: So sánh F0 và cα, (1, n-k-1) 
Nếu F0 > cα, (1, n-k-1) bác bỏ H0 
Nếu F0 < cα, (1, n-k-1) không có cơ sở để bác bỏ 
H0 
 32 
2
0 2
/
(1 ) / ( 1)
R k
F
R n k
4.4.2. Phương pháp giá trị p-value 
 Bước 1: Tính 
 Bước 2: Tính p-value = P(F > F0) với F là phân phối 
Fisher có hai bậc tự do là (k, n-2) 
 Bước 3: So sánh p-value và mức ý nghĩa α 
 Nếu p-value < α : bác bỏ H0 
 Nếu p-value > α : không có cơ sở để bác bỏ H0 
33 
2
0 2
( 1)
(1 )
R n k
F
R
Bài tập 
 Source | SS df MS Number of obs = 526 
 -------------+------------------------------ F( 4, 521) = 
 Model | Prob > F = 0.0000 
 Residual | 4899.15523 R-squared = 
 -------------+------------------------------ Adj R-squared = 0.3105 
 Total | 7160.41429 525 13.6388844 Root MSE = 
 
 ------------------------------------------------------------------------------ 
 wage | Coef. Std. Err. t P>|t| [95% Conf. Interval] 
 -------------+---------------------------------------------------------------- 
 educ | .5833233 .051656 
 exper | .0556664 .0110553 
 female | -2.067101 .2722077 
 married | .6602419 .2968513 
 _cons | -1.790662 .7512121 
34 
Bài tập 
 Source | SS df MS Number of obs = 526 
 -------------+------------------------------ F( 4, 521) = 60.12 
 Model | 2261.25906 4 565.314766 Prob > F = 0.0000 
 Residual | 4899.15523 521 9.40336896 R-squared = 0.3158 
 -------------+------------------------------ Adj R-squared = 0.3105 
 Total | 7160.41429 525 13.6388844 Root MSE = 3.0665 
 
 ------------------------------------------------------------------------------ 
 wage | Coef. Std. Err. t P>|t| [95% Conf. Interval] 
 -------------+---------------------------------------------------------------- 
 educ | .5833233 .051656 11.29 0.000 .4818437 .6848029 
 exper | .0556664 .0110553 5.04 0.000 .0339479 .0773849 
 female | -2.067101 .2722077 -7.59 0.000 -2.601861 -1.532342 
 married | .6602419 .2968513 2.22 0.027 .0770693 1.243414 
 _cons | -1.790662 .7512121 -2.38 0.017 -3.266439 -.3148853 
35 

File đính kèm:

  • pdfbai_giang_kinh_te_luong_chuong_4_kiem_dinh_gia_thuyet_thong.pdf