Bài giảng Kinh tế lượng - Chương 4: Kiểm định giả thuyết thống kê với phương trình hồi qui đơn biến - Đinh Thị Thanh Bình
KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ
Ví dụ như một viện nghiên cứu nông nghiệp cho
rằng giống lúa mới SYM05 có năng suất trung
bình 9 tấn/ha. Để đánh giá nhận định này, ta thiết
lập giả thiết sau:
H
0: µ = 9
H
1: µ ≠ 9
Với µ là năng suất trung bình thực tế của giống lúa này
µ0 = 9 là năng suất trung bình của giống lúa này theo
báo cáo của viện nghiên cứu.
23
H
0 gọi là giả thiết thống kê (giả thiết không- null
hypothesis)
H
1 gọi là giả thiết đối (alternative hypothesis).
Nếu sau khi kiểm định ta chấp nhận H0 (xem H0 là
đúng) thì đánh giá nhận định của viện nghiên cứu là
đúng. Còn nếu ta bác bỏ H0 (xem H0 là sai) thì cho
rằng nhận định của viện nghiên cứu là sai.
Bạn đang xem 20 trang mẫu của tài liệu "Bài giảng Kinh tế lượng - Chương 4: Kiểm định giả thuyết thống kê với phương trình hồi qui đơn biến - Đinh Thị Thanh Bình", để tải tài liệu gốc về máy hãy click vào nút Download ở trên
Tóm tắt nội dung tài liệu: Bài giảng Kinh tế lượng - Chương 4: Kiểm định giả thuyết thống kê với phương trình hồi qui đơn biến - Đinh Thị Thanh Bình
TS. Đinh Thị Thanh Bình Khoa Kinh Tế Quốc Tế- Đại học Ngoại thương Chương 4 Kiểm định giả thuyết thống kê với phương trình hồi qui đơn biến 1 2 KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ Ví dụ như một viện nghiên cứu nông nghiệp cho rằng giống lúa mới SYM05 có năng suất trung bình 9 tấn/ha. Để đánh giá nhận định này, ta thiết lập giả thiết sau: H0: µ = 9 H1: µ ≠ 9 Với µ là năng suất trung bình thực tế của giống lúa này µ0 = 9 là năng suất trung bình của giống lúa này theo báo cáo của viện nghiên cứu. 2 3 H0 gọi là giả thiết thống kê (giả thiết không- null hypothesis) H1 gọi là giả thiết đối (alternative hypothesis). Nếu sau khi kiểm định ta chấp nhận H0 (xem H0 là đúng) thì đánh giá nhận định của viện nghiên cứu là đúng. Còn nếu ta bác bỏ H0 (xem H0 là sai) thì cho rằng nhận định của viện nghiên cứu là sai. KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ 4 Để kiểm định giả thiết xem chấp nhận hay bác bỏ H0 thì người ta phải dựa vào kết quả khảo sát trên mẫu và đưa ra quyết định dựa trên mẫu. Có bốn trường hợp có thể xảy ra: Quyết định chủ quan Thực tế khách quan Bác bỏ H0 Chấp nhận H0 H0 sai Đúng Sai lầm loại II H0 đúng Sai lầm loại I Đúng 5 Xác suất xảy ra sai lầm loại I thường được xét nhỏ hơn hoặc bằng một giá trị số α cho trước, và α gọi là mức ý nghĩa của kiểm định. Xác suất xảy ra sai lầm loại II thường ký hiệu là β: P(sai lầm loại I) = P(bác bỏ H0/H0 đúng) ≤ α P(sai lầm loại II) = P(chấp nhận H0/H0 sai) = β Tư tưởng của kiểm định là tìm cơ sở để bác bỏ giả thiết H0. Nếu có đủ cơ sở để bác bỏ thì ta bác bỏ H0, còn nếu không có đủ cơ sở để bác bỏ thì ta phải chấp nhận H0. 5 KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ 1. Phân bố xác suất của các ước lượng OLS Giả thiết 6: Sai số u độc lập với các biến X và có phân phối chuẩn: 6 2(0, )u N Định lý 4.1: Với giả thiết từ 1-6, or [( , ar( )] ( ) / ( ) or (0,1) jj j jj j N mal V sd N mal Định lý 4.2: Với giả thiết từ 1-6, trong đó k là số lượng biến độc lập 7 1 ( ) / ( ) n kjj j se t 2. Kiểm định giả thuyết về hệ số hồi quy Có ba dạng giả thuyet kiểm định như sau về hệ số hồi quy: - Hai phía: - Phía phải: - Phía trái: Trong đó, βi nhận giá trị là β0 hoặc β1 (trong phạm vi mô hình hồi quy đơn mà ta đang xét). là giả thiết về giá trị thực của βi, 8 * 1 * 0 : : ii ii H H * 1 * 0 : : ii ii H H * 1 * 0 : : ii ii H H * i Các thông số cần thiết Thống kê T Mức ý nghĩa Hệ số tin cậy Giá trị tới hạn (critical value): c 9 (1 ) 2.1. Ước lượng khoảng: một vài tư tưởng Ta biết rằng và là ước lượng điểm (point estimators) của β0 và β1 nhưng do các dao động của việc lấy mẫu lặp lại nên các ước lượng điểm có thể khác với giá trị thực mặc dù trung bình giá trị của các ước lượng và bằng với giá trị thực β0 và β1. Do đó người ta muốn xây dựng một khoảng xung quanh giá trị ước lượng điểm với lòng tin rằng giá trị thực sẽ nằm trong khoảng đó với một độ tin cậy nhất định. Cách làm này gọi là ước lượng khoảng. 10 0ˆ 1ˆ 0ˆ 1ˆ Khoảng tin cậy của hệ số β1 Với các giả thiết 1-6, ta có: 11 2 1 11 1 1 ˆˆ ( ) ( ) ˆ( ) ix x T se 1 2n k n T Tt t Khoảng tin cậy của hệ số β1 Xác định giá trị tới hạn để diện tích trong phân phối của T nằm giữa và Khoảng tin cậy chứa β1 với xác suất bằng là: 12 /2c /2c /2c /2 /2( ) 1P c T c /2 1 1 ( )c se (1 ) (1 ) Khoảng tin cậy của hệ số β1 Khoảng tin cậy bên phải: Khoảng tin cậy bên trái: 13 11 ( ), )( c se 11 ( )( , c se Khoảng tin cậy của hệ số β0 Tương tự như trên ta có thể xây dựng được khoảng tin cậy cho hệ số β0 như sau: Trong đó: 14 /2 0 0 ( )c se 1 2 1/2 1 0 2 1/2 1 ( ) ( ) ( ( ) ) n i i n i i n X se XX Khoảng tin cậy của hệ số β0 Khoảng tin cậy bên phải: Khoảng tin cậy bên trái: 15 00 ( ), )( c se 00 ( )( , c se Kết luận của phương pháp khoảng tin cậy Đối với kiểm định hai phía: Nếu giá trị không rơi vào khoảng này thì ta bác bỏ giả thiết H0. Đối với kiểm định phía phải: Nếu giá trị không rơi vào khoảng này thì ta bác giả thiết H0. Đối với kiểm định phía trái: Nếu giá trị không rơi vào khoảng này thì ta bác giả thiết H0. 16 /2 ˆ ˆ[ ( )]j jc se ˆ ˆ[ ( ), ]j jc se ˆ ˆ[ , ( )]j jc se * i * i * i 2.2. Phương pháp giá trị tới hạn Bước 1: Tính giá trị Bước 2: Tra bảng t-student với mức ý nghĩa α/2 (nếu là kiểm định hai phía) hoặc mức ý nghĩa α (nếu là kiểm định một phía) để có giá trị tới hạn hoặc Bước 3: So sánh với giá trị tới hạn. Quy tắc quyết định như sau: 17 /2c c * 0 ˆ ˆ( ) j j j T se 0T 2.2. Phương pháp giá trị tới hạn Quy tắc quyết định 18 Loại giả thuyết H0 H1 Miền bác bỏ H0 Hai phía Phía phải Phía trái * j j * # j j 0 /2T c * j j * j j 0T c * j j * j j 0T c 2.3. Phương pháp giá trị p-value Bước 1: tính giá trị Bước 2: tính p-value = P (|T| > t0), trong đó T là đại lượng ngẫu nhiên có phân phối t-student với (n-2) bậc tự do. t0 là giá trị cụ thể của T. Bước 3: nếu cho trước mức ý nghĩa α, quy tắc quyết định sẽ là: • Kiểm định hai phía: p-value < α: bác bỏ H0 • Kiểm định một phía: p-value/2 < α: bác bỏ H0 19 *ˆ ˆ( ) j j j T se 3. Kiểm định giả thuyết về phương sai của nhiễu Phương pháp tiến hành kiểm định giả thiết tương tự như kiểm định giả thiết về hệ số hồi quy. Bảng 2.06 trình bày một cách tóm tắt các loại giả thiết, phương pháp kiểm định và quy tắc quyết định. Trong giả thiết H0, là giá trị số cho trước và: 20 2 0 2 2 22 0 ˆ( 2) n n T 00 ( | )p value P T t H 3.1. Khoảng tin cậy của phương sai Phương sai của tổng thể chính là phương sai của thành phần nhiễu ui mà ta kí hiệu là σ 2. Với giả thiết về phân phối chuẩn của nhiễu, ta có thống kê: 21 2 2 22 ˆ ( 2) n kT n 3.2. Khoảng tin cậy của phương sai Xác định giá trị tới hạn để diện tích trong phân phối của nằm giữa và Khoảng tin cậy chứa là: 22 /2c 1 /2c /2c 1 ( /2) /2( ) 1P c T c 2 2 1 ( /2) /2 1 /2 ( 2) ( 2)n n c c c T (1 ) (1 ) 2 Bảng 4.1 Kiểm định giả thiết về phương sai của nhiễu 23 giả thiết H0 H1 Phương pháp Miền bác bỏ H0 Hai phía σ 2 = 2 0 σ 2 ≠ 2 0 Khoảng tin cậy 2 2 2 0 /2 1 /2 ˆ [( 2) ,( 2) ]n n c c Giá trị tới hạn 2 T c hoặc 1 2 T c p-value p-value < α/2 hoặc p- value > 1- α/2 Phía phải σ 2 = 2 0 σ 2 > 2 0 Khoảng tin cậy 2 2 0 ˆ [( 2) , ]n c Giá trị tới hạn T c p-value p-value < α Phía trái σ 2 = 2 0 σ 2 < 2 0 Khoảng tin cậy 2 2 0 1 ˆ [ ,( 2) ]n c Giá trị tới hạn 1 T c p-value p-value> 1- α 4. Kiểm định sự phù hợp của mô hình hồi quy 5.1. Các tổng bình phương độ lệch 5.2. Hệ số xác định (đơn) 5.3. Kiểm định sự phù hợp của mô hình hồi quy 24 25 SST (Total Sum of Squares - Tổng bình phương sai số tổng cộng) SSE: (Explained Sum of Squares - Bình phương sai số được giải thích) SSR: (Residual Sum of Squares - Tổng bình phương các phần dư) 4.1. CÁC TỔNG BÌNH PHƯƠNG ĐỘ LỆCH 2( )iSST Y Y 2ˆ( )iSSE Y Y 2 2 1 n i i SSR ui iY Y SSE SSR SRF SST Y X Yi Xi iYˆ 26 Hình 4.2: Ý nghĩa hình học của SST, SSR và SSE 4.2. HỆ SỐ XÁC ĐỊNH R2 1 SSE SSR SST SST 27 Ta chứng minh được: SST = SSE + SSR 28 Trong mô hình 2 biến: 2 2 1 2 1 2 1 ˆ ( ) ( ) n i n i i R i XX YY 4.2. HỆ SỐ XÁC ĐỊNH R2 2 1 SSE SSR R SST SST Hệ số xác định R2: đo mức độ phù hợp của hàm hồi quy mẫu. 4.3. Hệ số xác định (đơn) Nếu chia cả tử và mẫu của phân số trên cho mẫu n (hoặc (n- 1) nếu là mẫu nhỏ) thì ta sẽ được : và là phương sai mẫu của X và Y. r2 đo tỷ lệ hay số phần trăm của toàn bộ sai lệch của Y với giá trị trung bình của chúng được giải thích bằng mô hình (hay biến độc lập). r2 nằm trong đoạn [0,1] 29 2 2 2 2 2 1 1 22 ( ) ( 1)ˆ ˆ[ ] ( ) ( 1) i x yi Sn r S n X X Y Y 2 xS 2 yS 6.3.2. 4.4. Kiểm định sự phù hợp của mô hình hồi quy Để đánh giá mức độ thích hợp của mô hình hồi quy, nghĩa là mô hình hồi quy giải thích được bao nhiêu % sự thay đổi của biến phụ thuộc Y, thì ta sử dụng hệ số xác định r2. Hệ số r2 càng gần 1 bao nhiêu thì mô hình hồi quy càng có ý nghĩa bấy nhiêu. 30 4.4. Kiểm định mô hình Chúng ta quan tâm đến việc đánh giá xem giá trị của r2 khác 0 có ý nghĩa thống kê hay không. Nghĩa là ta tiến hành kiểm định giả thiết: Đối với mô hình hồi quy hai biến, giả thiết trên tương đương với giả thiết: Ta sẽ tiến hành kiểm định giả thiết này dựa vào giá trị của F được tính theo công thức. 31 2 0 2 1 : 0 : 0 H R H R 0 1 1 1 : 0 : 0 H H 4.4.1. Phương pháp giá trị tới hạn Bước 1: Tính Bước 2: Tra bảng F với mức ý nghĩa α và hai bậc tự do (1, n-k-1) ta được giá trị tới hạn cα, (1, n-k-1) Bước 3: So sánh F0 và cα, (1, n-k-1) Nếu F0 > cα, (1, n-k-1) bác bỏ H0 Nếu F0 < cα, (1, n-k-1) không có cơ sở để bác bỏ H0 32 2 0 2 / (1 ) / ( 1) R k F R n k 4.4.2. Phương pháp giá trị p-value Bước 1: Tính Bước 2: Tính p-value = P(F > F0) với F là phân phối Fisher có hai bậc tự do là (k, n-2) Bước 3: So sánh p-value và mức ý nghĩa α Nếu p-value < α : bác bỏ H0 Nếu p-value > α : không có cơ sở để bác bỏ H0 33 2 0 2 ( 1) (1 ) R n k F R Bài tập Source | SS df MS Number of obs = 526 -------------+------------------------------ F( 4, 521) = Model | Prob > F = 0.0000 Residual | 4899.15523 R-squared = -------------+------------------------------ Adj R-squared = 0.3105 Total | 7160.41429 525 13.6388844 Root MSE = ------------------------------------------------------------------------------ wage | Coef. Std. Err. t P>|t| [95% Conf. Interval] -------------+---------------------------------------------------------------- educ | .5833233 .051656 exper | .0556664 .0110553 female | -2.067101 .2722077 married | .6602419 .2968513 _cons | -1.790662 .7512121 34 Bài tập Source | SS df MS Number of obs = 526 -------------+------------------------------ F( 4, 521) = 60.12 Model | 2261.25906 4 565.314766 Prob > F = 0.0000 Residual | 4899.15523 521 9.40336896 R-squared = 0.3158 -------------+------------------------------ Adj R-squared = 0.3105 Total | 7160.41429 525 13.6388844 Root MSE = 3.0665 ------------------------------------------------------------------------------ wage | Coef. Std. Err. t P>|t| [95% Conf. Interval] -------------+---------------------------------------------------------------- educ | .5833233 .051656 11.29 0.000 .4818437 .6848029 exper | .0556664 .0110553 5.04 0.000 .0339479 .0773849 female | -2.067101 .2722077 -7.59 0.000 -2.601861 -1.532342 married | .6602419 .2968513 2.22 0.027 .0770693 1.243414 _cons | -1.790662 .7512121 -2.38 0.017 -3.266439 -.3148853 35
File đính kèm:
- bai_giang_kinh_te_luong_chuong_4_kiem_dinh_gia_thuyet_thong.pdf