Bài giảng Kinh tế lượng - Chương 2, Phần 2: Khoảng tin cậy, r, R2 và Kiểm định hệ số hồi quy - Phạm Văn Minh
Hàm hồi quy đặt ra nhằm xem xét biến phụ thuộc chịu ảnh
hưởng của biến độc lập như thế nào. Tuy nhiên, bên cạnh
biến độc lập, còn nhiều yếu tố khác cũng ảnh hưởng.
Một hàm hồi quy được coi là thực sự phù hợp khi biến độc
lập có ảnh hưởng thực sự đáng kể, ảnh hưởng một cách có
ý nghĩa khi so sánh với các yếu tố ngẫu nhiên khác. Bên
cạnh đó, với cùng một biến độc lập nhưng nếu dạng hàm
khác nhau thì mức độ ảnh hưởng cũng khác nhau.
Đại lượng để đo mức độ ảnh hưởng làm tương quan so
sánh với yếu tố ngẫu nhiên thì gọi là độ phù hợp của hàm
hồi quy. Đó chính là R2, hệ số xác định (Coefficient of
Determination)
Bạn đang xem 20 trang mẫu của tài liệu "Bài giảng Kinh tế lượng - Chương 2, Phần 2: Khoảng tin cậy, r, R2 và Kiểm định hệ số hồi quy - Phạm Văn Minh", để tải tài liệu gốc về máy hãy click vào nút Download ở trên
Tóm tắt nội dung tài liệu: Bài giảng Kinh tế lượng - Chương 2, Phần 2: Khoảng tin cậy, r, R2 và Kiểm định hệ số hồi quy - Phạm Văn Minh
Chương 2 (tt) MÔ HÌNH HỒI QUI HAI BIẾN Khoảng tin cậy, r, R2 và Kiểm định hệ số hồi quy 1 Phạm Văn Minh biên soạn NỘI DUNG 1. Hệ số xác định R2 2. Hệ số tương quan (r) 3. Tính chất của hệ số tương quan 4. Phân phối xác suất của các ước lượng 5. Khoảng tin cậy của β1, β2 và σ2 6. Kiểm định giả thiết về các hệ số hồi qui 2 Phạm Văn Minh biên soạn 1. Hệ số xác định R2 3 Hàm hồi quy đặt ra nhằm xem xét biến phụ thuộc chịu ảnh hưởng của biến độc lập như thế nào. Tuy nhiên, bên cạnh biến độc lập, còn nhiều yếu tố khác cũng ảnh hưởng. Một hàm hồi quy được coi là thực sự phù hợp khi biến độc lập có ảnh hưởng thực sự đáng kể, ảnh hưởng một cách có ý nghĩa khi so sánh với các yếu tố ngẫu nhiên khác. Bên cạnh đó, với cùng một biến độc lập nhưng nếu dạng hàm khác nhau thì mức độ ảnh hưởng cũng khác nhau. Đại lượng để đo mức độ ảnh hưởng làm tương quan so sánh với yếu tố ngẫu nhiên thì gọi là độ phù hợp của hàm hồi quy. Đó chính là R2, hệ số xác định (Coefficient of Determination) Hệ số xác định R2 – Đại lượng đo “sự thích hợp” (Goodness-of-fit) Nếu tất cả các quan sát đều nằm trên đường hồi qui thì sự thích hợp là “hoàn hảo”. Tuy nhiên, trường hợp này rất hiếm. Điều chúng ta hy vọng là những phần dư xung quanh đường hồi qui này càng nhỏ càng tốt. Hệ số xác định r2 (trường hợp hai biến) hay R2 (trường hợp đa biến) là đại lượng cho ta biết rằng đường hồi qui mẫu thích hợp như thế nào đối với dữ liệu. (?) Phương pháp đồ thị Venn, hay là Ballentine Vòng tròn Y tượng trưng cho biến thiên trong biến phụ thuộc Y Vòng tròn X tượng trưng cho biến thiên trong biến giải thích X 4 1. Hệ số xác định R2 (tt) 5Hệ số xác định R2 – Đại lượng đo “sự thích hợp” (Goodness-of-fit) 1. Hệ số xác định R2 (tt) Quan điểm Ballentine đối với R2: (a) R2 = 0; (f) R2 = 1. Thước đo độ phù hợp của mô hình đối với dữ liệu mẫu là R2 SRF ii yYY ˆˆ =− iii eYY =− ˆ ii yYY =− (TSS) (RSS) (ESS) i Yˆ Y X iY Y TSS = RSS + ESS 1. Hệ số xác định R2 (tt) 7TSS (Total Sum of Squares): Tổng bình phương tất cả các sai lệch giữa các giá trị quan sát Yi với giá trị trung bình của chúng. ESS (Explained Sum of Squares): Tổng bình phương tất cả các sai lệch giữa giá trị của biến Y tính theo MHHQ mẫu với giá trị trung bình của chúng. (Đo độ chính xác của hàm HQ) RSS (Residual Sum of Squares): Tổng bình phương tất cả các sai lệch giữa các giá trị quan sát (giá trị thực tế) của biến Y với các giá trị nhận được (giá trị lí thuyết) từ hàm HQ mẫu. ( )22 2( ) .iiTSS Y Y Y n Y= − = −∑ ∑ ( ) ( )( )2 22 22ˆˆ(Y ) .iiESS Y X n Xβ= − = −∑ ∑ ( )22 ˆYi i iRSS e Y= = −∑ ∑ 1. Hệ số xác định R2 (tt) ∑∑ = = −=−== n i i n i i y e TSS RSS TSS ESSR 1 2 1 2 2 11 ∑ ∑ = = = n i i n i i y x R 1 2 1 22 2 2 ˆβ Với MHHQ 2 biến, người ta chứng minh được: với XXx ii −= YYy ii −= 1. Hệ số xác định R2 (tt) 9 Có thể nói R2 phản ánh tỷ lệ mô hình lý thuyết phản ánh thực tế. Tính chất của R2 : 0 ≤ R2 ≤ 1 R2 = 0: thể hiện X và Y độc lập thống kê. R2 = 1: đường hồi quy phù hợp hoàn hảo, nghĩa là tất cả các sai lệch của Y so với giá trị trung bình đều giải thích được bởi mô hình hồi quy. Ví dụ: R2 = 0,95: có nghĩa biến độc lập X giải thích 95% sự thay đổi của biến phụ thuộc Y. Trong trường hợp này, mức độ phù hợp của SRF với tập dữ liệu mẫu là khá cao. 1. Hệ số xác định R2 (tt) Phạm Văn Minh biên soạn 2. Hệ số tương quan (r) 10 Hệ số tương quan r: Hệ số tương quan r đo lường mức độ phụ thuộc tuyến tính giữa 2 đại lượng (hay biến) X và Y. ∑∑ ∑ == = = n i i n i i n i ii xy xy r 1 2 1 2 1 Lưu ý: r không có ý nghĩa để mô tả quan hệ phi tuyến. Phạm Văn Minh biên soạn 3. Tính chất của hệ số tương quan 11 r > 0: giữa X và Y có quan hệ đồng biến. r ± 1: X và Y có quan hệ tuyến tính chặt chẽ. r 0: X và Y có quan hệ tuyến tính không chặt chẽ. r < 0: X và Y có quan hệ nghịch biến. Hệ số tương quan có tính chất đối xứng: rXY = rYX rXY cùng dấu với . r độc lập với gốc toạ độ và các tỷ lệ, nghĩa là: với a, c > 0, b, d là hằng số, và: dcYYbaXX iiii +=+= ** & thì : rXY = rX*Y* rXY = ± R VD: Với R2 = 0,81 r = ± 0,9 = 0,9 2 , 1 2 1 2 2 12 YXn i i n i i n i ii r yx yx R = = ∑∑ ∑ == = Nếu X, Y độc lập theo quan điểm thống kê thì hệ số tương quan giữa chúng bằng 0. r chỉ là đại lượng đo sự kết hợp tuyến tính hay phụ thuộc tuyến tính. r không có ý nghĩa để mô tả quan hệ phi tuyến. ii XY 75,025,6ˆ += 3. Tính chất của hệ số tương quan (tt) 4. Phân phối xác suất của các ước lượng 13 Giả thiết 6: ui có phân phối N(0, δ2) Với giả thiết nêu trên, các ước lượng có các tính chất sau: - Chúng là các ước lượng không chệch. - Có phương sai cực tiểu. - Khi số quan sát đủ lớn thì các ước lượng này xấp xỉ với giá trị thực của phân phối. 2 21 ˆ , ˆ , ˆ δββ ),(~ˆ 21ˆ11 βδββ N ),(~ˆ 2 2ˆ22 βδββ N Phạm Văn Minh biên soạn 5. Khoảng tin cậy của β1, β2 và σ2 14 Có 2 loại ước lượng: Ước lượng điểm của một tham số tổng thể là cách thức tính toán một giá trị đơn lẻ của tham số tổng thể dựa trên dữ liệu mẫu. Ước lượng khoảng của một tham số tổng thể là cách thức tính toán 2 giá trị dựa trên dữ liệu mẫu, từ đó tạo nên một khoảng được kỳ vọng chứa tham số thống kê của tổng thể. Ước lượng các tham số thống kê của tổng thể Phạm Văn Minh biên soạn 5. Khoảng tin cậy của β1, β2 và σ2 Ước lượng (theo) khoảng 15 Ước lượng khoảng được xây dựng để cho khi lấy mẫu lặp lại nhiều lần thì một tỷ lệ lớn các khoảng này sẽ bao quanh tham số tổng thể mà chúng ta đang quan tâm. Tỷ lệ này là hệ số tin cậy (confidence coefficient). Khoảng được tạo ra được gọi là khoảng tin cậy (confidence interval). Một khoảng tin cậy mẫu lớn với hệ số tin cậy (1-α)*100% dựa trên một ước lượng không bị lệch (không chệch) có phân phối chuẩn được tính như sau: Ước lượng điểm ± tα/2 * Sai số chuẩn của ước lượng (giới hạn tin cậy dưới, giới hạn tin cậy trên) Phạm Văn Minh biên soạn 5. Khoảng tin cậy của β1, β2 và σ2 Ước lượng khoảng 16 Thông thường thể hiện khoảng tin cậy 95%. Có nghĩa: Nếu lấy mẫu và phân tích được lặp đi lặp lại trong cùng một điều kiện (cho ra bộ dữ liệu khác nhau), khoảng cách giữa hai giá trị sẽ bao gồm giá trị thật (tổng thể) đạt 95% giá trị trong tổng số các trường hợp có thể xảy ra. Phạm Văn Minh biên soạn 5. Khoảng tin cậy của β1, β2 17 Ước lượng khoảng cho hệ số hồi quy với mức ý nghĩa α như sau )ˆ;ˆ( iiiii εβεββ +−∈ )ˆ()2/,2( ini Set βε α−= Trong đó: 1 – α được gọi là độ tin cậy. ε (>0) được gọi là độ chính xác của ước lượng. là giới hạn tin cậy dưới. là giới hạn tin cậy trên. ii εβ −ˆ ii εβ +ˆ 5. Khoảng tin cậy của β1, β2 (tt) Với độ tin cậy 1−α, ta có ( )1 / 2 / 21 1 1 1. ( ); . ( )t se t seα αβ β β β β∈ − + ( )2 / 2 / 22 2 2 2. ( ); . ( )t se t seα αβ β β β β∈ − + Trong đó tα/2 là giá trị của đại lượng ngẫu nhiên T phân phối theo quy luật Student với (n – 2) bậc tự do sao cho. ( )/ 2P T tα α> = ( )/ 2 1 / 21 1 1 1. ( ) . ( ) 1P t se t seα αβ β β β β α− ≤ ≤ + = − ( )/ 2 2 / 22 2 2 2. ( ) . ( ) 1P t se t seα αβ β β β β α− ≤ ≤ + = − Để tim tα/2 , ta tra bảng (xem Phụ lục 2, tr.315 SGK) hoặc dùng hàm TINV(α,df) trong Excel. Ví dụ: Sử dụng số liệu VD2: với độ tin cậy 95%. Tìm khoảng tin cậy của β1 , β2 Với độ tin cậy 95% tra bảng trang 315: Vậy khoảng tin cậy của β1 là hay Vậy khoảng tin cậy của β2 là hay ( 2, /2) (8;0,025) 2,306nt tα− = = 24,453 2,306 6,4109± × 19,6695 39,2365β< < 0,5091 2,306 0,03572± × 20,4267 0,5915β< < Ý nghĩa: Trong điều kiện các yếu tố khác không thay đổi, khi thu nhập tăng 1$/tuần thì chi tiêu tiêu dùng trung bình của một gia đình tăng trong khoảng từ 0,4267 đến 0,5914 $/tuần. 5. Khoảng tin cậy của β1, β2 (tt) Excel: =TINV(0.05,8) 5. Khoảng tin cậy của β1, β2 và σ2 (tt) Phân phối Student 21 Đối với σ2, ta có ước lượng khoảng: 2 2 2 2 2 / 2 1 / 2 ( 2 ) ( 2 ) ; n n α α σ σ σ χ χ − − − ∈ với xác suất 2 2 2 2 2 / 2 1 / 2 ( 2 ) ( 2 ) 1 n n P α α σ σ σ α χ χ − − − ≤ ≤ = − trong đó là các giá trị của đại lượng ngẫu nhiên phân phối theo quy luật “khi bình phương” (hay “chi bình phương”) với n – 2 bậc tự do, thỏa mãn điều kiện α αχ χ −2 2/2 1 /2, 2χ 2 2 / 2( ) / 2P αχ χ α> = 2 2 1 / 2( ) 1 / 2P αχ χ α−> = − 5. Khoảng tin cậy của σ2 Để tìm các giá trị này, ta tra bảng hoặc dùng hàm CHIINV trong Excel. 6. Kiểm định giả thiết về các hệ số hồi qui 22 Trong thống kê, giả thiết phát biểu cần được kiểm định được gọi là giả thiết không (H0). Giả thiết đối được ký hiệu là giả thiết H1. Chú ý Khi nói “chấp nhận giả thiết H0”, không có nghĩa H0 đúng mà là “không có cơ sở để bác bỏ H0”. Lựa chọn mức ý nghĩa α: α có thể tùy chọn, thường người ta chọn mức 1%, 5%, hoặc 10%. Các giả thiết cần kiểm định gồm: Các giả thiết về hệ số hồi quy Các giả thiết về phương sai của Ui Các giả thiết về sự phù hợp của mô hình Các cách kiểm định cơ bản: Phương pháp kiểm định t (Student's t-test) Phương pháp khoảng tin cậy Phương pháp p-value (dùng máy vi tính) 6. Kiểm định giả thiết đối với β1, β2 (tt) 23 Ta có thể kiểm định giả thiết nào đó về β1 với mức ý nghĩa α cho trước. Ta có bảng tóm tắt sau đây: với là giá trị kiểm định. * 11 1( ) t se β β β − = Lưu ý. Nếu đưa ra giả thiết thì điều này có nghĩa là đưa ra giả thiết biến độc lập X không ảnh hưởng đến biến phụ thuộc Y. Tương tự cho β2 * 2 2 0β β= = 6. Kiểm định giả thiết đối với β1, β2 (tt) Kiểm đinh t 24 Giả thuyết không: Giả thuyết đối: CÁCH 1 Bước 1: Tính giá trị Bước 2: Tra bảng t-student tìm Bước 3: Quy tắc ra quyết định Nếu bác bỏ H0 Nếu không có cơ sở bác bỏ H0 * 0 * 1 : : ii i i H H β β β β = ≠ * ˆ ˆ( ) i i i i t s e β β β − = )2/,2( α−> ntt )2/,2( α−≤ ntt ( 2, /2)nt α− Phân phối Student 6. Kiểm định giả thiết đối với β1, β2 (tt) Kiểm đinh t -4 -3 -2 -1 0 1 2 3 4 t f(t) α/2α/2 tα/2-tα/2 Miền tới hạn Miền tới hạn Kiểm định Giả thiết H0: β2 = 0 (thu nhập không ảnh hưởng đến chi tiêu) Giả thiết H1: β2 ≠ 0 (thu nhập có ảnh hưởng đến chi tiêu) Ví dụ: Với mức ý nghĩa 5% (α=0,05), thu nhập có ảnh hưởng đến chi tiêu không? 6. Kiểm định giả thiết đối với β1, β2 (tt) Kiểm đinh t, Ví dụ 2 2 ˆ ˆ0,5091; ( ) 0,03572seβ β= = 0,5091 0 14,2525 0,03572 t − = = Với mức ý nghĩa α = 5% và bậc tự do là n – 2 = 8 thì t(n-2;α/2) = 2,306 ( 2, /2)nt t α−> ⇒ Bác bỏ giả thiết H0 Ý nghĩa: biến thu nhập thực sự có ảnh hưởng đến chi tiêu. 6. Kiểm định giả thiết đối với β1, β2 (tt) Kiểm đinh t, Ví dụ (tt) Ta có: Tính t: 6. Kiểm định giả thiết đối với β1, β2 (tt) Kiểm đinh bằng khoảng tin cậy 28 CÁCH 2: Phương pháp khoảng tin cậy Giả sử ta tìm được khoảng tin cậy của βi là: , với mức ý nghĩa α trùng với mức ý nghĩa của giả thiết H0 Quy tắc quyết định - Nếu “chấp nhận” H0 - Nếu bác bỏ H0 )ˆ;ˆ( iiiii εβεββ +−∈ )ˆ()2/,2( ini Set βε α−= )ˆ;ˆ(* iiiii εβεββ +−∈ )ˆ;ˆ(* iiiii εβεββ +−∉ 6. Kiểm định giả thiết đối với β1, β2 (tt) Kiểm đinh bằng P-value 29 CÁCH 3: Phương pháp P-value Tính Quy tắc quyết định - Nếu p ≤ α : Bác bỏ H0 - Nếu p > α : “chấp nhận” H0 (Phương pháp này thường dùng khi tiến hành trên máy vi tính) )ˆ( ˆ * i ii i Se t β ββ − = ptTP i => )(
File đính kèm:
- bai_giang_kinh_te_luong_chuong_2_phan_2_khoang_tin_cay_r_r2.pdf