Giáo trình Kinh tế lượng
Giới thiệu về môn học kinh tế lƣợng
Kinh tế lượng có tên tiếng Anh là Econometrics, do nhà kinh tế học người Na uy A. K
Ragnar Frisch sử dụng lần đầu tiên vào khoảng 1930.
Kinh tế lượng là một môn khoa học về đo lường các mối quan hệ kinh tế diễn ra trong
thực tế, là sự kết hợp giữa các lý thuyết kinh tế hiện đại, thống kê toán học và máy vi tính
nhằm định lượng các mối quan hệ kinh tế, dự báo khả năng phát triển của hiện tượng
kinh tế và phân tích các chính sách kinh tế.
Nền tảng của kinh tế lượng:
Lý thuyết kinh tế: Nêu lên bản chất các mối quan hệ kinh tế dưới dạng định tính.
Chẳng hạn mối quan hệ giữa lượng cầu và giá cả, sản lượng và số lượng công
nhân, thu nhập và chi tiêu, năng suất cây trồng và lượng phân bón, doanh thu và
chi phí quảng cáo, giá nhà và hướng nhà, sự chi tiêu và sự giàu có,
Mô hình toán kinh tế: Sử dụng công cụ toán học để mô hình hóa lý thuyết kinh tế
dưới dạng mô hình toán học, chưa quan tâm đến việc kiểm chứng xem liệu những
mô hình toán học này có đúng đắn về mặt thực nghiệm hay không.
Thống kê: Có vai trò quan trọng trong việc thu thập, xử lý số liệu, và những số
liệu sơ cấp ban đầu này không thể thiếu cho một nhà kinh tế lượng.
Mục đích của kinh tế lượng
Thiết lập mô hình toán học để nêu ra các giả thiết cũng như các giả định về mối
quan hệ giữa các biến số kinh tế với nhau.
Thực hiện việc ước lượng tham số để xem xét mức độ ảnh hưởng giữa các biến số.
Kiểm định giả thuyết.
Đưa ra dự báo và mô phỏng hiện tượng kinh tế.
Đề xuất giải pháp, chính sách dựa trên kết quả của được phân tích từ mô hình kinh
tế lượng.
Tóm tắt nội dung tài liệu: Giáo trình Kinh tế lượng
1 TRƢỜNG ĐẠI HỌC QUY NHƠN KHOA KINH TẾ & KẾ TOÁN CAO TẤN BÌNH BÀI GIẢNG KINH TẾ LƢỢNG Quy Nhơn, 9/2017 2 Chƣơng 1 KHÁI QUÁT VỀ KINH TẾ LƢỢNG 1.1 Giới thiệu về môn học kinh tế lƣợng Kinh tế lượng có tên tiếng Anh là Econometrics, do nhà kinh tế học người Na uy A. K Ragnar Frisch sử dụng lần đầu tiên vào khoảng 1930. Kinh tế lượng là một môn khoa học về đo lường các mối quan hệ kinh tế diễn ra trong thực tế, là sự kết hợp giữa các lý thuyết kinh tế hiện đại, thống kê toán học và máy vi tính nhằm định lượng các mối quan hệ kinh tế, dự báo khả năng phát triển của hiện tượng kinh tế và phân tích các chính sách kinh tế. Nền tảng của kinh tế lượng: Lý thuyết kinh tế: Nêu lên bản chất các mối quan hệ kinh tế dưới dạng định tính. Chẳng hạn mối quan hệ giữa lượng cầu và giá cả, sản lượng và số lượng công nhân, thu nhập và chi tiêu, năng suất cây trồng và lượng phân bón, doanh thu và chi phí quảng cáo, giá nhà và hướng nhà, sự chi tiêu và sự giàu có, Mô hình toán kinh tế: Sử dụng công cụ toán học để mô hình hóa lý thuyết kinh tế dưới dạng mô hình toán học, chưa quan tâm đến việc kiểm chứng xem liệu những mô hình toán học này có đúng đắn về mặt thực nghiệm hay không. Thống kê: Có vai trò quan trọng trong việc thu thập, xử lý số liệu, và những số liệu sơ cấp ban đầu này không thể thiếu cho một nhà kinh tế lượng. Mục đích của kinh tế lượng Thiết lập mô hình toán học để nêu ra các giả thiết cũng như các giả định về mối quan hệ giữa các biến số kinh tế với nhau. Thực hiện việc ước lượng tham số để xem xét mức độ ảnh hưởng giữa các biến số. Kiểm định giả thuyết. Đưa ra dự báo và mô phỏng hiện tượng kinh tế. Đề xuất giải pháp, chính sách dựa trên kết quả của được phân tích từ mô hình kinh tế lượng. 1.2 Phƣơng pháp luận nghiên cứu của kinh tế lƣợng Nêu vấn đề nghiên cứu và các giả thuyết: Nghiên cứu quan hệ giữa thu nhập và tiêu dùng, mức lãi suất thay đổi và cầu về tiền, năng suất lao động với vốn, lao động và khoa học công nghệ, Thiết lập mô hình: Dựa vào lý thuyết kinh tế để định dạng các mô hình cụ thể cho các bài toán cụ thể. Chẳng hạn, người ta có thể sử dụng hàm tuyến tính để mô tả mối quan hệ giữa thu nhập Y và tiêu dùng X như sau: 3 Y X Tuy nhiên trong thực tế, với cùng một mức thu nhập thì chi tiêu tiêu dùng có thể khác nhau. Do vậy mô hình toán học thuần túy như trên chưa phản ánh được tình huống kinh tế này. Mô hình kinh tế lượng được đề xuất một cách hợp lý với nhiễu ngẫu nhiên U như sau: Y X U Thu thập và xử lý số liệu: Quan tâm đến số liệu của mẫu và số liệu của tổng thể. Ước lượng các tham số của mô hình: Sử dụng các phương pháp như phương pháp bình phương tối thiểu OLS (Ordinary Least Squares), phương pháp ước lượng hàm hợp lý tối đa MLE (Maximum Likelihood Estimation), Chẳng hạn, phương trình mô tả quan hệ giữa tiêu dùng Y và thu nhập X từ chuỗi số liệu của Mỹ giai đoạn 1982-1996 bằng phương pháp OLS là: 184.078 0.706408Y X Nhìn vào kết quả hồi quy này, ta thấy xu hướng tiêu dùng cận biên của nền kinh tế Mỹ giai đoạn 1982-1996 là 2 0.706408 . Kiểm định mô hình: Mục đích của kiểm định là kiểm chứng lại mô hình hoặc lý thuyết kinh tế. Theo ví dụ trên, ta có trị số về xu hướng tiêu dùng cận biên là 2 0.706408 0 phù hợp với lý thuyết kinh tế của Keynes về Thu nhập-Tiêu dùng. Tuy nhiên, ta cũng cần xác định thêm giá trị này có thỏa mãn 20 1 với ý nghĩa thống kê hay không. Dự báo và sử dụng mô hình để quyết định chính sách: Dựa vào kết quả của mô hình trên, có thể dự báo tác động của chính sách kinh tế. Ngoài ra, kết quả hồi quy này có thể giúp ích cho Chính phủ trong việc phân tích chính sách đầu tư, chính sách thuế (giảm thuế -> tăng thu nhập khả dụng -> tăng tiêu dùng -> tăng tổng cầu). 1.3 Số liệu cho nghiên cứu kinh tế lƣợng Có ba dạng dữ liệu kinh tế có bản: Dữ liệu theo thời gian (Time Series Data), dữ liệu theo không gian (dữ liệu chéo) (Cross Data) và dữ liệu hỗn hợp (dữ liệu bảng) (Panel Data). Nguồn số liệu: Các cơ quan nhà nước: Tổng cục thống kê, Uỷ ban Nhân dân thành phố, Các cơ quan quốc tế: Ngân hàng thế giới (WB), Qũy tiền tệ thế giới (IMF), 4 Các cơ quan và tổ chức tư nhân. Wedsite. 1.4 Chất lƣợng của số liệu Chất lượng của số liệu kinh tế-xã hội thường không tốt bởi các nguyên nhân sau đây: Bỏ sót số liệu. Sai sót về kỹ thuật thu thập thông tin (bảng câu hỏi không phù hợp, nội dung câu hỏi không chính xác,). Nhầm lẫn khi quan sát, ghi nhận thông tin. Sai số do dụng cụ đo lường. Sai số khi chọn mẫu không có tính đại diện cao. Mức độ tổng hợp và bảo mật của số liệu sử dụng. Đối tượng cung cấp thông tin thiếu trung thực, không đầy đủ hoặc từ chối trả lời. 1.5 Vai trò của máy vi tính và phần mềm chuyên dụng Hầu hết các bài toán trong kinh tế lượng liên quan đến việc xử lý một khối lượng số liệu rất lớn, do đó cần đến sự trợ giúp của máy vi tính và các chương trình hỗ trợ tính toán, chẳng hạn như: Excel, EVIEWS, SPSS, STATA, R, 5 Chƣơng 2 MÔ HÌNH HỒI QUY TUYẾN TÍNH HAI BIẾN 2.1 Mô hình và một số khái niệm 2.1.1 Mô hình hồi quy Mô hình hồi quy tuyến tính hai biến: 1 2Y X U (2.1.1) Y: Biến phụ thuộc hay biến được giải thích (explained variable) X: Biến độc lập hay biến giải thích (explanatory variable) U: Sai số ngẫu nhiên, giả thiết ( | ) 0E U X 1 2, : Các hằng số 2.1.2 Hàm hồi quy tổng thể Khi ( | ) 0E U X , từ (2.1.1) ta có 1 2( | )E Y X X (2.1.2) Phương trình (2.1.2) được gọi là hàm hồi quy tổng thể PRF (Population Regression Function). 1 : Hệ số chặn, bằng giá trị trung bình của biến Y khi X = 0. 2 : Hệ số góc, thể hiện quan hệ giữa X và ( | )E Y X . 2 0 : Khi X tăng (giảm) một đơn vị thì ( | )E Y X tăng (giảm) 2 đơn vị. 2 0 : Khi X tăng (giảm) một đơn vị thì ( | )E Y X giảm (tăng) 2 đơn vị. 2.1.3 Hàm hồi quy mẫu Để phản ánh hàm hồi quy tổng thể cho tổng thể, cần xây dựng hàm hồi quy mẫu trên mẫu. Nếu hàm hồi quy tổng thể mô tả xu thế biến động về mặt trung bình của biến phụ thuộc theo biến độc lập trong tổng thể, thì hàm hàm hồi quy mẫu là hàm số mô tả xu thế biến động đó nhưng trong mẫu. Vì hàm hồi quy mẫu dùng để phản ánh cho hàm hồi quy tổng thể nên phải có dạng giống hàm hồi quy tổng thể. Giả sử ( , ), 1,i iX Y i n là mẫu ngẫu nhiên kích thước n của ( , )X Y . Khi đó ta có biểu diễn dưới đây được gọi là hàm hồi quy mẫu SRF (Sample Regression Function) 1 2Y X (2.1.3) 6 Trong đó 1 , 2 được gọi là các hệ số số hồi quy mẫu hay hệ số ước lượng, là các ước lượng điểm lần lượt của 1 , 2 thông qua mẫu kích thước n ở trên. Dạng hàm hồi quy mẫu cho từng quan sát: 1 2i iY X (2.1.4) Dạng ngẫu nhiên: 1 2Y X U (2.1.5) 1 2i i iY X U (2.1.6) Nhận xét: Hàm hồi quy mẫu có các tính chất sau đây 1 0 n i i U cov( , ) 0X U cov( , ) 0Y U Y Y Đường hồi quy mẫu đi qua điểm ,X Y 2.1.4 Tính tuyến tính trong mô hình hồi quy Tính tuyến tính của mô hình hồi quy được hiểu là tuyến tính theo tham số. Dưới đây là một số mô hình hồi quy dạng tuyến tính thường gặp: 2 1 2Y X U 1 2 1 Y U X 1 2 lnY X U 1 2ln lnY X U 1 2lnY X U 1 2 1 lnY U X Ví dụ về dạng không tuyến tính (phi tuyến): 1 2XY e U 21 UY X e 7 2 1 1 Y X U 0 1 2 1 Y U X Trong một số trường hợp, sử dụng phép biến đổi phù hợp, ta có thể biến đổi mô hình hồi quy phi tuyến về mô hình hồi quy tuyến tính. 2.2 Phƣơng pháp ƣớc lƣợng OLS (Ordinary Least Squares) Xét mô hình hồi quy tổng thể: 1 2Y X U (2.2.1) Để ước lượng các hệ số 1 2, ta cần rút ra một mẫu ngẫu nhiên kích thước n từ tổng thể: ( , ), 1,i iX Y i n . Khi đó ta có 1 2i i iY X U (2.2.2) 1 2i iY X (2.2.3) Ký hiệu phần dư (Residuals): i i iU Y Y (2.2.4) Chúng ta muốn xác định 1 , 2 sao cho tổng bình phương các phần dư là bé nhất, có nghĩa là 2 2 2 1 2 1 2 1 1 1 , n n n i i i i i i i i f U Y Y Y X Min Đây là bài toán cực trị hai biến không có điều kiện ràng buộc, do đó 1 , 2 sẽ là nghiệm của hệ phương trình sau: 1 2 1 1 2 2 , 0 , 0 f f 1 1 2 2 2 2 1 1 1 2 i n n i i i i i i n n i i i X X Y Y X Y nXY X X X n X Y X với 8 1 1, n n i i i i X Y X Y n n Ví dụ 2.2.1: Xét mẫu số liệu sau đây Thu nhập (triệu đồng/tháng) 8 9 10 11 12 15 15 16 17 20 Chi tiêu (triệu đồng/tháng) 7 8 9 9 10 12 11 13 14 15 Dependent Variable: CHITIEU Method: Least Squares Date: Time: 09:51 Sample: 1 10 Included observations: 10 Variable Coefficient Std. Error t-Statistic Prob. THUNHAP 0.673035 0.042320 15.90340 0.0000 C 1.848641 0.584110 3.164883 0.0133 R-squared 0.969339 Mean dependent var 10.80000 Adjusted R-squared 0.965506 S.D. dependent var 2.658320 S.E. of regression 0.493715 Akaike info criterion 1.603140 Sum squared resid 1.950037 Schwarz criterion 1.663657 Log likelihood -6.015701 Hannan-Quinn criter. 1.536753 F-statistic 252.9182 Durbin-Watson stat 2.400147 Prob(F-statistic) 0.000000 Ta có kết quả hồi quy 1.848641 0.673035i iY X . Ý nghĩa các hệ số ước lượng: 1 1.848641 : Chi tiêu dự định trung bình của mẫu gồm 10 hộ gia đình khi không có thu nhập. 2 0.673035 : Khuynh hướng tiêu dùng trung bình bằng 0.673035 , có nghĩa là khi thu nhập tăng thêm 1 triệu đồng thì chi tiêu trung bình tăng thêm khoảng 0.673035 triệu đồng. 9 2.3 Tính không chệch và độ chính xác của ƣớc lƣợng OLS 2.3.1 Các giả thiết của phƣơng pháp OLS Xét mô hình hồi quy tuyến tính hai biến (2.1.1): 1 2Y X U thỏa mãn các giả thiết sau đây: Giả thiết 1: Mô hình được ước lượng trên mẫu ngẫu nhiên ( , ), 1,i iX Y i n Giả thiết 2: Kỳ vọng có điều kiện bằng 0 ( | ) 0, 1,iE U X i n Giả thiết 3: Phương sai có điều kiện không đổi 2ar( | ) , 1,iV U X i n 2.3.2 Tính không chệch Giả sử mô hình hồi quy tuyến tính hai biến (2.1.1) có hàm hồi quy mẫu là 1 2Y X Ta có định lý sau đây: Định lý: Khi giả thiết 2 được thỏa mãn thì các ước lượng điểm 1 , 2 lần lượt là các ước lượng không chệch của 1 , 2 , có nghĩa là 1 1 2 2,E E 2.3.3 Độ chính xác của các ƣớc lƣợng Độ chính xác của các ước lượng được đo bởi phương sai của các ước lượng đó. Khi phương sai càng bé thì độ chính xác của ước lượng càng cao. Phương sai của các ước lượng được thể hiện qua định lý dưới đây. 10 Định lý: Khi các giả thiết 1, giả thiết 2 và giả thiết 3 được thỏa mãn thì phương sai của các hệ số ước lượng được xác định bởi 2 21 1 2 1 n i i n i i X Var n X X 2 2 2 1 n i i Var X X Trong thực tế ta thường không biết 2 , do đó ta thay 2 bởi ước lượng điểm không chệch, tốt nhất 2 của nó trong các công thức ở trên: 2 2 1 2 n i i U n Như vậy các sai số chuẩn (Standard error) của 1 , 2 là 2 21 1 1 2 1 n i i n i i X Se Var n X X 2 2 2 2 1 n i i Se Var X X Trở lại ví dụ 2.2.1, ta có 2 1 1.950036738 n i i U , 2 1.950036738 0.243754592 10 - 2 , 2 1 136.1 n i i X X 2 2 2 1 0.243754592 0.001790996 136.1 n i i Var X X 11 2 21 1 2 1 190.5 0.001790996 0.341184789 n i i n i i X Var n X X Do đó 1 1 = 0.341184789 0.584110254Se Var 2 2 0.001790996=0.04232Se Var . 2.4 Độ phù hợp của hàm hồi quy mẫu Hàm SRF được gọi là phù hợp tốt với số liệu mẫu quan sát nếu iY gần iY . Quan sát hai hình vẽ dưới đây, nhận thấy rằng hàm hồi quy mẫu trong Hình 2.4.1 tốt hơn so với hàm hồi quy mẫu trong Hình 2.4.2. Hình 2.4.1 Hình 2.4.2 Ký hiệu 2 1 n i i TSS Y Y (Total sum of squares) 2 1 n i i ESS Y Y (Explained sum of squares) 2 1 n i i i RSS Y Y (Residual sum of squares) 12 Ta có TSS ESS RSS Với một mẫu cụ thể và sử dụng phương pháp OLS, TSS là giá trị cố định, nhưng ESS và RSS có giá trị thay đổi tùy thuộc vào dạng hàm hồi quy. Ký hiệu 2 2 1 2 1 1 1 n i i n i i U ESS RSS R TSS TSS Y Y 20 1R 2R được gọi là hệ số xác định (Coefficient of determination) của hàm hồi quy. Vì 20 1R nên thường đổi thành tỷ lệ % cho thuận tiện trong phân tích. Chẳng hạn, khi tính được hệ số xác định bằng 0,8 thì có thể nói rằng mô hình và biến độc lập giải thích được 80% sự biến động của biến phụ thuộc và 20% là do yếu tố ngẫu nhiên khác giải thích. Nhận xét: Nếu hàm hồi quy mẫu thích hợp tốt với số liệu quan sát thì ESS càng lớn hơn RSS ( iY càng gần iY ), có nghĩa là 2R càng gần 1. Nếu hàm hồi quy mẫu kém thích hợp với số liệu quan sát thì ESS càng nhỏ hơn RSS ( iY càng xa iY ), có nghĩa là 2R càng gần 0. Nếu 2 1R , tức là RSS=0 ,i iY Y i thì đường hồi quy thích hợp hoàn hảo, biến độc lập giải thích toàn bộ cho biến phụ thuộc, không còn yếu tố ngẫu nhiên. 13 Nếu 2 0R , tức là RSS=TSS ,iY Y i thì SRP không thích hợp, biến độc lập không giải thích được cho biến phụ thuộc. Trong thực tế rất hiếm khi 2 1R hay 2 0R mà chỉ có 2R gần 0 hay gần 1. Theo kinh nghiệm, với số liệu chuỗi thời gian thì 2 0,9R được xem là tốt, với số liệu chéo thì 2 0,7R được xem là tốt. Để xem xét một mô hình tốt hay không ta không nên chỉ căn cứ vào 2R mà còn dựa trên các yếu tố khác như: dấu của hệ số hồi quy, kinh nghiệm thực tế, khả năng dự báo chính xác, Đối với hai mô hình hồi quy tuyến tính hai biến, mô hình nào có hệ số xác định lớn hơn sẽ được coi là tốt hơn. Xét ví dụ 2.2.1, ta có 2 1 1.950036738 n i i U , 2 1 63.6 n i i Y Y Như vậy 2 2 1 2 1 1.950036738 1 1 1 0.969339 63.6 n i i n i i U ESS RSS R TSS TSS Y Y Vì chuỗi số liệu thời gian đang xét có 2 0.969339 0.9R nên mô hình được sử dụng là tốt. 2.5 Mô hình hồi quy qua gốc tọa độ Khi 1 0 , mô hình hồi quy tổng thể (2.1.1) 1 2Y X U trở thành 2Y X U (2.5.1) và được gọi là mô hình hồi quy qua gốc tọa độ. Khi đó, các hàm hồi quy tổng thể, hàm hồi quy mẫu được viết lại như sau: 2( | )E Y X X (2.5.2) 14 2Y X (2.5.3) Sử dụng phương pháp OLS, ta tính được 1 2 2 1 n i i i n i i X Y X , 2 2 2 1 n i i Var X , 2 2 1 1 1 n i i U RSS n n Đối với mô hình hồi quy qua gốc tọa độ, nếu áp dụng công thức tính hệ số xác định 2 1 RSS R TSS thì 2R hay có thể âm, không có ý nghĩa. Do vậy người ta đưa ra các hệ số mới, chẳng hạn 2 12 ô 2 2 1 1 n i i i th n n i i i i X Y R X Y để thay thế cho 2R mà vẫn thỏa mãn điều kiện 20 1R . Thông thường người ta hay sử dụng mô hình hồi quy có hệ số chặn, sau đó kiểm định hệ số chặn. Ví dụ 2.5.1: Trong lý thuyết danh mục đầu tư hiện đại, mô hình định giá tài sản vốn (CAPM-Capital Asset Pricing Model) có dạng mô hình hồi quy tuyến tính qua gốc tọa độ: i f i m fER r ER r Trong đó iER là suất sinh lợi kỳ vọng của chứng khoán i, iER là suất sinh lợi của danh mục đầu tư thị trường, fr là suất sinh lợi của đầu tư không rủi ro, i là hệ số Beta, công cụ đo lường rủi ro có tính hệ thống (những rủi ro không thể loại trừ bằng cách đa dạng hóa danh mục đầu tư). 2.6 Đơn vị đo ... east Squares Date: 10/22/17 Time: 15:51 Sample (adjusted): 1960 2002 Included observations: 43 after adjustments Variable Coefficient Std. Error t-Statistic Prob. X 0.421166 0.123316 3.415330 0.0015 X(-1) -0.312189 0.150227 -2.078109 0.0443 Y(-1) 0.829531 0.070515 11.76395 0.0000 C 6.426753 2.141585 3.000933 0.0047 R-squared 0.995699 Mean dependent var 88.36279 Adjusted R-squared 0.995369 S.D. dependent var 13.68950 S.E. of regression 0.931627 Akaike info criterion 2.784640 Sum squared resid 33.84923 Schwarz criterion 2.948472 Log likelihood -55.86975 Hannan-Quinn criter. 2.845056 F-statistic 3009.867 Durbin-Watson stat 1.613401 106 Prob(F-statistic) 0.000000 Từ kết quả trên, ta được 0.829531 . 7.3 Phƣơng sai của nhiễu thay đổi 7.3.1 Nguyên nhân Một trong những giả định của mô hình hồi quy tuyến tính cổ điển là phương sai của nhiễu không đổi qua các quan sát (phương sai thuần hay phương sai đồng nhất): 2 2 2 ,i i i iVar U X E X E U E U i . Trong những bài toán thực tế, i iVar U X có thể thay đổi theo sự thay đổi của iX : 2i i iVar U X . Sau đây là một số nguyên nhân dẫn đến phương sai không đồng nhất: Do bản chất của hiện tượng kinh tế: Chẳng hạn như trong mô hình hồi quy của tiết kiệm hay chi tiêu theo thu nhập thấy có phương sai không đồng nhất. Do sai số đo lường và sai số tính toán ngày càng được cải thiện dần. Do tích lũy kinh nghiệm và sai số theo thời gian ngày càng giảm: Chẳng hạn như khi số giờ tác nghiệp của một thợ học việc càng lớn thì số phế phẩm làm ra sẽ càng ít dần bởi thao tác của người thợ này ngày một hoàn hảo hơn. Do trong mẫu xuất hiện các giá trị rất nhỏ hoặc rất lớn so với các giá trị quan sát khác (outlier): Chẳng hạn như khi điều tra trên một mẫu nhỏ về thu nhập và chi tiêu, đôi khi có những quan sát rất khác biệt: thu nhập thấp nhưng chi tiêu rất cao hoặc ngược lại. Do xác định sai dạng mô hình hồi quy: Chẳng hạn như xác định sai dạng hàm, bỏ sót biến quan trọng. Phương sai không đồng nhất thường xuất hiện trong các dữ liệu chéo và dữ liệu bảng. 7.3.2 Hậu quả Ước lượng OLS không cho phương sai bé nhất (không còn là ước lượng hiệu quả). Phương sai và hiệp phương sai của các ước lượng OLS bị chệch. Việc sử dụng thống kê t và F để kiểm định giả thuyết không còn đáng tin cậy nữa. 107 Kết quả dự báo không còn hiệu quả khi sử dụng các ước lượng OLS có phương sai không bé nhất. 7.3.3 Cách phát hiện Việc phát hiện phương sai thay đổi không hề dễ dàng bởi một số lý do sau đây: Không biết tất cả các giá trị của biến phụ thuộc ứng với từng giá trị của biến độc lập. Do đó không thể ước lượng phương sai của nhiễu từ những giá trị riêng biệt này. Công cụ được sử dụng để phát hiện phương sai thay đổi thường là đồ thị của các phần dư iU . Khi cỡ mẫu càng lớn, iU là ước lượng tốt của iU . Phương pháp định tính: + Dựa vào kinh nghiệm từ những cuộc nghiên cứu trước đó hoặc do suy đoán hoặc dựa vào bản chất của hiện tượng nghiên cứu. + Dựa vào việc xem xét đồ thị của phần dư: Nếu không có thông tin tiên nghiệm nào cho thấy có phương sai thay đổi, có thể tiến hành phân tích hồi quy với giả định phương sai đồng đều để xác định phần dư 2 iU , sau đó khảo sát đồ thị của nó để xem xét 2 iU thay đổi có tính hệ thống hay không. Chẳng hạn ta có một số dạng biến thiên của 2 iU dưới đây: + Để củng cố thêm nhận định về hiện tượng phương sai thay đổi, người ta thường kết hợp phương pháp định tính với các phương pháp định lượng. 108 Phương pháp định lượng: + Kiểm định Park: Park giả định rằng phương sai của nhiễu thay đổi dưới dạng hàm mũ như sau: 22 2 2 2 2. . ln ln ln iV i i i i iX e X V . Vì chưa biết 2 i nên ta sử dụng ước lượng 2 iU để thay thế và tiến hành theo các bước sau đây: Bước 1: Hồi quy mô hình gốc 1 2i i iY X U để ước lượng iU và iY . Bước 2: Hồi quy mô hình 2 1 2ln lni i iU X V . Bước 3: Kiểm định giả thuyết 0 2 1 2 : 0 : 0 H H Chú ý: Hạn chế của kiểm định Park là việc giả sử các nhiễu iV thỏa mãn các giả thiết cổ điển. Nếu iV vi phạm giả thiết này thì kết quả kiểm định ở bước 3 không còn đáng tin cậy nữa. + Kiểm định Glejser: Thực hiện tương tự như kiểm định Park nhưng sử dụng các dạng hàm sau: 1 2i i iU X V 1 2i i iU X V 1 2 1 i i i U V X 1 2 1 i i i U V X 1 2i i iU X V 21 2i i iU X V Hạn chế của kiểm định Glejser: iV có thể không thỏa mãn các giả thiết cổ điển. 109 Mô hình 1 2i i iU X V và 2 1 2i i iU X V không có dạng tuyến tính, do đó không thể áp dụng phương pháp OLS. Ngoại trừ mô hình 1 2i i iU X V , các mô hình còn lại được đòi hỏi điều kiện về biến độc lập iX để biểu thức được xác định (biểu thức dưới mẫu khác 0 hoặc biểu thức trong căn bậc hai phải không âm). + Kiểm định Goldfeld-Quandt: Kiểm định này giả thiết rằng phương sai của 2 i tương quan thuận với biến độc X nào đó. Giả sử rằng 2 2 2 i iX ( 2 : hằng số). Bước 1: Sắp xếp mẫu theo thứ tự tăng dần của biến X . Bước 2: Loại bỏ c quan sát ở giữa, n-c quan sát còn lại được chia làm hai nhóm, mỗi nhóm chứa (n-c)/2 quan sát. Bước 3: Thực hiện hồi quy OLS cho 1 2i i iY X U với (n-c)/2 quan sát thu được phương sai 2RSS . Mỗi 2RSS có bậc tự do là df = (n-c-2k)/2, k: tham số trong mô hình. Bước 4: Thực hiện kiểm định F cho giả thuyết 0H : Phương sai không đổi. Xét thống kê 2 1 / / RSS df F RSS df Nếu ( , )F F df df thì bác bỏ 0H . Hạn chế của kiểm định Goldfeld-Quandt: Không có nguyên tắc chung để xác định số quan sát bị loại bỏ, độ tin cậy phụ thuộc vào số quan sát bị loại bỏ này. Theo kinh nghiệm, với cỡ mẫu khoảng 30 thì chọn c = 4 hoặc c = 8; với cỡ mẫu khoảng 60 thì chọn c = 10 hoặc c = 16. Kiểm định Goldfeld-Quandt thích hợp cho những mẫu cỡ nhỏ. + Kiểm định White: Kiểm định này khảo sát phần dư 2 iU theo biến độc lập. Xét mô hình hồi quy gốc: 1 2 2 3 3i i i iY X X U 110 Bước 1: Hồi quy mô hình gốc trên, thu được iU . Bước 2: Hồi quy mô hình phụ 2 2 2 1 2 2 3 3 4 2 5 3 6 2 3i i i i i i i iU X X X X X X U có được hệ số xác định 2 auxR . Bước 3: Thực hiện kiểm định 2 cho giả thuyết 0H : Phương sai không đổi. 0 2 3 4 5 6: 0H Ta có 2 2 ( )auxnR df . Nếu 2 2 ( )auxnR df thì bác bỏ 0H . 7.3.4 Biện pháp khắc phục + Trường hợp đã biết phương sai của thổng thể: Khi có thông tin về phương sai thay đổi, ta có thể sử dụng phương pháp GLS (thực chất là phương pháp OLS áp dụng cho các biến đã được biến đổi từ một mô hình vi phạm giả thiết cổ điển thành mô hình mới thỏa mãn các giả thiết này) để thực hiện hồi quy. Các tham số ước lượng được từ mô hình mới có tính chất BLUE. Xét mô hình 1 2 1 0 2 0 1, i i i i i i i Y X U X X U X i với 2i iVar U . Suy ra * * * *0 1 2 1 0 2 i i i i i i i i i i i i Y X X U Y X X U với * 1,iVar U i . + Trường hợp chưa biết phương sai của tổng thể: Cũng sử dụng phương pháp GLS nhưng cần đòi hỏi thêm một số giả thiết về phương sai của tổng thể như sau: 111 Giả thiết 1: Phương sai của tổng thể tỷ lệ với bình phương của biến độc lập: 2 2i iVar U X Giả thiết 2: Phương sai của tổng thể tỷ lệ với biến độc lập: 2i iVar U X Giả thiết 3: Có thể sử dụng phép biến đổi logarit 1 2ln lni i iY X V 7.3.5 Các ví dụ Ví dụ 7.3.5.1: Khảo sát số liệu về chi phí cho việc nghiên cứu và phát triển của 18 ngành công nghiệp ở Mỹ trong năm 1988 như sau: Nhóm ngành công nghiệp Doanh thu (X2) Đầu tư cho nghiên cứu và phát triển (Y) Lợi nhuận 1 6375.3 62.5 185.1 2 11626.4 92.9 1569.5 3 14655.1 178.3 276.8 4 21869.2 258.4 2828.1 5 26408.3 494.7 2225.9 6 32405.6 1083 3751.9 7 35107.7 1620.6 2884.1 8 40295.4 421.7 4645.7 9 70761.6 509.2 5036.4 10 80552.8 6620.1 13869.9 11 95294.0 3918.6 4487.8 12 101314.1 1595.3 10278.9 13 116141.3 6107.5 8787.3 14 122315.7 4454.1 16438.8 15 141649.9 3163.8 9761.4 16 175025.8 13210.7 19774.5 17 241434.8 1703.8 23168.5 18 293543.0 9528.2 18415.4 Để xem xét tác động của doanh thu lên đầu tư cho nghiên cứu và phát triển, ta ước lượng mô hình: 1 2 2Y X U 112 0 2,000 4,000 6,000 8,000 10,000 12,000 14,000 0 100,000 200,000 300,000 X2 Y Nhìn vào biểu đồ phân tán của biến doanh thu và biến khoản đầu tư cho nghiên cứu và phát triển, nhận thấy hai biến này có quan hệ cùng chiều phù hợp với cơ sở kinh tế học, kỳ vọng rằng khi doanh thu tăng thì khoản đầu tư cho nghiên cứu và phát triển cũng sẽ tăng vì việc nghiên cứu và phát triển tác động tích cực tới các nhóm ngành công nghiệp, làm tăng lợi nhuận. Ngoài ra khi biến 2X có giá trị càng lớn thì các điểm phân tán càn rộng. Điều này cho thấy có dấu hiệu phương sai thay đổi. Để có nhìn nhận chính xác hơn về hiện tượng này, ta khảo sát biểu đồ phần dư: Dependent Variable: Y Method: Least Squares Date: Time: Sample: 1 18 Included observations: 18 Variable Coefficient Std. Error t-Statistic Prob. X2 0.030878 0.008346 3.699582 0.0019 C 266.1917 1002.961 0.265406 0.7941 R-squared 0.461042 Mean dependent var 3056.856 Adjusted R-squared 0.427357 S.D. dependent var 3705.973 S.E. of regression 2804.428 Akaike info criterion 18.82023 Sum squared resid 1.26E+08 Schwarz criterion 18.91916 Log likelihood -167.3820 Hannan-Quinn criter. 18.83387 F-statistic 13.68690 Durbin-Watson stat 3.020747 Prob(F-statistic) 0.001944 113 -8,000 -6,000 -4,000 -2,000 0 2,000 4,000 6,000 8,000 0 100,000 200,000 300,000 X2 P H A N D U 0 10,000,000 20,000,000 30,000,000 40,000,000 50,000,000 60,000,000 0 100,000 200,000 300,000 X2 P H A N D U B IN H P H U O N G Nhìn vào hai đồ thị trên về phần dư, ta nhận thấy có hiện tượng phương sai sai số thay đổi về mẫu số liệu quan sát. Sử dụng phương pháp định lượng để kiểm chứng hiện tượng trên: 114 Kiểm định Park: Dependent Variable: LOG(PHANDUBINHPHUONG) Method: Least Squares Date: Time: Sample: 1 18 Included observations: 18 Variable Coefficient Std. Error t-Statistic Prob. LOG(X2) 0.937739 0.452026 2.074524 0.0545 C 3.411791 4.972480 0.686135 0.5025 R-squared 0.211964 Mean dependent var 13.67970 Adjusted R-squared 0.162712 S.D. dependent var 2.212710 S.E. of regression 2.024705 Akaike info criterion 4.353165 Sum squared resid 65.59091 Schwarz criterion 4.452095 Log likelihood -37.17848 Hannan-Quinn criter. 4.366806 F-statistic 4.303650 Durbin-Watson stat 1.661072 Prob(F-statistic) 0.054525 Nhận thấy p-value cho biến LOG(X2) bằng 0.0545 > 0.05 nên chấp nhận giả thuyết rằng phương sai không đổi ứng với mức ý nghĩa 5%. Kiểm định Glejser: Sử dụng một số dạng hàm hồi quy mà Glejser đề xuất Dependent Variable: ABS(PHANDU) Method: Least Squares Date: Time: Sample: 1 18 Included observations: 18 Variable Coefficient Std. Error t-Statistic Prob. X2 0.012405 0.005606 2.212694 0.0418 C 573.4053 673.6986 0.851130 0.4073 R-squared 0.234304 Mean dependent var 1694.540 Adjusted R-squared 0.186448 S.D. dependent var 2088.493 S.E. of regression 1883.761 Akaike info criterion 18.02437 Sum squared resid 56776901 Schwarz criterion 18.12330 Log likelihood -160.2193 Hannan-Quinn criter. 18.03801 F-statistic 4.896013 Durbin-Watson stat 1.764230 Prob(F-statistic) 0.041804 Thu được 2573.4053+0.012405XiU , 2 0.234304R . 115 Dependent Variable: ABSPHANDU Method: Least Squares Date: Time: Sample: 1 18 Included observations: 18 Variable Coefficient Std. Error t-Statistic Prob. SQR(X2) 8.174684 3.338921 2.448301 0.0263 C -522.8336 1003.769 -0.520870 0.6096 R-squared 0.272535 Mean dependent var 1694.540 Adjusted R-squared 0.227068 S.D. dependent var 2088.493 S.E. of regression 1836.131 Akaike info criterion 17.97315 Sum squared resid 53942043 Schwarz criterion 18.07208 Log likelihood -159.7583 Hannan-Quinn criter. 17.98679 F-statistic 5.994177 Durbin-Watson stat 1.797692 Prob(F-statistic) 0.026262 Thu được 2-522.8336+8.174684 XiU , 2 0.272535R . Dependent Variable: ABSPHANDU Method: Least Squares Date: Time: Sample: 1 18 Included observations: 18 Variable Coefficient Std. Error t-Statistic Prob. 1/X2 -19862635 12455985 -1.594626 0.1304 C 2315.658 611.4543 3.787132 0.0016 R-squared 0.137133 Mean dependent var 1694.540 Adjusted R-squared 0.083204 S.D. dependent var 2088.493 S.E. of regression 1999.722 Akaike info criterion 18.14384 Sum squared resid 63982185 Schwarz criterion 18.24277 Log likelihood -161.2946 Hannan-Quinn criter. 18.15748 F-statistic 2.542831 Durbin-Watson stat 1.495854 Prob(F-statistic) 0.130356 Thu được 2 1 2315.658-19862635. X iU , 2 0.137133R . Các hệ số góc trong kết quả kiểm định Glejser ở mô hình 1 và 2 đều có ý nghĩa thống kê với mức ý nghĩa 5%, còn mô hình 3 không có ý nghĩa thống kê với cùng mức ý nghĩa này. Với cỡ mẫu không phải là lớn n = 18 sử dụng cho kiểm định Glejser, ta cần phải thận trọng trong việc nhận định về hiện tượng phương sai thay đổi. 116 Kiểm định White: Heteroskedasticity Test: White F-statistic 3.024901 Prob. F(2,15) 0.0788 Obs*R-squared 5.173276 Prob. Chi-Square(2) 0.0753 Scaled explained SS 9.164166 Prob. Chi-Square(2) 0.0102 Test Equation: Dependent Variable: RESID^2 Method: Least Squares Date: Time: Sample: 1 18 Included observations: 18 Variable Coefficient Std. Error t-Statistic Prob. C -6096911. 6717947. -0.907556 0.3785 X2^2 -0.000498 0.000464 -1.073878 0.2998 X2 224.3497 131.4379 1.706887 0.1085 R-squared 0.287404 Mean dependent var 6990948. Adjusted R-squared 0.192391 S.D. dependent var 15232775 S.E. of regression 13689244 Akaike info criterion 35.85313 Sum squared resid 2.81E+15 Schwarz criterion 36.00153 Log likelihood -319.6782 Hannan-Quinn criter. 35.87359 F-statistic 3.024901 Durbin-Watson stat 1.705242 Prob(F-statistic) 0.078763 Kết quả kiểm định White cho thấy p-value = 0.0753 >0.05 nên chưa có cơ sở để bác bỏ giả thuyết phương sai đồng nhất. Ngoài các khuyết tật như đã trình bày ở trên, mô hình hồi quy có thể còn có những khuyết tật khác như: Kỳ vọng của sai số ngẫu nhiên khác không (vi phạm giả thiết 2 trong các giả thiết cổ điển của phương pháp OLS), nhiễu ngẫu nhiên không U không tuân theo quy luật chuẩn (vi phạm giả thiết 5 trong các giả thiết cổ điển của phương pháp OLS). 117 Tài liệu tham khảo [1] GS.TS. Nguyễn Quang Dong, TS. Nguyễn Thị Minh, Giáo trình Kinh tế lượng, NXB Đại học kinh tế Quốc dân, 2012. [2] ThS. Phạm Trí Cao, ThS. Vũ Minh Châu, Kinh tế lượng ứng dụng, NXB Thống kê Thành phố Hồ Chí Minh, 2010. [3] PGS.TS. Nguyễn Cao Văn (chủ biên), Giáo trình lý thuyết xác suất và thống kê toán, NXB Đại học kinh tế Quốc Dân, 2012. [4] Damodar, N. Basic econometrics. The Mc-Graw Hill, 2004. [5] Kennedy, Peter. A guide to econometrics. MIT press, 2003. 118 PHỤ LỤC Bảng phân phối chuẩn 119 Bảng phân phối t-student 120 Bảng phân phối Fisher 121 122 123 124 125 126 Bảng phân phối Chi-bình phƣơng 127 128 Bảng thống kê d (Durbin-Watson) với mức ý nghĩa 0.05 129 130 Bảng thống kê d (Durbin-Watson) với mức ý nghĩa 0.01 131
File đính kèm:
- giao_trinh_kinh_te_luong.pdf