Bài giảng Kinh tế lượng - Chương 5: Hồi quy với biến giả - Phạm Văn Minh

Ngoài biến định lượng, mô hình hồi quy có thể có

các biến định tính, như: giới tính, tôn giáo, nơi cư

trú, hình thức sở hữu của DN, v.v.

Ví dụ 1: Nghiên cứu cho thấy nếu các yếu tố khác là như

nhau, tiền lương của lao động nữ thấp hơn lao động nam.

Vì vậy, yếu tố giới tính cần được đưa vào mô hình hồi quy

với vai trò là biến giải thích cho tiền lương.

Trong mô hình hồi quy, biến giả được sử dụng để

lượng hóa các biến định tính.

Biến giả mang giá trị 0 và 1

í dụ 2: Một công ty sử dụng 2 công nghệ (CN)

sản xuất (A, B). Năng suất của mỗi CN là đại

lượng ngẫu nhiên phân phối chuẩn có phương

sai bằng nhau, kỳ vọng khác nhau. Hãy lập mô

hình mô tả quan hệ giữa năng suất của Công ty

với việc sử dụng CN sản xuất khác nhau.

Mô hình: Yi = β1+ β2Zi + Ui

Trong đó: Y : năng suất, Z : biến giả

Z

i = 1 nếu sử dụng CN A

0 nếu sử dụng CN B

pdf 35 trang kimcuc 21640
Bạn đang xem 20 trang mẫu của tài liệu "Bài giảng Kinh tế lượng - Chương 5: Hồi quy với biến giả - Phạm Văn Minh", để tải tài liệu gốc về máy hãy click vào nút Download ở trên

Tóm tắt nội dung tài liệu: Bài giảng Kinh tế lượng - Chương 5: Hồi quy với biến giả - Phạm Văn Minh

Bài giảng Kinh tế lượng - Chương 5: Hồi quy với biến giả - Phạm Văn Minh
Chương 5
HỒI QUI VỚI BIẾN GIẢ
1
NỘI DUNG
1. Bản chất của biến giả
2. Mô hình trong đó các biến độc lập đều là
biến định tính (biến giả)
3. Hồi qui với biến độc lập là sự kết hợp biến
định lượng và biến định tính
4. Sử dụng biến giả trong phân tích mùa
5. So sánh hai hồi qui: phương pháp biến giả
2
Ngoài biến định lượng, mô hình hồi quy có thể có
các biến định tính, như: giới tính, tôn giáo, nơi cư
trú, hình thức sở hữu của DN, v.v.
Ví dụ 1: Nghiên cứu cho thấy nếu các yếu tố khác là như
nhau, tiền lương của lao động nữ thấp hơn lao động nam.
Vì vậy, yếu tố giới tính cần được đưa vào mô hình hồi quy
với vai trò là biến giải thích cho tiền lương.
Trong mô hình hồi quy, biến giả được sử dụng để
lượng hóa các biến định tính.
Biến giả mang giá trị 0 và 1.
1. Bản chất của biến giả
3
Ví dụ 2: Một công ty sử dụng 2 công nghệ (CN)
sản xuất (A, B). Năng suất của mỗi CN là đại
lượng ngẫu nhiên phân phối chuẩn có phương
sai bằng nhau, kỳ vọng khác nhau. Hãy lập mô
hình mô tả quan hệ giữa năng suất của Công ty
với việc sử dụng CN sản xuất khác nhau.
Mô hình: Yi = β1+ β2Zi + Ui
Trong đó: Y : năng suất, Z : biến giả
Zi = 1 nếu sử dụng CN A
0 nếu sử dụng CN B
2. Mô hình trong đó các biến độc lập đều
là biến định tính
Ta có :
E(Yi/Zi= 0) = β1
: năng suất trung bình của CN B.
E(Yi/Zi= 1) = β1+ β2 
: năng suất trung bình của CN A.
⇒ β2: chênh lệch năng suất giữa CN B và A.
Giả thiết H0: β2 = 0, H1: β2 ≠ 0
để rút ra kết luận là giữa công nghệ A và công nghệ 
B có sự khác nhau về năng suất hay không?
2. Mô hình trong đó các biến độc lập đều
là biến định tính (tt)
Ví dụ 2: Giả sử tiến hành khảo sát năng suất của
CN A và CN B trong vòng 10 ngày, người ta thu
được số liệu sau:
Năng suất (đvt: tấn/ngày)
Số liệu được mã hóa như sau:
CN sử dụng B A A B B A B A A B
Năng suất 28 32 35 27 25 37 29 34 33 30
2. Mô hình trong đó các biến độc lập đều
là biến định tính (tt)
Zi (Biến giả) 0 1 1 0 0 1 0 1 1 0
Yi (Năng suất) 28 32 35 27 25 37 29 34 33 30
Kết quả hồi quy bằng EViews:
Từ kết quả EViews, ta được:
2.1. Hồi qui với biến định tính 2 phạm trù
- Ví dụ 2 (tt)
ii Z4,68,27Yˆ +=
Diễn giải ý nghĩa của kết quả hồi qui:
 E(Yi/Zi=0) = 27.8: năng suất trung bình của công
nghệ B là 27.8 (tấn/ngày).
 E(Yi/Zi=1) = 27.8 + 6.4 = 34.2: năng suất trung
bình của công nghệ A là 34.2 (tấn/ngày).
 Hệ số góc tương ứng với biến giả Z trong mô hình
hồi quy có p-value = 0.0008 < 0.05 nên hệ số góc
này có ý nghĩa thống kê. Vậy 2 công nghệ có sự
khác nhau về năng suất.
8
ii Z4,68,27Yˆ +=
2.1. Hồi qui với biến định tính 2 phạm trù
- Ví dụ 2 (tt)
 Nếu biến định tính có m phạm trù (mức độ) thì số
biến giả được đưa vào mô hình là (m-1).
 Số biến giả ít hơn mức độ (số phạm trù) là 1 để tránh
hiện tượng đa cộng tuyến.
 Phạm trù được gán giá trị 0 được gọi là phạm trù
cơ sở. Tung độ gốc đại diện cho giá trị trung
bình của phạm trù cơ sở.
 Các hệ số góc đại diện cho chênh lệch giữa giá trị
trung bình của các phạm trù với phạm trù cơ sở.
9
2.2. Các lưu ý khi sử dụng biến giả
 Tương tự ví dụ 2, nhưng Công ty có 3 CN sản
suất (A, B, C). Ta sử dụng 2 biến giả:
10
2.3. Hồi qui với biến định tính 3 phạm trù
- Ví dụ 3
Mô hình: Yi = β1+ β2Z1i + β3Z2i + Ui
Trong đó: Y - năng suất, Z1, Z2: biến giả
Z1i = 1 : nếu sử dụng CN A
0 : nếu sử dụng công nghệ khác
Z2i = 1 : nếu sử dụng CN B
0 : nếu sử dụng công nghệ khác
Ta có: 
E(Yi/Z1i= 1, Z2i= 0) = β1+ β2 : năng suất trung bình 
của CN A.
E(Yi/ Z1i= 0, Z2i= 1) = β1+ β3 : năng suất trung bình 
của CN B.
E(Yi/ Z1i= 0, Z2i= 0) = β1: năng suất trung bình của 
CN C.
⇒ β2: chênh lệch năng suất giữa CN A và C.
⇒ β3: chênh lệch năng suất giữa CN B và C.
2.3. Hồi qui với biến định tính 3 phạm trù
- Ví dụ 3 (tt)
Xét thí dụ trong trường hợp biến định tính có
2 phạm trù:
Yi = β1 + β2Xi +β3Zi +Ui
Trong đó:
Y: biến phụ thuộc
X: biến độc lập định lượng
Z: biến giả (2 phạm trù)
12
3. Hồi qui với biến độc lập là biến định
lượng và biến định tính
Ví dụ 4 : Hãy lập mô hình mô tả quan hệ
giữa lượng hàng bán ra với mức giá
bán tại 20 khu vực bán hàng (nông thôn
hoặc thành phố).
Gọi Y: lượng hàng (tấn/tháng)
X: giá bán (ngàn/kg)
Z: biến giả (khu vực)
3.1. Ví dụ 4
3.1. Ví dụ 4 (tt)
a. Viết phương trình hồi qui tuyến tính mô tả
các mối quan hệ trên. Giải thích ý nghĩa các
hệ số hồi qui. Các hệ số này có phù hợp với
lý thuyết kinh tế không?
b. Khu vực bán hàng có ảnh hưởng đến lượng
hàng bán ra không với mức ý nghĩa 5%?
Hãy lập mô hình mô tả quan hệ giữa thu nhập (Y,
triệu đồng/năm), của giáo viên với thâm niên
giảng dạy (X, năm) và giới tính (Z, biến giả).
a.Viết phương trình hồi qui tuyến tính mẫu
b. Giải thích ý nghĩa các hệ số góc
c. Với mức ý nghĩa 1%, có sự phân biệt giới tính
trong việc trả lương cho giáo viên không?
3.2. Ví dụ 5
Hãy lập mô hình mô tả quan hệ giữa thu
nhập của giáo viên với thâm niên giảng
dạy và vùng giảng dạy (thành phố, đồng
bằng, miền núi).
Gọi Y : thu nhập (triệu đồng/năm)
X : thâm niên giảng dạy (năm)
Z1, Z2 : biến giả.
3.3. Ví dụ 6: Xét trường hợp biến định
tính có nhiều hơn 2 phạm trù
Z1i = 1 : thành phố Z2i = 1 : đồng bằng
0 : nơi khác 0 : nơi khác
Ta có mô hình cho ví dụ 6 như sau:
Yi = β1+ β2Xi + β3Z1i + β4Z2i + Ui
Hãy phát biểu ý nghĩa của β2, β3, β4?
Ví dụ 7: Hãy lập mô hình mô tả quan hệ giữa
thu nhập của giáo viên với thâm niên giảng dạy,
vùng giảng dạy (thành phố, tỉnh đồng bằng,
miền núi) và giới tính (nam, nữ) của giáo viên.
3.3. Ví dụ 6 (tt)
Mô hình:
Yi = β1+ β2Xi + β3Z1i + β4Z2i + β5Di + Ui
Trong đó: 
 Y, X, Z1i, Z2i giống ví dụ 6.
 Di (biến giả) = 1 : nam giới
0 : nữ giới
 Ý nghĩa của β5 ở đây là gì?
3.4. Ví dụ 7
Lập mô hình quan hệ giữa chi tiêu cá nhân với thu
nhập và giới tính của cá nhân đó.
Yi = β1+ βXi + β3Zi + Ui (1)
Y - chi tiêu (triệu/tháng)
X - thu nhập (triệu/tháng)
Zi = 1 : nam giới
0 : nữ giới.
Mở rộng mô hình: Với mô hình trên, khi thu nhập
cá nhân tăng 1 triệu đồng thì chi tiêu tăng β triệu
đồng bất kể là nam hay nữ.
3.5. Biến tương tác
Nhưng với giả thiết cho rằng nếu thu nhập tăng 1
triệu đồng thì mức chi tiêu tăng thêm của nam
và nữ khác nhau thì β phải là
β = β2+ β4Zi
Lúc này mô hình (1) được viết:
Yi = β1+ (β2+ β4Zi)Xi + β3Zi + Ui
Hay:
Yi = β1+ β2Xi + β3Zi + β4XiZi + Ui (2)
Trong đó:
XiZi được gọi là biến tương tác giữa X và Z.
3.5. Biến tương tác
Yi = β1+ β2 Xi + β3Zi + β4XiZi + Ui (2)
- Khi Zi =1 : Yi = (β1 +β3) + (β2+ β4)Xi + Ui
Đây là hồi qui chi tiêu-thu nhập của nam.
- Khi Zi =0 : Yi = β1+ β2Xi + Ui
Đây là hồi qui chi tiêu-thu nhập của nữ.
Ý nghĩa của các hệ số hồi qui:
- β1: Khi không có thu nhập thì chi tiêu trung bình
của một người nữ là β1 triệu.
- β2: Khi thu nhập của một người nữ tăng 1 triệu
đồng thì chi tiêu của họ tăng β2 triệu đồng.
3.5. Biến tương tác
 β3: Khi không có thu nhập thì chi tiêu trung bình
của một người nam chênh lệch so với của một
người nữ là β3 triệu.
 (Hay chênh lệch về hệ số tung độ gốc giữa hàm hồi
qui cho nam và hàm hồi qui cho nữ).
 β4: Khi thu nhập của một người nam tăng 1 triệu
đồng thì chi tiêu trung bình của họ tăng nhiều
hơn của nữ |β4| triệu đồng (nếu β4 > 0) hay tăng
ít hơn của nữ |β4| triệu đồng (nếu β4< 0).
 (Hay chênh lệch về hệ số độ dốc giữa hàm hồi qui cho nam và
hàm hồi qui cho nữ).
3.5. Biến tương tác
Ý nghĩa của các kiểm định đối với β3 và β4:
H0 : β3 = 0 ⇔ hệ số tung độ gốc giữa hồi qui cho
nam và cho nữ là giống nhau.
H0 : β4 = 0 ⇔ hệ số độ dốc giữa hồi qui cho nam
và cho nữ là giống nhau.
H0 : β3 = β4 = 0 ⇔ hồi qui cho nam và cho nữ là
giống hệt nhau (chi tiêu của nam và của nữ là
giống nhau) Dùng kiểm định gì?
3.5. Biến tương tác . Ví dụ 8 (tt)
4. Sử dụng biến giả trong phân tích mùa
Chuỗi thời gian có tính chất thời vụ:
 Doanh số bán của cửa hàng quần áo dịp gần Tết,
 Doanh số bán của cửa hàng văn phòng phẩm vào
dịp đầu năm học, v.v.
Biến giả được sử dụng để loại yếu tố mùa khỏi
chuỗi thời gian (ngoài nhiều phương pháp khác).
4.1. Yếu tố mùa chỉ ảnh hưởng đến hệ số chặn
(tung độ gốc) của hàm hồi quy:
Yi = β1 + β2Xi + β3D1i + β4D2i + β5D3i + Ui
Trong đó:
Y: chi tiêu của người tiêu dùng cho việc mua sắm quần áo,
dụng cụ gia đình.
X: thu nhập của người tiêu dùng.
D1=1 nếu quan sát ở quý II, D1=0 nếu quan sát ở quý khác
D2=1 nếu quan sát ở quý III, D2=0 nếu quan sát ở quý khác
D3=1 nếu quan sát ở quý IV, D3=0 nếu quan sát ở quý khác
25
4. Sử dụng biến giả trong phân tích mùa
 E(Y/ X, D1=0, D2=0, D3=0) = β1+β2X: chi tiêu trung
bình về quần áo và dụng cụ gia đình trong quý I
 E(Y/ X, D1=1, D2=0, D3=0) = β1+β2X+β3: chi tiêu
trung bình về quần áo và dụng cụ gia đình trong
quý II
 E(Y/ X, D1=0, D2=1, D3=0) = β1+β2X+β4: chi tiêu
trung bình về quần áo và dụng cụ gia đình trong
quý III
 E(Y/ X, D1=0, D2=0, D3=1) = β1+β2X+β5: chi tiêu
trung bình về quần áo và dụng cụ gia đình trong
quý IV
26
4. Sử dụng biến giả trong phân tích mùa (tt)
 β2: cho biết tốc độ tăng (nếu β2>0) hay giảm
(nếu β2<0) của chi tiêu về quần áo và dụng cụ
gia đình theo thu nhập (giả sử tốc độ này bằng
nhau ở 4 quý),
 β3: mức chênh lệch về chi tiêu các mặt hàng
trên giữa quý II và quý I,
 β4: mức chênh lệch về chi tiêu các mặt hàng
trên giữa quý III và quý I,
 β5: mức chênh lệch về chi tiêu các mặt hàng
trên giữa quý IV và quý I. 27
4. Sử dụng biến giả trong phân tích mùa (tt)
4.1. Yếu tố mùa ảnh hưởng đến cả hệ số chặn và
hệ số góc của hồi quy
Đây là trường hợp có sự ảnh hưởng tương tác giữa
mùa và thu nhập lên chi tiêu, nghĩa là tốc độ tăng
(hay giảm) của chi tiêu theo thu nhập không giống
nhau giữa các mùa.
Yi = β1 + β2Xi + β3D1i + β4D2i + β5D3i + β6D1iXi
+ β7D2iXi + β8D3iXi + Ui
Việc phân tích mùa nên dựa vào mô hình trên vì nó
tổng quát hơn. Đồng thời qua việc kiểm định giả
thiết về các hệ số góc ta sẽ biết được hệ số nào
không có ý nghĩa để loại ra khỏi mô hình. 28
4. Sử dụng biến giả trong phân tích mùa (tt)
SỐ LIỆU cho thí dụ về tiết kiệm và thu nhập cá nhân
ở nước Anh qua 2 thời kỳ: Tái Thiết và Hậu Tái Thiết
29
5. So sánh hai hồi qui - phương pháp 
biến giả
5. So sánh hai hồi qui - phương pháp 
biến giả (tt)
Ví dụ: Số liệu về tiết kiệm (Y) và thu nhập cá
nhân (X) ở Anh từ năm 1946 đến 1963 chia
làm hai thời kỳ:
- Thời kỳ tái thiết (1946 - 1954) n1=9
- Thời kỳ hậu tái thiết (1955 - 1963) n2=9
Với thời kỳ tái thiết, hàm hồi qui:
Yi = α1+ α2Xi+Ui (1)
Với số liệu ii X04705.0266.0Yˆ +−=
Với thời kỳ hậu tái thiết, hàm hồi qui:
Yi = γ1+ γ2Xi +Ui (2)
Với số liệu  ii X15045.075.1Yˆ +−=
Vấn đề: Hai hàm hồi qui ứng với hai thời
kỳ trên có giống nhau không? (hay là:
mối quan hệ giữa tiết kiệm và thu nhập
có giống nhau ở hai thời kỳ?)
5. So sánh hai hồi qui - phương pháp 
biến giả (tt)
- Nếu sử dụng biến giả thì chỉ cần ước lượng 1 hồi 
quy sử dụng số liệu tổng hợp của cả 2 thời kỳ (số 
quan sát là n1+n2, tức là gom 2 mẫu con thành một 
mẫu lớn có kích thước n = n1+ n2) và hồi qui MH:
Yi = β1+ β2 Xi + β3Zi + β4XiZi + Ui (*)
Với Y: tiết kiệm
X: thu nhập
Zi = 1 : nếu là thời kỳ tái thiết,
0 : nếu là thời kỳ hậu tái thiết.
5. So sánh hai hồi qui - phương pháp 
biến giả (tt)
Yi = β1+ β2Xi + β3Zi + β4XiZi + Ui (*)
⇒ β3 là chênh lệch về hệ số tung độ gốc, β4 là chênh 
lệch về hệ số độ dốc giữa hai hồi qui.
+ Nếu Zi = 1: (*) trở thành:
Yi = (β1 +β3) + (β2+ β4)Xi +Ui : 
là hàm hồi qui cho thời kỳ tái thiết
+ Nếu Zi = 0: (*) trở thành :
Yi = β1 +β2Xi +Ui :
là hàm hồi qui cho thời kỳ hậu tái thiết
5. So sánh hai hồi qui - phương pháp 
biến giả (tt)
Nên làm các kiểm định sau để so sánh được 2 HQ:
 H0 : β3= 0 (hai hồi qui giống nhau ở tung độ gốc).
 H0 : β4= 0 (hai hồi qui giống nhau ở hệ số góc)
 H0: β3=β4= 0; (hai hồi qui giống hệt nhau)
 H1: β3 ≠ 0 hoặc β4 ≠0 (dùng F-test)
Nếu chấp nhận giả thiết không thì mức tiết kiệm
trung bình ở 2 thời kỳ như nhau, hay mô hình có
sự ổn định về cấu trúc.
5. So sánh hai hồi qui - phương pháp 
biến giả (tt)
Ví dụ: Sau khi gom số liệu cả hai thời kỳ và hồi
qui mô hình (*), ta được:
Se = (0.33) (0.470) (0.0163) (0.0333)
t = (-5.27) (3.155) (9.238) (-3.11)
p = (0.000) (0.007) (0.000) (0.008)
Kết quả trên cho thấy hai hồi qui cho hai thời kỳ 
hoàn toàn khác nhau vì sao?
iiiii ZX1034.0Z484.1X15045.075.1Yˆ −++−=
5. So sánh hai hồi qui - phương pháp 
biến giả (tt)

File đính kèm:

  • pdfbai_giang_kinh_te_luong_chuong_5_hoi_quy_voi_bien_gia_pham_v.pdf