Mô hình hồi quy Logistic trong đo lường xác suất vỡ nợ khách hàng tín dụng cá nhân

Để đưa ra quyết định cho một khách hàng

có được vay hay không và với mức lãi suất là

bao nhiêu, các tổ chức tín dụng cần phải phân

loại, xếp hạng tín dụng các khách hàng. Việc

phân loại phụ thuộc vào xác suất mà khách hàng

không trả được nợ đúng hạn, xác suất này gọi là

xác suất vỡ nợ (probability of default). Không trả

đúng hạn có thể là không trả gốc hoặc trả lãi

đúng hạn hoặc cả hai [1]. Tính toán được xác

suất vỡ nợ là công việc đầu tiên trong đánh giá

tín dụng và xác định chính sách lãi suất. Đối với

một khách hàng cá nhân, xác suất vỡ nợ chịu tác

động của nhiều nhân tố như trình độ học vấn, độ

tuổi, giới tính hay các nhân tố về tài chính như

tình trạng trả nợ định kỳ, mức chi tiêu.

Có nhiều mô hình thống kê đã được sử dụng

để ước lượng xác suất vỡ nợ như mô hình phân

tích chuyên biệt, hồi quy logistic, hồi quy probit,

mô hình cây phân loại, mô hình mạng nơ-ron.

Mỗi mô hình có ưu và nhược điểm riêng, trong

đó mô hình hồi quy logistic là mô hình được sử

dụng khá phổ biến vì sự đơn giản của mô hình và

độ chính xác trong phân loại cũng tương đương

với các phương pháp khác [8].

pdf 9 trang kimcuc 6320
Bạn đang xem tài liệu "Mô hình hồi quy Logistic trong đo lường xác suất vỡ nợ khách hàng tín dụng cá nhân", để tải tài liệu gốc về máy hãy click vào nút Download ở trên

Tóm tắt nội dung tài liệu: Mô hình hồi quy Logistic trong đo lường xác suất vỡ nợ khách hàng tín dụng cá nhân

Mô hình hồi quy Logistic trong đo lường xác suất vỡ nợ khách hàng tín dụng cá nhân
Chuyên mục: Tài chính - Ngân hàng - TẠP CHÍ KINH TẾ & QUẢN TRỊ KINH DOANH SỐ 07 (2018) 
92 
MÔ HÌNH HỒI QUY LOGISTIC TRONG ĐO LƢỜNG XÁC SUẤT 
VỠ NỢ KHÁCH HÀNG TÍN DỤNG CÁ NHÂN 
 Hoàng Thanh Hải1, Trần Đình Chúc2, 
Nguyễn Quỳnh Hoa3 
Tóm tắt 
Việc đánh giá rủi ro tín dụng là không thể bỏ qua trong hoạt động tín dụng của của các ngân hàng. Có 
nhiều nhân tố ảnh hưởng đến việc lượng hóa rủi ro tín dụng, trong đó xác suất vỡ nợ của khách hàng là 
yếu tố đầu tiên và rất quan trọng để ngân hàng đánh giá và ước lượng các nhân tố khác. Bài báo này 
ứng dụng hồi quy logistics để xây dựng một mô hình dự báo xác suất vỡ nợ của khách hàng tín dụng cá 
nhân và đánh giá tác động của các nhân tố đến xác suất này. 
Từ khóa: Rủi ro tín dụng, xác suất vỡ nợ, hồi quy logistic. 
A LOGISTIC REGRESSION MODEL FOR ESTIMATING THE PROBABILITY OF 
DEFAULT OF RETAIL CUSTOMERS 
Abstract 
In banks’credit activities, the assessment of credit risk is of paramout importance. Among a variety of 
factors used to quantify credit risk, the probability of default is the key one. In this paper, a logistic 
regression was employed to construct a model predicting the probability of default of credit card clients 
and evaluating regressors’ influences to this probability. 
Key words: credit risk, the probability of default, logistic regression. 
1. Giới thiệu 
Để đưa ra quyết định cho một khách hàng 
có được vay hay không và với mức lãi suất là 
bao nhiêu, các tổ chức tín dụng cần phải phân 
loại, xếp hạng tín dụng các khách hàng. Việc 
phân loại phụ thuộc vào xác suất mà khách hàng 
không trả được nợ đúng hạn, xác suất này gọi là 
xác suất vỡ nợ (probability of default). Không trả 
đúng hạn có thể là không trả gốc hoặc trả lãi 
đúng hạn hoặc cả hai [1]. Tính toán được xác 
suất vỡ nợ là công việc đầu tiên trong đánh giá 
tín dụng và xác định chính sách lãi suất. Đối với 
một khách hàng cá nhân, xác suất vỡ nợ chịu tác 
động của nhiều nhân tố như trình độ học vấn, độ 
tuổi, giới tính hay các nhân tố về tài chính như 
tình trạng trả nợ định kỳ, mức chi tiêu. 
Có nhiều mô hình thống kê đã được sử dụng 
để ước lượng xác suất vỡ nợ như mô hình phân 
tích chuyên biệt, hồi quy logistic, hồi quy probit, 
mô hình cây phân loại, mô hình mạng nơ-ron. 
Mỗi mô hình có ưu và nhược điểm riêng, trong 
đó mô hình hồi quy logistic là mô hình được sử 
dụng khá phổ biến vì sự đơn giản của mô hình và 
độ chính xác trong phân loại cũng tương đương 
với các phương pháp khác [8]. 
Xét biến phụ thuộc nhị phân ( nếu 
khách hàng vỡ nợ, nếu ngược lại) và các 
biến độc lập . Mô hình hồi quy 
logistic có dạng: 
 | 
hay dưới dạng tương đương: 
Các hệ số hồi quy được ước 
lượng bằng phương pháp hợp lý cực đại. 
2. Phƣơng pháp nghiên cứu 
2.1 Nguồn số liệu và mô tả biến 
Trong bài báo này, tác giả sử dụng bộ dữ 
liệu tín dụng của các khách hàng cá nhân tại một 
ngân hàng ở Đài Loan (Trung Quốc) để đánh giá 
ảnh hướng của các yếu tố đến xác suất vỡ nợ của 
khách hàng và xây dựng một mô hình ước lượng 
xác suất vỡ nợ. 
Nghiên cứu sử dụng dữ liệu trả nợ của 
30.000 khách hàng tín dụng cá nhân tại một ngân 
hàng ở Đài Loan (Trung Quốc) tháng 10, 2005 
[9]. Biến phụ thuộc là biến nhị phân ( 
nếu khách hàng vỡ nợ, nếu ngược lại) và 
23 biến giải thích bao gồm thông tin cá nhân và 
dữ liệu trả nợ của khách hàng: 
Chuyên mục: Tài chính - Ngân hàng - TẠP CHÍ KINH TẾ & QUẢN TRỊ KINH DOANH SỐ 07 (2018) 
93 
 : hạn mức tín dụng (đơn vị: Đô la Đài Loan). 
 : Giới tính khách hàng (1 = Nam; 2 = Nữ). 
 : Trình độ học vấn ( 1 = sau đại học; 2 = 
đại học; 3 = phổ thông; 4 = khác). 
 : Tình trạng hôn nhân (1 = đã kết hôn; 2 = 
độc thân; 3 = khác). 
 : độ tuổi (tuổi). 
 : Tình trạng trả nợ hàng tháng (từ 
tháng 4 đến tháng 9 năm 2005): = tình trạng 
trả nợ tháng 9, 2005; = tình trạng trả nợ tháng 
8, 2005;...; = tình trạng trả nợ tháng 4, 2005. 
Các mức bao gồm: -1 = trả nợ đúng hạn; 1 = trả 
nợ chậm 1 tháng; 2 = trả nợ chậm hai tháng; ...; 8 
= trả nợ chậm 8 tháng; 9 = trả nợ chậm chín 
tháng trở lên. 
 : Lượng chi tiêu hàng tháng (đô la 
Đài Loan). = lượng chi tiêu tháng 9, 2005; 
 = lượng chi tiêu tháng 8, 2005; ...; = 
lượng chi tiêu tháng 4, 2005. 
 : Lượng trả nợ hàng tháng (đô la 
Đài Loan). = lượng trả nợ tháng 9, 2005; 
 = lượng trả nợ tháng 8, 2005; ...; = 
lượng trả nợ tháng 4, 2005. 
2.2 Phân tích dữ liệu khám phá 
Tác giả sử dụng phần mềm R 3.3.1 để làm 
sạch dữ liệu và dùng các công cụ hình ảnh và 
kiểm định để đánh giá tổng quan về tác động của 
các biến độc lập đến biến phụ thuộc . 
Sử dụng biểu đồ tần số đối với các biến tình 
trạng trả nợ, có hai mức không được định nghĩa là 
-2, 0, hơn nữa có tới 25.939 quan sát trong tổng số 
30.000 (chiếm 86,5%) quan sát có hai giá trị này, 
vì vậy tác giả giữ nguyên các mức để phân tích 
thay vì gán cho chúng giá trị không xác định NA 
(not available). Tương tự, có một vài quan sát của 
biến trình độ học vấn và tình trạng hôn nhân có 
các mức không được định nghĩa là 0, 5 và 6. Các 
quan sát này được gán cho giá trị NA. 
 Đối với các biến liên tục, tác giả sử dụng 
biểu đồ tán xạ để quan sát các điểm bất thường 
(outliers) trong dữ liệu. Thông thường, một giá trị 
 được gọi là giá trị bất thường trong mẫu nếu 
 hoặc trong 
đó là tứ phân vị thứ 1 và thứ 3 của mẫu, 
 . Hình 1 là biểu đồ tán xạ của biến 
hạn mức tín dụng. Giá trị trong 
trường hợp này là 525.000, tuy nhiên từ biểu đồ ta 
thấy giá trị đó hơi thấp để có thể loại quan sát. Tác 
giả sử dụng mức 750.000 làm căn cứ xác định 
điểm bất thường, có 6 quan sát thuộc loại này. 
Sau quá trình xác định outliers của tất cả các 
biến liên tục, có 1283 chỉ số tương ứng với 457 
khách hàng bị loại khỏi dữ liệu gốc ban đầu. Bởi 
vậy, dữ liệu dùng để xây dựng mô hình còn lại 
có kích thước 29.543. 
Hình 1: Biểu đồ tán xạ biến hạn mức tín dụng 
Chuyên mục: Tài chính - Ngân hàng - TẠP CHÍ KINH TẾ & QUẢN TRỊ KINH DOANH SỐ 07 (2018) 
94 
Để đánh giá tác động của các biến độc lập 
lên biến phụ thuộc, tác giả sử dụng biểu đồ 
mosaic đối với biến định tính và biểu đồ violin, 
biểu đồ boxplot đối với biến định lượng. 
Hình 2: Biểu đồ mosaic quan hệ giữa giới tính và vỡ nợ 
Hình 2 là biểu đồ mosaic mô tả mối quan hệ 
giữa giới tính và tình trạng vỡ nợ. Quan sát biểu 
đồ có thể thấy khách hàng nam có xác suất vỡ nợ 
cao hơn khách hàng nữ. Giá trị 
của kiểm định Pearson cho thấy sự phụ thuộc 
giữa hai biến. 
Hình 3 là biểu đồ violin của lượng thanh 
toán tháng 9, 2005. Từ biểu đồ có thể nhận xét 
nhìn chung lượng thanh toán càng thấp thì khả 
năng vỡ nợ càng cao. 
Hình 3: Biểu đồ violin lượng thanh toán tháng 9, 2005 
Bằng phương pháp tương tự đối với các 
biến giải thích khác, ta thu được kết quả đánh giá 
khái quát tác động của các biến đến khả năng vỡ 
nợ như sau: 
Chuyên mục: Tài chính - Ngân hàng - TẠP CHÍ KINH TẾ & QUẢN TRỊ KINH DOANH SỐ 07 (2018) 
95 
 : Hạn mức tín dụng càng thấp, khả năng 
vỡ nợ càng cao. 
 : Nam có khả năng vỡ nợ cao hơn nữ 
 : Trình độ học vấn càng cao xác suất vỡ nợ 
càng thấp. 
 : Khách hàng đã kết hôn có xác suất vỡ nợ 
cao hơn. 
 : Nhóm có xác suất vỡ nợ lớn nhất là 
nhóm khách hàng dưới 25 tuổi, nhóm có xác suất 
vỡ nợ thấp nhất là nhóm trong độ tuổi 25 -34. 
 : Càng trả nợ chậm, khả năng vỡ 
nợ càng cao. 
 : Nhìn chung không có sự khác 
biệt giữa nhóm vỡ nợ và nhóm không vỡ nợ về 
lượng chi tiêu hàng tháng. 
 : Lượng trả nợ càng thấp khả năng 
vỡ nợ càng cao. 
2.3 Tiêu chuẩn lựa chọn mô hình 
 Dữ liệu sau khi làm sạch, loại bỏ các giá trị 
NA và các điểm outliers được chia ngẫu nhiên 
thành hai nhóm, dữ liệu huấn luyện và dữ liệu 
kiểm định với tỷ lệ 50:50. Dữ liệu huấn luyện 
(kích thước 14.586) dùng để xây dựng mô hình 
và dữ liệu kiểm định (kích thước 14.563) dùng 
để đánh giá mô hình. 
Trên bộ dữ liệu huấn luyện, tác giả chọn 
biến đưa vào mô hình sử dụng tiêu chí AIC 
(Akaike‟s Information Criterion), được định 
nghĩa bởi: 
Trong đó: L là giá trị hàm hợp lý của mô 
hình, K là số tham số trong mô hình ( 
nếu mô hình logistic có biến giải thích) và là 
kích thước của mẫu. Mô hình càng sát thực tế 
( lớn) và sử dụng ít biến ( nhỏ) thì AIC càng 
thấp. Bởi vậy, mô hình có AIC càng nhỏ được 
coi là mô hình càng tối ưu. 
3. Kết quả nghiên cứu 
3.1 Mô hình 
Sử dụng tiêu chí AIC, tác giả xác định được 
các biến sau đây đưa vào mô hình 
Kết quả hồi quy trên dữ liệu huấn luyện 
được thể hiện trên bảng 1. 
Bảng 1: Kết quả hồi quy logistic 
Biến Hệ số 
Sai số 
chuẩn 
OR 
Đơn vị so 
sánh 
Khoảng tin 
cậy 95% của 
OR 
p 
Hạn mức tín dụng -0,094 0,0094 0,911 +50.000 0,894; 0,928 
Giới tính -0,186 0,0359 0,830 Nam 0,774; 0,891 
Tình trạng hôn nhân Đã kết hôn 
Độc thân -0,174 0,0358 0,841 0,784; 0,902 1,26. 
Khác 0,024 0,1623 1,024 0,745; 1,408 0,882 
Lượng chi tiêu tháng 
9 
-0,176 0,0731 0,839 +50.000 0,727; 0,968 0,016 
Lượng chi tiêu tháng 
8 
0,186 0,0869 1,204 +50.000 1,016; 1,429 0,032 
Lượng chi tiêu tháng 
6 
0,104 0,0498 1,109 +50.000 1,006; 1,223 0,037 
Lượng trả nợ tháng 
9 
-0.,179 0,0305 0,836 +10.000 0,788; 0,888 5,00 
Lượng trả nợ tháng 
8 
-0,134 0,0282 0,875 +10.000 0,828; 0,924 1,97 
Lượng trả nợ tháng 
7 
-0,055 0,0234 0,947 +10.000 0,904; 0,991 0,019 
Lượng trả nợ tháng 
6 
-0,051 0,0219 0,950 +10.000 0,910; 0,992 0,020 
Chuyên mục: Tài chính - Ngân hàng - TẠP CHÍ KINH TẾ & QUẢN TRỊ KINH DOANH SỐ 07 (2018) 
96 
Bảng 1: Kết quả hồi quy logistic (tiếp) 
Biến Hệ số 
Sai số 
chuẩn 
OR 
Đơn vị so 
sánh 
Khoảng tin 
cậy 95% của 
OR 
p 
Tình trạng trả nợ 
tháng 9 
Trả đúng 
hạn 
X6 = -2 - 0,403 0,0989 0,668 0,550; 0,811 4,59.10
-5 
X6 = 0 -0,637 0,0682 0,529 0,463; 0,605 < 2 10-16 
Chậm 1 tháng 0,341 0,0668 1,406 1,234; 1,603 3,25 10-7 
Chậm 2 tháng 1,570 0,0776 4,809 4,131; 5,599 < 2 10-16 
Chậm 3 tháng 1,494 0,1704 4,454 3,189; 6,220 < 2 10-16 
Chậm 4 tháng 0,892 0,2808 2,439 1,407; 4,229 0,002 
Chậm 5 tháng 0,156 0,4842 1,169 0,453; 3,019 0,747 
Chậm 6 tháng 0,842 0,7551 2,321 0,528; 10,196 0,265 
Chậm 7 tháng 2,199 1,2813 9,020 
0,732; 
111,139 
0,086 
Chậm 8 tháng -12,351 247,3855 0,000 0,000; 0,960 
Tình trạng trả nợ 
tháng 7 
Trả đúng 
hạn 
X8 = -2 0,063 0,1065 1,065 0,865; 1,313 0,552 
X8 = 0 0,215 0,0835 1,240 1,052; 1,460 0,010 
Chậm 1 tháng -12,276 377,9862 0,000 0,000; 0,974 
Chậm 2 tháng 0,570 0,0863 1,769 1,494; 2,095 1,88 10-11 
Chậm 3 tháng 0,365 0,1918 1,440 0,989; 2,097 0,057 
Chậm 4 tháng 0,103 0,3920 1,108 0,514; 2,389 0,794 
Chậm 5 tháng 0,096 0,7570 1,101 0,250; 4,854 0,899 
Chậm 6 tháng 14,183 247,3858 1,444.106 0,000; + 0,954 
Chậm 7 tháng -0,147 0,8638 0,863 0,159; 4,692 0,865 
Chậm 8 tháng -12,266 179,2412 0,000 0,000; + 0,945 
Tình trạng trả nợ 
tháng 6 
Trả đúng 
hạn 
X9 = -2 0,104 0,1043 1,120 0,905;1,361 0,318 
X9 = 0 0,074 0,0806 1,077 0,920;1,261 0,357 
Chậm 1 tháng 1,045 655,392 2,844 0,000; + 0,999 
Chậm 2 tháng 0,459 0,0942 1,582 1,315; 1,903 1,13.10-6 
Chậm 3 tháng 0,476 0,2350 1,609 1,015; 2,551 0,043 
Chậm 4 tháng 0,307 0,4306 1,360 0,585;1,198 0,475 
Chậm 5 tháng -1,200 0,7044 0,030 0,076; 1,200 0,088 
Chậm 6 tháng -15,808 247,3907 0,000 0,000; + 0,949 
Chậm 7 tháng 11,473 179,2366 9,612.104 0,000; + 0,949 
Chậm 8 tháng -13,742 343,0832 0,000 0,000; + 0,968 
Tình trạng trả nợ 
tháng 4 
Trả đúng 
hạn 
X11 = -2 0,186 0,0760 1,204 1,038; 1,398 0,014 
X11 = 0 -0,183 0,0658 0,833 0,732; 0,947 0,005 
Chậm 2 tháng 0,293 0,0825 1,340 1,140; 1,575 0,000 
Chậm 3 tháng 0,609 0,2232 1,839 1,187; 2,849 0,006 
Chậm 4 tháng 0,773 0,4713 2,165 0,860; 5,453 0,101 
Chậm 5 tháng 0,491 0,7671 1,634 0,363; 7,347 0,522 
Chậm 6 tháng 1,863 0,8055 6,444 1,329; 3,125 0,021 
Chậm 7 tháng -10,391 179,2357 0,000 0,000; + 0,954 
Chậm 8 tháng 38,125 517,0116 3,610.1016 0,000; + 0,941 
Nguồn: Tính toán của tác giả trên phần mềm R 
Chuyên mục: Tài chính - Ngân hàng - TẠP CHÍ KINH TẾ & QUẢN TRỊ KINH DOANH SỐ 07 (2018) 
97 
Bảng 2: Hệ số phóng đại phương sai (VIF) 
Biến VIF Biến VIF 
X1 1,212 X12 5,297 
X2 1,006 X13 6,082 
X4 1,006 X15 2,970 
X6 2,060 X18 1,211 
X8 2,699 X19 1,122 
X9 4,585 X20 1,145 
X11 2,343 X21 1,049 
Nguồn: Tính toán của tác giả trên phần mềm R 
3.2. Kiểm định mô hình 
Kiểm tra đa cộng tuyến 
Hệ số phóng đại phương sai của các biến 
trong mô hình cho bởi bảng 2. 
Do không có hệ số phóng đại phương sai 
nào lớn hơn 10 nên có thể cho rằng mô hình 
không có đa cộng tuyến. 
Độ chính xác phân loại 
Bảng 3 so sánh độ chính xác trong phân loại 
của mô hình trên hai bộ dữ liệu huấn luyện và dữ 
liệu kiểm định với ngưỡng xác suất (cutoff - level) 
phân loại giữa vỡ nợ và không vỡ nợ là 0,5. 
Bảng 3: Ma trận confusion của mô hình 
Dữ liệu huấn luyện Thực tế 
 Vỡ nợ Không vỡ nợ 
Dự báo 
Vỡ nợ 1.177 539 
Không vỡ nợ 2.088 10.782 
Dữ liệu kiểm định Thực tế 
 Vỡ nợ Không vỡ nợ 
Dự báo 
Vỡ nợ 1.140 535 
Không vỡ nợ 2.112 10.776 
Nguồn: Tính toán của tác giả trên phần mềm R 
Bảng 4: Thống kê độ chính xác của mô hình 
 Dữ liệu huấn luyện Dữ liệu kiểm định 
Độ chính xác 0,820 0,818 
Khoảng tin cậy 95% 0,814; 0,826 0,812; 0,825 
Kappa 0,376 0,367 
McNemar‟s Test p –value <2,2.10-16 <2,2.10-16 
Độ nhạy (sensitivity) 0,360 0,351 
Độ đặc hiệu (specificity) 0,952 0,953 
Nguồn: Tính toán của tác giả trên phần mềm R 
Các thống kê về độ chính xác của mô hình 
trên hai bộ dữ liệu cho bởi bảng 4. 
Hình 4 là đường cong ROC của hai mô 
hình. Từ các kết quả thống kê độ chính xác và 
đường cong ROC, có thể thấy mô hình có độ 
chính xác trong phân loại khá ổn định trên hai 
mẫu dữ liệu huấn luyện và dữ liệu kiểm định. 
Chuyên mục: Tài chính - Ngân hàng - TẠP CHÍ KINH TẾ & QUẢN TRỊ KINH DOANH SỐ 07 (2018) 
98 
Bảng 5: So sánh AUC của mô hình trên hai bộ dữ liệu. 
 Dữ liệu huấn luyện Dữ liệu kiểm định 
AUC 0,776 0,766 
Khoảng tin cậy 95% 0,766; 0,786 0,756; 0,776 
Nguồn: Tính toán của tác giả trên phần mềm R 
Hình 4. Đường cong ROC của mô hình trên hai bộ dữ liệu 
Giá trị p của kiểm định Delong so sánh hai 
AUC là 0,148 cho thấy không có sự khác biệt 
giữa hai bộ dữ liệu về AUC. 
3.3. Đánh giá ảnh hưởng của các nhân tố đến 
xác suất vỡ nợ 
Để đánh giá ảnh hưởng của các biến giải 
thích trong mô hình đến xác suất vỡ nợ, tác giả 
sử dụng tỷ số odds (odds ratio – OR). 
Mô hình hồi quy logistic có thể viết dưới 
dạng: 
trong đó 
 | 
 | 
 được gọi là odds 
của khả năng vỡ nợ. Để đánh giá ảnh hưởng của 
 ta sẽ xác định odds thay đổi như thế nào khi 
 thay đổi một lượng với điều kiện các biến 
giải thích khác giữ nguyên. Ta có 
 | 
 | 
Đại lượng 
được gọi là odds ratio. Dễ thấy, . OR 
cho biết odds của khả năng vỡ nợ thay đổi một 
nhân tử là khi thay đổi một lượng là 
các yếu tố khác không đổi. Từ kết quả hồi quy 
trong bảng 1 và bảng 2, ta có nhận xét: 
 OR = 0,911 cho thấy khi hạn mức tín 
dụng tăng 50.000 đô là Đài Loan thì odds vỡ nợ 
giảm khoảng 10%. 
 OR = 0,830 cho thấy nữ có odds vỡ nợ 
bằng 83% so với odds vỡ nợ của nam. 
 : Khách hàng độc thân có odds vỡ nợ chỉ 
bằng 84% odds vỡ nợ của khách hàng đã kết 
hôn; khách hàng có tình trạng hôn nhân “Khác” 
có odds vỡ nợ không khác biệt có ý nghĩa thống 
kê với odds vỡ nợ của khách hàng đã kết hôn. 
 : Khi lượng chi tiêu trong tháng 9 tăng 
50.000 thì odds vỡ nợ giảm khoảng 16%. 
 Khi lượng chi tiêu tháng 8 tăng 50.000 
thì odds vỡ nợ tăng gấp 1,2 lần. 
 Khi lượng chi tiêu tháng 6 tăng 50.000 
thì odds vỡ nợ tăng gấp 1,1 lần. 
 : odds vỡ nợ giảm 16% khi lượng trả nợ 
tháng 9 tăng 10.000. 
Chuyên mục: Tài chính - Ngân hàng - TẠP CHÍ KINH TẾ & QUẢN TRỊ KINH DOANH SỐ 07 (2018) 
99 
 : odds vỡ nợ giảm 12,5% khi lượng trả 
nợ tháng 8 tăng 10.000. 
 odds vỡ nợ giảm 5,3% khi lượng trả nợ 
tháng 7 tăng 10.000. 
 odds vỡ nợ giảm 5% khi lượng trả nợ 
tháng 6 tăng 10.000. 
 Do phần lớn OR > 1 nên có 
thể thấy việc trả nợ trễ làm tăng khả năng vỡ nợ 
của khách hàng. 
Như vậy có thể thấy mô hình phản ánh khá 
chính xác tác động của các biến độc lập đến xác 
suất vỡ nợ như phần phân tích dữ liệu khám phá 
đã trình bày. 
 4. Kết luận 
Bài báo ứng dụng mô hình hồi quy logistic 
để đánh giá tác động của các biến giải thích đến 
xác suất vỡ nợ của một khách hàng tín dụng cá 
nhân và xây dựng một mô hình dự báo xác suất 
vỡ nợ. Mô hình dự báo có độ chính xác toàn cục 
trên 80% và AUC trên cả dữ liệu huấn 
luyện và dữ liệu kiểm định. Kết quả đánh giá tác 
động của các biến dựa vào OR của mô hình là 
phù hợp với kết quả phân tích dữ liệu khám phá 
sử dụng các công cụ hình ảnh. 
Hạn chế của nghiên cứu là chưa đánh giá, 
phân tích ảnh hưởng tương tác giữa các biến, 
chưa so sánh được tầm quan trọng của các biến 
giải thích cũng như chưa so sánh được độ chính 
xác trong phân loại tín dụng, trong ước lượng 
xác suất vỡ nợ giữa mô hình hồi quy logistic và 
các kỹ thuật data mining khác. Những vấn đề 
trên sẽ được tác giả tiếp tục hoàn thiện trong 
những nghiên cứu sau này. 
TÀI LIỆU THAM KHẢO 
[1]. Nguyễn Quang Dong, Nguyễn Thị Minh. (2012). Giáo trình Kinh tế lượng. Nhà xuất bản Đại học 
Kinh tế Quốc dân, 440 – 443. 
[2]. Harrell, F. E. (2015). Regression modeling strategies with applications to linear models, logistic 
and ordinal regression, and survival analysis, 2
nd
 edition, Springer – Verlag, Cham. 
[3]. Hosmer, D. W., Lemeshow, S., and Sturdivant, R. X. (2013). Applied logistic regression, 3
rd
edition, Jonh Wiley & Sons. 
[4]. Long, J. S. (1997). Regression models for categorical and limited dependent variables, Sage 
Publications. 
[5]. Steenackers, A., Goovaerts, M. J. (1989). A credit scoring model for personal loans. Insurance: 
Mathematics and Economics, 8, 31 – 34. 
[6]. Yeh, I. -C., Lien, C. –h. (2009). The comparisons of data mining techniques for the predictive 
accuracy of probability of default of credit card clients. Expert systems with applications, 36, 2473 – 
2480. 
[7]. Drugov, V. G., Default payments of credit card clients in Taiwan from 2005, https://rstudio-pubs-
static.s3.amazonaws.com/281390_8a4ea1f1d23043479814ec4a38dbbfd9.html. 
[8]. Nguyễn Chí Dũng. (2017). Kinh tế lượng ứng dụng với R. 
[9]. https://archive.ics.uci.edu/ml/machine-learning-databases/00350/ 
Thông tin tác giả: 
1. Hoàng Thanh Hải 
- Đơn vị công tác: Trường ĐH Kinh tế & QTKD 
- Địa chỉ email: hoangthanhhai03091988@gmail.com 
2. Trần Đình Chúc 
- Đơn vị công tác: Trường ĐH Kinh tế & QTKD 
3. Nguyễn Quỳnh Hoa 
- Đơn vị công tác: Trường ĐH Kinh tế & QTKD 
Ngày nhận bài: 05/111/2018 
Ngày nhận bản sửa: 12/12/2018 
Ngày duyệt đăng: 28/12/2018 
Journal of Economics and Business 
Administration - TUEBA 
100 
 TABLE OF CONTENTS 
ISSN: 2525 – 2569 No. 8, 2018 
Pham Hong Truong, Hoang Thanh Hai - Minimizing the maximum delay time when dealing with 
problems in factories with only one production line ................................................................................... 2 
Nguyen Đuc Thu, La Qui Duong - The effects of social responsibility on the employees‟ turnover 
intention at the brick manufacturing enterprises in Thai Nguyen province ................................................ 6 
Pham Thi Thanh Mai, Tran Thi Kim Oanh, Ha Kieu Trang - Business practice of handmade 
products from recycled materials .............................................................................................................. 11 
Lê Ngoc Nuong, Cao Thi Thanh Phuong - Policies to support the development of industrial 
enterprises in thai Nguyen province adaptive to the industrial revolution 4.0 .......................................... 17 
Aaron Kingsbury, Duong Hoai An, Pham Văn Tuan - The impact of climate change on tea 
production the case of Thai Nguyen province, Vietnam........................................................................... 23 
Dƣơng Thi Huyen Trang, Nguyen Nhu Quynh, Lê Thi Thanh Thuong - Analysis of the economic 
efficiency changes from dien pomelo plantation model in Tan Quang commune Song Cong City - Thai 
Nguyen Province ....................................................................................................................................... 32 
Nguyen Thi Nhung, Trinh Thi Thu Trang - Development of cooperative models in the northern 
midland and mountainous provinces in the context of the industrial revolution 4.0 ................................ 38 
Nguyen Ngoc Ly, Nguyen Thi Thuy Linh - Implementation results of agricultural production and rural 
infrastructure development policy in Bac Ninh province ............................................................................. 48 
Duong Hoai An, Hoang Van Cuong, Đo Xuan Luan, Nong Ngoc Hung - Determinants of household 
income of star anise growers in Binh Gia district, Lang Son province: A panel – data analysis.............. 54 
Nguyen Viet Dung, Duong Thanh Tinh - The national target program on new-style rural area building 
in Bac Ninh province: Reality and solutions ............................................................................................ 60 
Zhou Xiao Hong, Bui Thi Thuy - Why users generate content an application of the theory of planned 
behavior .................................................................................................................................................... 65 
Vu Bach Diep, Nguyen Thi Phuong Thao, Ngo Hoai Thu - Analysis of factors influencing Vietnam‟s 
exports to the eu market using the gravity model ..................................................................................... 72 
Nguyen Thi Thuy Trang, Nguyen Thi Thu Trang - Some legal disputes related to the subject of 
credit contracts .......................................................................................................................................... 79 
Nguyen Thi Tuan, Nguyen Thi Dung - The roles of internal audit for internal control at Thai Nguyen 
iron and steel joint stock company ............................................................................................................ 85 
Hoang Thanh Hai, Tran Đinh Chuc, Nguyen Quynh Hoa - A logistic regression model for estimating 
the probability of default of retail customers ............................................................................................ 92 

File đính kèm:

  • pdfmo_hinh_hoi_quy_logistic_trong_do_luong_xac_suat_vo_no_khach.pdf