Mô hình hồi quy Logistic trong đo lường xác suất vỡ nợ khách hàng tín dụng cá nhân
Để đưa ra quyết định cho một khách hàng
có được vay hay không và với mức lãi suất là
bao nhiêu, các tổ chức tín dụng cần phải phân
loại, xếp hạng tín dụng các khách hàng. Việc
phân loại phụ thuộc vào xác suất mà khách hàng
không trả được nợ đúng hạn, xác suất này gọi là
xác suất vỡ nợ (probability of default). Không trả
đúng hạn có thể là không trả gốc hoặc trả lãi
đúng hạn hoặc cả hai [1]. Tính toán được xác
suất vỡ nợ là công việc đầu tiên trong đánh giá
tín dụng và xác định chính sách lãi suất. Đối với
một khách hàng cá nhân, xác suất vỡ nợ chịu tác
động của nhiều nhân tố như trình độ học vấn, độ
tuổi, giới tính hay các nhân tố về tài chính như
tình trạng trả nợ định kỳ, mức chi tiêu.
Có nhiều mô hình thống kê đã được sử dụng
để ước lượng xác suất vỡ nợ như mô hình phân
tích chuyên biệt, hồi quy logistic, hồi quy probit,
mô hình cây phân loại, mô hình mạng nơ-ron.
Mỗi mô hình có ưu và nhược điểm riêng, trong
đó mô hình hồi quy logistic là mô hình được sử
dụng khá phổ biến vì sự đơn giản của mô hình và
độ chính xác trong phân loại cũng tương đương
với các phương pháp khác [8].
Tóm tắt nội dung tài liệu: Mô hình hồi quy Logistic trong đo lường xác suất vỡ nợ khách hàng tín dụng cá nhân
Chuyên mục: Tài chính - Ngân hàng - TẠP CHÍ KINH TẾ & QUẢN TRỊ KINH DOANH SỐ 07 (2018) 92 MÔ HÌNH HỒI QUY LOGISTIC TRONG ĐO LƢỜNG XÁC SUẤT VỠ NỢ KHÁCH HÀNG TÍN DỤNG CÁ NHÂN Hoàng Thanh Hải1, Trần Đình Chúc2, Nguyễn Quỳnh Hoa3 Tóm tắt Việc đánh giá rủi ro tín dụng là không thể bỏ qua trong hoạt động tín dụng của của các ngân hàng. Có nhiều nhân tố ảnh hưởng đến việc lượng hóa rủi ro tín dụng, trong đó xác suất vỡ nợ của khách hàng là yếu tố đầu tiên và rất quan trọng để ngân hàng đánh giá và ước lượng các nhân tố khác. Bài báo này ứng dụng hồi quy logistics để xây dựng một mô hình dự báo xác suất vỡ nợ của khách hàng tín dụng cá nhân và đánh giá tác động của các nhân tố đến xác suất này. Từ khóa: Rủi ro tín dụng, xác suất vỡ nợ, hồi quy logistic. A LOGISTIC REGRESSION MODEL FOR ESTIMATING THE PROBABILITY OF DEFAULT OF RETAIL CUSTOMERS Abstract In banks’credit activities, the assessment of credit risk is of paramout importance. Among a variety of factors used to quantify credit risk, the probability of default is the key one. In this paper, a logistic regression was employed to construct a model predicting the probability of default of credit card clients and evaluating regressors’ influences to this probability. Key words: credit risk, the probability of default, logistic regression. 1. Giới thiệu Để đưa ra quyết định cho một khách hàng có được vay hay không và với mức lãi suất là bao nhiêu, các tổ chức tín dụng cần phải phân loại, xếp hạng tín dụng các khách hàng. Việc phân loại phụ thuộc vào xác suất mà khách hàng không trả được nợ đúng hạn, xác suất này gọi là xác suất vỡ nợ (probability of default). Không trả đúng hạn có thể là không trả gốc hoặc trả lãi đúng hạn hoặc cả hai [1]. Tính toán được xác suất vỡ nợ là công việc đầu tiên trong đánh giá tín dụng và xác định chính sách lãi suất. Đối với một khách hàng cá nhân, xác suất vỡ nợ chịu tác động của nhiều nhân tố như trình độ học vấn, độ tuổi, giới tính hay các nhân tố về tài chính như tình trạng trả nợ định kỳ, mức chi tiêu. Có nhiều mô hình thống kê đã được sử dụng để ước lượng xác suất vỡ nợ như mô hình phân tích chuyên biệt, hồi quy logistic, hồi quy probit, mô hình cây phân loại, mô hình mạng nơ-ron. Mỗi mô hình có ưu và nhược điểm riêng, trong đó mô hình hồi quy logistic là mô hình được sử dụng khá phổ biến vì sự đơn giản của mô hình và độ chính xác trong phân loại cũng tương đương với các phương pháp khác [8]. Xét biến phụ thuộc nhị phân ( nếu khách hàng vỡ nợ, nếu ngược lại) và các biến độc lập . Mô hình hồi quy logistic có dạng: | hay dưới dạng tương đương: Các hệ số hồi quy được ước lượng bằng phương pháp hợp lý cực đại. 2. Phƣơng pháp nghiên cứu 2.1 Nguồn số liệu và mô tả biến Trong bài báo này, tác giả sử dụng bộ dữ liệu tín dụng của các khách hàng cá nhân tại một ngân hàng ở Đài Loan (Trung Quốc) để đánh giá ảnh hướng của các yếu tố đến xác suất vỡ nợ của khách hàng và xây dựng một mô hình ước lượng xác suất vỡ nợ. Nghiên cứu sử dụng dữ liệu trả nợ của 30.000 khách hàng tín dụng cá nhân tại một ngân hàng ở Đài Loan (Trung Quốc) tháng 10, 2005 [9]. Biến phụ thuộc là biến nhị phân ( nếu khách hàng vỡ nợ, nếu ngược lại) và 23 biến giải thích bao gồm thông tin cá nhân và dữ liệu trả nợ của khách hàng: Chuyên mục: Tài chính - Ngân hàng - TẠP CHÍ KINH TẾ & QUẢN TRỊ KINH DOANH SỐ 07 (2018) 93 : hạn mức tín dụng (đơn vị: Đô la Đài Loan). : Giới tính khách hàng (1 = Nam; 2 = Nữ). : Trình độ học vấn ( 1 = sau đại học; 2 = đại học; 3 = phổ thông; 4 = khác). : Tình trạng hôn nhân (1 = đã kết hôn; 2 = độc thân; 3 = khác). : độ tuổi (tuổi). : Tình trạng trả nợ hàng tháng (từ tháng 4 đến tháng 9 năm 2005): = tình trạng trả nợ tháng 9, 2005; = tình trạng trả nợ tháng 8, 2005;...; = tình trạng trả nợ tháng 4, 2005. Các mức bao gồm: -1 = trả nợ đúng hạn; 1 = trả nợ chậm 1 tháng; 2 = trả nợ chậm hai tháng; ...; 8 = trả nợ chậm 8 tháng; 9 = trả nợ chậm chín tháng trở lên. : Lượng chi tiêu hàng tháng (đô la Đài Loan). = lượng chi tiêu tháng 9, 2005; = lượng chi tiêu tháng 8, 2005; ...; = lượng chi tiêu tháng 4, 2005. : Lượng trả nợ hàng tháng (đô la Đài Loan). = lượng trả nợ tháng 9, 2005; = lượng trả nợ tháng 8, 2005; ...; = lượng trả nợ tháng 4, 2005. 2.2 Phân tích dữ liệu khám phá Tác giả sử dụng phần mềm R 3.3.1 để làm sạch dữ liệu và dùng các công cụ hình ảnh và kiểm định để đánh giá tổng quan về tác động của các biến độc lập đến biến phụ thuộc . Sử dụng biểu đồ tần số đối với các biến tình trạng trả nợ, có hai mức không được định nghĩa là -2, 0, hơn nữa có tới 25.939 quan sát trong tổng số 30.000 (chiếm 86,5%) quan sát có hai giá trị này, vì vậy tác giả giữ nguyên các mức để phân tích thay vì gán cho chúng giá trị không xác định NA (not available). Tương tự, có một vài quan sát của biến trình độ học vấn và tình trạng hôn nhân có các mức không được định nghĩa là 0, 5 và 6. Các quan sát này được gán cho giá trị NA. Đối với các biến liên tục, tác giả sử dụng biểu đồ tán xạ để quan sát các điểm bất thường (outliers) trong dữ liệu. Thông thường, một giá trị được gọi là giá trị bất thường trong mẫu nếu hoặc trong đó là tứ phân vị thứ 1 và thứ 3 của mẫu, . Hình 1 là biểu đồ tán xạ của biến hạn mức tín dụng. Giá trị trong trường hợp này là 525.000, tuy nhiên từ biểu đồ ta thấy giá trị đó hơi thấp để có thể loại quan sát. Tác giả sử dụng mức 750.000 làm căn cứ xác định điểm bất thường, có 6 quan sát thuộc loại này. Sau quá trình xác định outliers của tất cả các biến liên tục, có 1283 chỉ số tương ứng với 457 khách hàng bị loại khỏi dữ liệu gốc ban đầu. Bởi vậy, dữ liệu dùng để xây dựng mô hình còn lại có kích thước 29.543. Hình 1: Biểu đồ tán xạ biến hạn mức tín dụng Chuyên mục: Tài chính - Ngân hàng - TẠP CHÍ KINH TẾ & QUẢN TRỊ KINH DOANH SỐ 07 (2018) 94 Để đánh giá tác động của các biến độc lập lên biến phụ thuộc, tác giả sử dụng biểu đồ mosaic đối với biến định tính và biểu đồ violin, biểu đồ boxplot đối với biến định lượng. Hình 2: Biểu đồ mosaic quan hệ giữa giới tính và vỡ nợ Hình 2 là biểu đồ mosaic mô tả mối quan hệ giữa giới tính và tình trạng vỡ nợ. Quan sát biểu đồ có thể thấy khách hàng nam có xác suất vỡ nợ cao hơn khách hàng nữ. Giá trị của kiểm định Pearson cho thấy sự phụ thuộc giữa hai biến. Hình 3 là biểu đồ violin của lượng thanh toán tháng 9, 2005. Từ biểu đồ có thể nhận xét nhìn chung lượng thanh toán càng thấp thì khả năng vỡ nợ càng cao. Hình 3: Biểu đồ violin lượng thanh toán tháng 9, 2005 Bằng phương pháp tương tự đối với các biến giải thích khác, ta thu được kết quả đánh giá khái quát tác động của các biến đến khả năng vỡ nợ như sau: Chuyên mục: Tài chính - Ngân hàng - TẠP CHÍ KINH TẾ & QUẢN TRỊ KINH DOANH SỐ 07 (2018) 95 : Hạn mức tín dụng càng thấp, khả năng vỡ nợ càng cao. : Nam có khả năng vỡ nợ cao hơn nữ : Trình độ học vấn càng cao xác suất vỡ nợ càng thấp. : Khách hàng đã kết hôn có xác suất vỡ nợ cao hơn. : Nhóm có xác suất vỡ nợ lớn nhất là nhóm khách hàng dưới 25 tuổi, nhóm có xác suất vỡ nợ thấp nhất là nhóm trong độ tuổi 25 -34. : Càng trả nợ chậm, khả năng vỡ nợ càng cao. : Nhìn chung không có sự khác biệt giữa nhóm vỡ nợ và nhóm không vỡ nợ về lượng chi tiêu hàng tháng. : Lượng trả nợ càng thấp khả năng vỡ nợ càng cao. 2.3 Tiêu chuẩn lựa chọn mô hình Dữ liệu sau khi làm sạch, loại bỏ các giá trị NA và các điểm outliers được chia ngẫu nhiên thành hai nhóm, dữ liệu huấn luyện và dữ liệu kiểm định với tỷ lệ 50:50. Dữ liệu huấn luyện (kích thước 14.586) dùng để xây dựng mô hình và dữ liệu kiểm định (kích thước 14.563) dùng để đánh giá mô hình. Trên bộ dữ liệu huấn luyện, tác giả chọn biến đưa vào mô hình sử dụng tiêu chí AIC (Akaike‟s Information Criterion), được định nghĩa bởi: Trong đó: L là giá trị hàm hợp lý của mô hình, K là số tham số trong mô hình ( nếu mô hình logistic có biến giải thích) và là kích thước của mẫu. Mô hình càng sát thực tế ( lớn) và sử dụng ít biến ( nhỏ) thì AIC càng thấp. Bởi vậy, mô hình có AIC càng nhỏ được coi là mô hình càng tối ưu. 3. Kết quả nghiên cứu 3.1 Mô hình Sử dụng tiêu chí AIC, tác giả xác định được các biến sau đây đưa vào mô hình Kết quả hồi quy trên dữ liệu huấn luyện được thể hiện trên bảng 1. Bảng 1: Kết quả hồi quy logistic Biến Hệ số Sai số chuẩn OR Đơn vị so sánh Khoảng tin cậy 95% của OR p Hạn mức tín dụng -0,094 0,0094 0,911 +50.000 0,894; 0,928 Giới tính -0,186 0,0359 0,830 Nam 0,774; 0,891 Tình trạng hôn nhân Đã kết hôn Độc thân -0,174 0,0358 0,841 0,784; 0,902 1,26. Khác 0,024 0,1623 1,024 0,745; 1,408 0,882 Lượng chi tiêu tháng 9 -0,176 0,0731 0,839 +50.000 0,727; 0,968 0,016 Lượng chi tiêu tháng 8 0,186 0,0869 1,204 +50.000 1,016; 1,429 0,032 Lượng chi tiêu tháng 6 0,104 0,0498 1,109 +50.000 1,006; 1,223 0,037 Lượng trả nợ tháng 9 -0.,179 0,0305 0,836 +10.000 0,788; 0,888 5,00 Lượng trả nợ tháng 8 -0,134 0,0282 0,875 +10.000 0,828; 0,924 1,97 Lượng trả nợ tháng 7 -0,055 0,0234 0,947 +10.000 0,904; 0,991 0,019 Lượng trả nợ tháng 6 -0,051 0,0219 0,950 +10.000 0,910; 0,992 0,020 Chuyên mục: Tài chính - Ngân hàng - TẠP CHÍ KINH TẾ & QUẢN TRỊ KINH DOANH SỐ 07 (2018) 96 Bảng 1: Kết quả hồi quy logistic (tiếp) Biến Hệ số Sai số chuẩn OR Đơn vị so sánh Khoảng tin cậy 95% của OR p Tình trạng trả nợ tháng 9 Trả đúng hạn X6 = -2 - 0,403 0,0989 0,668 0,550; 0,811 4,59.10 -5 X6 = 0 -0,637 0,0682 0,529 0,463; 0,605 < 2 10-16 Chậm 1 tháng 0,341 0,0668 1,406 1,234; 1,603 3,25 10-7 Chậm 2 tháng 1,570 0,0776 4,809 4,131; 5,599 < 2 10-16 Chậm 3 tháng 1,494 0,1704 4,454 3,189; 6,220 < 2 10-16 Chậm 4 tháng 0,892 0,2808 2,439 1,407; 4,229 0,002 Chậm 5 tháng 0,156 0,4842 1,169 0,453; 3,019 0,747 Chậm 6 tháng 0,842 0,7551 2,321 0,528; 10,196 0,265 Chậm 7 tháng 2,199 1,2813 9,020 0,732; 111,139 0,086 Chậm 8 tháng -12,351 247,3855 0,000 0,000; 0,960 Tình trạng trả nợ tháng 7 Trả đúng hạn X8 = -2 0,063 0,1065 1,065 0,865; 1,313 0,552 X8 = 0 0,215 0,0835 1,240 1,052; 1,460 0,010 Chậm 1 tháng -12,276 377,9862 0,000 0,000; 0,974 Chậm 2 tháng 0,570 0,0863 1,769 1,494; 2,095 1,88 10-11 Chậm 3 tháng 0,365 0,1918 1,440 0,989; 2,097 0,057 Chậm 4 tháng 0,103 0,3920 1,108 0,514; 2,389 0,794 Chậm 5 tháng 0,096 0,7570 1,101 0,250; 4,854 0,899 Chậm 6 tháng 14,183 247,3858 1,444.106 0,000; + 0,954 Chậm 7 tháng -0,147 0,8638 0,863 0,159; 4,692 0,865 Chậm 8 tháng -12,266 179,2412 0,000 0,000; + 0,945 Tình trạng trả nợ tháng 6 Trả đúng hạn X9 = -2 0,104 0,1043 1,120 0,905;1,361 0,318 X9 = 0 0,074 0,0806 1,077 0,920;1,261 0,357 Chậm 1 tháng 1,045 655,392 2,844 0,000; + 0,999 Chậm 2 tháng 0,459 0,0942 1,582 1,315; 1,903 1,13.10-6 Chậm 3 tháng 0,476 0,2350 1,609 1,015; 2,551 0,043 Chậm 4 tháng 0,307 0,4306 1,360 0,585;1,198 0,475 Chậm 5 tháng -1,200 0,7044 0,030 0,076; 1,200 0,088 Chậm 6 tháng -15,808 247,3907 0,000 0,000; + 0,949 Chậm 7 tháng 11,473 179,2366 9,612.104 0,000; + 0,949 Chậm 8 tháng -13,742 343,0832 0,000 0,000; + 0,968 Tình trạng trả nợ tháng 4 Trả đúng hạn X11 = -2 0,186 0,0760 1,204 1,038; 1,398 0,014 X11 = 0 -0,183 0,0658 0,833 0,732; 0,947 0,005 Chậm 2 tháng 0,293 0,0825 1,340 1,140; 1,575 0,000 Chậm 3 tháng 0,609 0,2232 1,839 1,187; 2,849 0,006 Chậm 4 tháng 0,773 0,4713 2,165 0,860; 5,453 0,101 Chậm 5 tháng 0,491 0,7671 1,634 0,363; 7,347 0,522 Chậm 6 tháng 1,863 0,8055 6,444 1,329; 3,125 0,021 Chậm 7 tháng -10,391 179,2357 0,000 0,000; + 0,954 Chậm 8 tháng 38,125 517,0116 3,610.1016 0,000; + 0,941 Nguồn: Tính toán của tác giả trên phần mềm R Chuyên mục: Tài chính - Ngân hàng - TẠP CHÍ KINH TẾ & QUẢN TRỊ KINH DOANH SỐ 07 (2018) 97 Bảng 2: Hệ số phóng đại phương sai (VIF) Biến VIF Biến VIF X1 1,212 X12 5,297 X2 1,006 X13 6,082 X4 1,006 X15 2,970 X6 2,060 X18 1,211 X8 2,699 X19 1,122 X9 4,585 X20 1,145 X11 2,343 X21 1,049 Nguồn: Tính toán của tác giả trên phần mềm R 3.2. Kiểm định mô hình Kiểm tra đa cộng tuyến Hệ số phóng đại phương sai của các biến trong mô hình cho bởi bảng 2. Do không có hệ số phóng đại phương sai nào lớn hơn 10 nên có thể cho rằng mô hình không có đa cộng tuyến. Độ chính xác phân loại Bảng 3 so sánh độ chính xác trong phân loại của mô hình trên hai bộ dữ liệu huấn luyện và dữ liệu kiểm định với ngưỡng xác suất (cutoff - level) phân loại giữa vỡ nợ và không vỡ nợ là 0,5. Bảng 3: Ma trận confusion của mô hình Dữ liệu huấn luyện Thực tế Vỡ nợ Không vỡ nợ Dự báo Vỡ nợ 1.177 539 Không vỡ nợ 2.088 10.782 Dữ liệu kiểm định Thực tế Vỡ nợ Không vỡ nợ Dự báo Vỡ nợ 1.140 535 Không vỡ nợ 2.112 10.776 Nguồn: Tính toán của tác giả trên phần mềm R Bảng 4: Thống kê độ chính xác của mô hình Dữ liệu huấn luyện Dữ liệu kiểm định Độ chính xác 0,820 0,818 Khoảng tin cậy 95% 0,814; 0,826 0,812; 0,825 Kappa 0,376 0,367 McNemar‟s Test p –value <2,2.10-16 <2,2.10-16 Độ nhạy (sensitivity) 0,360 0,351 Độ đặc hiệu (specificity) 0,952 0,953 Nguồn: Tính toán của tác giả trên phần mềm R Các thống kê về độ chính xác của mô hình trên hai bộ dữ liệu cho bởi bảng 4. Hình 4 là đường cong ROC của hai mô hình. Từ các kết quả thống kê độ chính xác và đường cong ROC, có thể thấy mô hình có độ chính xác trong phân loại khá ổn định trên hai mẫu dữ liệu huấn luyện và dữ liệu kiểm định. Chuyên mục: Tài chính - Ngân hàng - TẠP CHÍ KINH TẾ & QUẢN TRỊ KINH DOANH SỐ 07 (2018) 98 Bảng 5: So sánh AUC của mô hình trên hai bộ dữ liệu. Dữ liệu huấn luyện Dữ liệu kiểm định AUC 0,776 0,766 Khoảng tin cậy 95% 0,766; 0,786 0,756; 0,776 Nguồn: Tính toán của tác giả trên phần mềm R Hình 4. Đường cong ROC của mô hình trên hai bộ dữ liệu Giá trị p của kiểm định Delong so sánh hai AUC là 0,148 cho thấy không có sự khác biệt giữa hai bộ dữ liệu về AUC. 3.3. Đánh giá ảnh hưởng của các nhân tố đến xác suất vỡ nợ Để đánh giá ảnh hưởng của các biến giải thích trong mô hình đến xác suất vỡ nợ, tác giả sử dụng tỷ số odds (odds ratio – OR). Mô hình hồi quy logistic có thể viết dưới dạng: trong đó | | được gọi là odds của khả năng vỡ nợ. Để đánh giá ảnh hưởng của ta sẽ xác định odds thay đổi như thế nào khi thay đổi một lượng với điều kiện các biến giải thích khác giữ nguyên. Ta có | | Đại lượng được gọi là odds ratio. Dễ thấy, . OR cho biết odds của khả năng vỡ nợ thay đổi một nhân tử là khi thay đổi một lượng là các yếu tố khác không đổi. Từ kết quả hồi quy trong bảng 1 và bảng 2, ta có nhận xét: OR = 0,911 cho thấy khi hạn mức tín dụng tăng 50.000 đô là Đài Loan thì odds vỡ nợ giảm khoảng 10%. OR = 0,830 cho thấy nữ có odds vỡ nợ bằng 83% so với odds vỡ nợ của nam. : Khách hàng độc thân có odds vỡ nợ chỉ bằng 84% odds vỡ nợ của khách hàng đã kết hôn; khách hàng có tình trạng hôn nhân “Khác” có odds vỡ nợ không khác biệt có ý nghĩa thống kê với odds vỡ nợ của khách hàng đã kết hôn. : Khi lượng chi tiêu trong tháng 9 tăng 50.000 thì odds vỡ nợ giảm khoảng 16%. Khi lượng chi tiêu tháng 8 tăng 50.000 thì odds vỡ nợ tăng gấp 1,2 lần. Khi lượng chi tiêu tháng 6 tăng 50.000 thì odds vỡ nợ tăng gấp 1,1 lần. : odds vỡ nợ giảm 16% khi lượng trả nợ tháng 9 tăng 10.000. Chuyên mục: Tài chính - Ngân hàng - TẠP CHÍ KINH TẾ & QUẢN TRỊ KINH DOANH SỐ 07 (2018) 99 : odds vỡ nợ giảm 12,5% khi lượng trả nợ tháng 8 tăng 10.000. odds vỡ nợ giảm 5,3% khi lượng trả nợ tháng 7 tăng 10.000. odds vỡ nợ giảm 5% khi lượng trả nợ tháng 6 tăng 10.000. Do phần lớn OR > 1 nên có thể thấy việc trả nợ trễ làm tăng khả năng vỡ nợ của khách hàng. Như vậy có thể thấy mô hình phản ánh khá chính xác tác động của các biến độc lập đến xác suất vỡ nợ như phần phân tích dữ liệu khám phá đã trình bày. 4. Kết luận Bài báo ứng dụng mô hình hồi quy logistic để đánh giá tác động của các biến giải thích đến xác suất vỡ nợ của một khách hàng tín dụng cá nhân và xây dựng một mô hình dự báo xác suất vỡ nợ. Mô hình dự báo có độ chính xác toàn cục trên 80% và AUC trên cả dữ liệu huấn luyện và dữ liệu kiểm định. Kết quả đánh giá tác động của các biến dựa vào OR của mô hình là phù hợp với kết quả phân tích dữ liệu khám phá sử dụng các công cụ hình ảnh. Hạn chế của nghiên cứu là chưa đánh giá, phân tích ảnh hưởng tương tác giữa các biến, chưa so sánh được tầm quan trọng của các biến giải thích cũng như chưa so sánh được độ chính xác trong phân loại tín dụng, trong ước lượng xác suất vỡ nợ giữa mô hình hồi quy logistic và các kỹ thuật data mining khác. Những vấn đề trên sẽ được tác giả tiếp tục hoàn thiện trong những nghiên cứu sau này. TÀI LIỆU THAM KHẢO [1]. Nguyễn Quang Dong, Nguyễn Thị Minh. (2012). Giáo trình Kinh tế lượng. Nhà xuất bản Đại học Kinh tế Quốc dân, 440 – 443. [2]. Harrell, F. E. (2015). Regression modeling strategies with applications to linear models, logistic and ordinal regression, and survival analysis, 2 nd edition, Springer – Verlag, Cham. [3]. Hosmer, D. W., Lemeshow, S., and Sturdivant, R. X. (2013). Applied logistic regression, 3 rd edition, Jonh Wiley & Sons. [4]. Long, J. S. (1997). Regression models for categorical and limited dependent variables, Sage Publications. [5]. Steenackers, A., Goovaerts, M. J. (1989). A credit scoring model for personal loans. Insurance: Mathematics and Economics, 8, 31 – 34. [6]. Yeh, I. -C., Lien, C. –h. (2009). The comparisons of data mining techniques for the predictive accuracy of probability of default of credit card clients. Expert systems with applications, 36, 2473 – 2480. [7]. Drugov, V. G., Default payments of credit card clients in Taiwan from 2005, https://rstudio-pubs- static.s3.amazonaws.com/281390_8a4ea1f1d23043479814ec4a38dbbfd9.html. [8]. Nguyễn Chí Dũng. (2017). Kinh tế lượng ứng dụng với R. [9]. https://archive.ics.uci.edu/ml/machine-learning-databases/00350/ Thông tin tác giả: 1. Hoàng Thanh Hải - Đơn vị công tác: Trường ĐH Kinh tế & QTKD - Địa chỉ email: hoangthanhhai03091988@gmail.com 2. Trần Đình Chúc - Đơn vị công tác: Trường ĐH Kinh tế & QTKD 3. Nguyễn Quỳnh Hoa - Đơn vị công tác: Trường ĐH Kinh tế & QTKD Ngày nhận bài: 05/111/2018 Ngày nhận bản sửa: 12/12/2018 Ngày duyệt đăng: 28/12/2018 Journal of Economics and Business Administration - TUEBA 100 TABLE OF CONTENTS ISSN: 2525 – 2569 No. 8, 2018 Pham Hong Truong, Hoang Thanh Hai - Minimizing the maximum delay time when dealing with problems in factories with only one production line ................................................................................... 2 Nguyen Đuc Thu, La Qui Duong - The effects of social responsibility on the employees‟ turnover intention at the brick manufacturing enterprises in Thai Nguyen province ................................................ 6 Pham Thi Thanh Mai, Tran Thi Kim Oanh, Ha Kieu Trang - Business practice of handmade products from recycled materials .............................................................................................................. 11 Lê Ngoc Nuong, Cao Thi Thanh Phuong - Policies to support the development of industrial enterprises in thai Nguyen province adaptive to the industrial revolution 4.0 .......................................... 17 Aaron Kingsbury, Duong Hoai An, Pham Văn Tuan - The impact of climate change on tea production the case of Thai Nguyen province, Vietnam........................................................................... 23 Dƣơng Thi Huyen Trang, Nguyen Nhu Quynh, Lê Thi Thanh Thuong - Analysis of the economic efficiency changes from dien pomelo plantation model in Tan Quang commune Song Cong City - Thai Nguyen Province ....................................................................................................................................... 32 Nguyen Thi Nhung, Trinh Thi Thu Trang - Development of cooperative models in the northern midland and mountainous provinces in the context of the industrial revolution 4.0 ................................ 38 Nguyen Ngoc Ly, Nguyen Thi Thuy Linh - Implementation results of agricultural production and rural infrastructure development policy in Bac Ninh province ............................................................................. 48 Duong Hoai An, Hoang Van Cuong, Đo Xuan Luan, Nong Ngoc Hung - Determinants of household income of star anise growers in Binh Gia district, Lang Son province: A panel – data analysis.............. 54 Nguyen Viet Dung, Duong Thanh Tinh - The national target program on new-style rural area building in Bac Ninh province: Reality and solutions ............................................................................................ 60 Zhou Xiao Hong, Bui Thi Thuy - Why users generate content an application of the theory of planned behavior .................................................................................................................................................... 65 Vu Bach Diep, Nguyen Thi Phuong Thao, Ngo Hoai Thu - Analysis of factors influencing Vietnam‟s exports to the eu market using the gravity model ..................................................................................... 72 Nguyen Thi Thuy Trang, Nguyen Thi Thu Trang - Some legal disputes related to the subject of credit contracts .......................................................................................................................................... 79 Nguyen Thi Tuan, Nguyen Thi Dung - The roles of internal audit for internal control at Thai Nguyen iron and steel joint stock company ............................................................................................................ 85 Hoang Thanh Hai, Tran Đinh Chuc, Nguyen Quynh Hoa - A logistic regression model for estimating the probability of default of retail customers ............................................................................................ 92
File đính kèm:
- mo_hinh_hoi_quy_logistic_trong_do_luong_xac_suat_vo_no_khach.pdf