Phát triển chương trình con làm khớp dữ liệu với nhiều mô hình
Hiện nay, có rất nhiều phần mềm máy tính cho phép người dùng làm khớp dữ
liệu thực nghiệm với dạng hàm tùy ý nhập bởi người dùng. Tuy nhiên, các chương
trình này có dạng đóng (đối với các chương trình thương mại) hoặc có hệ thống thư
viện liên kết rất phức tạp (đối với các chương trình mã nguồn mở). Do đó, việc tận
dụng thư viện của các chương trình này để nhúng vào các chương trình phần mềm
nhỏ tự thiết kế là không thích hợp. Bài báo này đưa ra bộ chương trình con, cho
phép người dùng làm khớp số liệu thực nghiệm với dạng hàm tùy ý, được viết bằng
ngôn ngữ C++, có cấu trúc đơn giản, gói gọn trong một tập tin chỉ dài 438 dòng,
thuận tiện để nhúng vào các chương trình tự phát triển. Kết quả thu được bằng
chương trình được so sánh với ROOT.
Tóm tắt nội dung tài liệu: Phát triển chương trình con làm khớp dữ liệu với nhiều mô hình
TẠP CHÍ KHOA HỌC - ĐẠI HỌC ĐỒNG NAI, SỐ 03 - 2016 ISSN 2354-1482 122 PHÁT TRIỂN CHƯƠNG TRÌNH CON LÀM KHỚP DỮ LIỆU VỚI NHIỀU MÔ HÌNH ThS. Nguyễn Ngọc Anh1 ThS. Trương Văn Minh2 TÓM TẮT Hiện nay, có rất nhiều phần mềm máy tính cho phép người dùng làm khớp dữ liệu thực nghiệm với dạng hàm tùy ý nhập bởi người dùng. Tuy nhiên, các chương trình này có dạng đóng (đối với các chương trình thương mại) hoặc có hệ thống thư viện liên kết rất phức tạp (đối với các chương trình mã nguồn mở). Do đó, việc tận dụng thư viện của các chương trình này để nhúng vào các chương trình phần mềm nhỏ tự thiết kế là không thích hợp. Bài báo này đưa ra bộ chương trình con, cho phép người dùng làm khớp số liệu thực nghiệm với dạng hàm tùy ý, được viết bằng ngôn ngữ C++, có cấu trúc đơn giản, gói gọn trong một tập tin chỉ dài 438 dòng, thuận tiện để nhúng vào các chương trình tự phát triển. Kết quả thu được bằng chương trình được so sánh với ROOT. Từ khóa:Chương trình làm khớp nền C++, thuật toán làm khớp Levenberg– Marquardt 1. Giới thiệu Làm khớp dữ liệu theo một mô hình (dạng hàm) là một thủ tục được tiến hành rất phổ biến trong phân tích số liệu (phân tích phổ, xây dựng mô hình, xác định các tham số để nội suy, ngoại suy). Các thủ tục này có thể được thực hiện bởi các chương trình có giao diện trực quan như Origin [1], SciDavis [2] hoặc các chương trình dưới dạng lệnh thực thi như ROOT [3], R [4], Matlab [5], Gnuplot [6]. Tuy nhiên, một số là các chương trình thương mại (Origin, Matlab), do đó người sử dụng sẽ phải bỏ ra một chi phí không nhỏ để trang bị phần mềm. Tiếp nữa, các chương trình này thường có bộ thư viện đi kèm rất lớn, và liên kết với nhau rất phức tạp. Do, đó việc nhúng các thư viện này vào các chương trình nhỏ tự viết là rất phức tạp, và làm tăng kích thước của chương trình. Trong thực tế, tùy thuộc vào tình huống cụ thể, việc sử dụng các phần mềm lớn kể trên để làm khớp không phải lúc nào cũng thuận lợi: chương trình quá nặng; hệ điều hành không hỗ trợ; Khi đó các phần mềm tự viết sẽ là một giải pháp thích hợp. Bộ chương trình con được cung cấp trong bài báo này cho phép người dùng nhúng vào trong các phần mềm tự viết, để thực thi tác vụ làm khớp số liệu theo mô hình bất kỳ do người dùng khai báo, sử dụng thuật toán LEVENBERG- MARQUARDT [7]. Chương trình cho phép người dùng lựa chọn làm khớp có trọng số hoặc không có trọng số. Bộ chương trình con này có kích thước rất nhỏ, chỉ ~12 kb, gói gọn trong một tập tin *.h, thuận tiện để người dùng khai báo trong chương trình chính. Ngôn ngữ được sử dụng là C++.Biên dịch bằng GNU g++ [8]. Bộ chương trình con được hiệu lực hóa bằng cách so sánh kết quả với chương trình mã nguồn mở đã được chứng nhận và sử dụng rộng rãi trên các phòng thí nghiệm trên thế giới, ROOT.Trong báo cáo này, bộ số liệu đã được sử dụng để so sánh. 1 Viện Nghiên cứu Hạt nhân Đà Lạt 2 Trường Đại học Đồng Nai TẠP CHÍ KHOA HỌC - ĐẠI HỌC ĐỒNG NAI, SỐ 03 - 2016 ISSN 2354-1482 123 2. Thuật toán v s tr Thuật toán LEVENBERG- MARQUARDT Xét bộ số liệu với n điểm thực nghiệm (Xi,Yi), mô hình cần làm khớp là F(X,α), với α là vectơ tham số {α1,α2,α3,.,αm). Theo đó: Yi=F(Xi,α1,α2,α3,.,αm) (1) Để xác định các tham số tự do, ta sử dụng phương pháp bình phương tối thiểu [9]. Phương pháp này đòi hỏi phải xác định αsao cho là cực tiểu: (2) Trong đó là trọng số tương ứng với điểm số liệu thứ i. cực tiểu khi: (3) Đối với các hàm tuyến tính, hệ m phương trình nói trên có thể được giải ra nghiệm xác định bằng phương pháp Gauss-Jordan.Tuy nhiên, với các bài toán phi tuyến, hệ phương trình trên không thể giải được. Khai triển F(X,α) theo chuỗi Taylor, ta thu được biểu thức dưới dạng ma trận: (4) Trong đó M là ma trận [m m] mà: (5 ) Và (6 ) là vectơ biến thiên của vectơ tham số . Giải phương trình (3) cho phép xác định , từ đó xác định được mới. Thủ tục này lặp đi lặp lại nhiều lần cho tới khi hội tụ. Phương pháp LEVENBERG-MARQUARDT, bổ sung thêm vào thuật toán 2 tham số và , nhằm cải thiện khả năng hội tụ của quá trình khớp. Thuật toán có thể được mô tả ngắn gọn, từng bước một như sau, lưu đồ thuật toán được đưa ra trong Hình 1: 1. Đặt , , n=0. 2. Xác định từ phương trình: (7) Với , là ma trận đơn vị. 3. n=n+1 4. 5. Tính 6. Nếu n<2, đi tới bước 9 7. Nếu n<3, đi tới bước 8 8. Nếu , trong đó thì tiếp tục vòng lặp, nếu không, thoát ra khỏi vòng lặp. 9. Đặt ; Quay lại bước 2. TẠP CHÍ KHOA HỌC - ĐẠI HỌC ĐỒNG NAI, SỐ 03 - 2016 ISSN 2354-1482 124 Hình 1. Lưu đồ thuật toán ắt đầu n<2 n<3 Kết thúc có không có TẠP CHÍ KHOA HỌC - ĐẠI HỌC ĐỒNG NAI, SỐ 03 - 2016 ISSN 2354-1482 125 S d tr o Thủ tục làm khớp dữ liệu được thực hiện bởi hai chương trình con LSfit_NL (không có trọng số) và LSfit_NLW (có trọng số). Cú pháp khai báo như sau: LSfit_NL(matrix X, matrix Y, int par_num, matrix par) LSfit_NLW(matrix X, matrix Y, matrix W, int par_num, matrix par) Trong đó X, Y là hai ma trận tương ứng với bộ số liệu thực nghiệm (X,Y), W là ma trận trọng số, par_num là số tham số tự do của mô hình làm khớp, par là ma trận tương ứng với giá trị ban đầu của tham số. Mảng hai chiều hoặc một chiều có thể được chuyển thành ma trận (matrix) thông qua chương trình con array_to_matrix với cú pháp như sau: array_to_matrix((double *)array, int row, int col); array là mảng 1 chiều hoặc 2 chiều, row là số dòng, và col là số cột của ma trận tạo thành. Ví dụ, mảng hai chiều A[3][2] có thể được chuyển đổi thành ma trận MA[3][2] thông qua câu lệnh sau: MA = array_to_matrix((double*)A, 3, 2) Mô hình làm khớp được khai báo bên trong chương trình con uf double uf(double x, matrix par) { double result; result = par.E[0]*exp(x/par.E[1]); //par.E[i] là tham số tự do thứ i, x là biến. return result; } Đoạn chương trình thực hiện tác vụ làm khớp bộ số liệu 1 điểm theo mô hình f(x)=a*exp(x/b) với a, b là các tham số tự do được đưa ra dưới đây: double uf(double x, matrix par) #include #include "matrix.h" #include using namespace std; { double result; result = par.E[0]*exp(x/par.E[1]); // par.E[0]=a; par.E[1]=b return result; TẠP CHÍ KHOA HỌC - ĐẠI HỌC ĐỒNG NAI, SỐ 03 - 2016 ISSN 2354-1482 126 } int main() { double A[15]={1,2,3,4,5,6,7,8,9,10,11,12,13,14,15}; double B[15]={20,39,66,113,180,300,497,816,1346,2230,3674,6050,9 976,16454,27122}; double C[15] = {0.222851, 0.160098, 0.122793, 0.094265, 0.074557 ,0.057718, 0.044859, 0.035006, 0.027256, 0.021178, 0.016497, 0.012857, 0.010012, 0.007796, 0.006072}; double para[2]={10,2}; matrix X = array_to_matrix(A,15,1); matrix Y = array_to_matrix(B,15,1); matrix W = array_to_matrix(C,15,1); matrix par = array_to_matrix(para,2,1); cout<<"No Weighted:"<<endl; Mprint(LSfit_NL(X,Y,2,par)); par=array_to_matrix(para,2,1); //khởi tạo lại tham số ban đầu cout<<"Weighted:"<<endl; Mprint(LSfit_NLW(X,Y,W,2,par)); return 0; } Mảng A, B, C lần lượt tương ứng với các ma trận X, Y, W. Để hiệu lực hóa chương trình, kết quả tính toán thực hiện bởi chương trình trên nhiều bộ số liệu khác nhau với các mô hình liệt kê dưới đây được so sánh với chương trình ROOT. Các mô hình làm khớp được thử nghiệm bao gồm: - Mô hình hàm lũy thừa cơ số tự nhiên: f(x)=a*exp(x/b); - Mô hình hàm gauss g(x)=A*exp(-(x- ) 2 /2 ), với A, , là các tham số tự do. - Mô hình hàm gauss nằm trên một nền phông tương ứng với đa thức bậc 1: f(x) = g(x) + a1*x + a0 - Mô hình hai hàm gauss nằm chập lên nhau chồng trên một nền phông tương ứng với đa thức bậc 1: f(x) = g1(x) + g2(x)+ a1*x + a0 TẠP CHÍ KHOA HỌC - ĐẠI HỌC ĐỒNG NAI, SỐ 03 - 2016 ISSN 2354-1482 127 - Mô hình ba hàm gauss chập trên nền phông tương ứng với đa thức bậc 1: f(x)=f(x) = g1(x) + g2(x)+g3(x)+ a1*x + a0 3. H ệu tr t qu so s vớ ROOT Kết quả thu được bởi chương trình được so sánh với ROOT, phần mềm được sử dụng rộng rãi bởi nhiều phòng thí nghiệm trên thế giới. Kết quả so sánh với một số mô hình được trình bày trong Bảng 1. Bảng 1. So sánh giá trị tham số làm khớp của chương trình với ROOT T m số Gí trị b đầu C tr này ROOT Độ ệ tr (%) H m ũy t ừ số t ê : y= *exp(x/b) Không trọng số a 10 15,0015 15,0015 0 b 2 2,0000 2,0000 0 Có trọng số a 10 14,9828 15,0119 0,19 b 2 1,9997 2,0002 0,03 Hàm gauss: y = A*exp(-(x-μ)2/σ2) Không trọng số A 80 99,7945 99,7951 0,00 μ 52 50,0195 50,0195 0,00 σ 20 10,0041 10,0041 0,00 Có trọng số A 80 99,3681 99,9418 0,58 μ 52 50,1327 50,0060 0,25 σ 20 10,0439 9,9759 0,68 G uss + đ t ứ bậ 1: y = A*exp(-(x-μ)2/σ2)+ a1*x + a0 Không trọng số A 80 99,8306 99,8308 0,00 μ 52 50,0090 50,0090 0,00 σ 10 10,0198 10,0198 0,00 a1 2 2,0047 2,0047 0,00 a0 3 2,7612 2,7611 0,00 Có trọng số A 80 99,7179 99,9112 0,19 μ 52 50,0157 50,0015 0,03 σ 10 10,0227 10,0274 0,05 a1 2 2,0026 2,0076 0,25 a0 3 2,8558 2,5562 10,49 TẠP CHÍ KHOA HỌC - ĐẠI HỌC ĐỒNG NAI, SỐ 03 - 2016 ISSN 2354-1482 128 2 m uss ập + đ t ứ bậ 1: y = A*exp(-(x-μ)2/σ2)+ a1*x + a0 + A1*exp(-(x- μ1)2/σ12) Không trọng số A1 80 79,8317 79,8321 0,00 μ1 31 29,9800 29,9801 0,00 σ1 8 7,9845 7,9845 0,00 a1 2 0,9997 0,9997 0,00 a0 3 2,0129 2,0128 0,00 A2 90 99,9497 99,9500 μ2 51 49,9717 49,9717 σ2 10 12,0307 12,0307 Có trọng số A1 80 79,6992 79,8282 0,16 μ1 31 29,9754 29,9798 0,01 σ1 8 7,9896 7,9745 0,19 a1 2 0,9999 0,9997 0,03 a0 3 2,0053 2,0195 0,71 A2 90 99,8090 99,9412 0,13 μ2 51 49,9667 49,9676 0,00 σ2 10 12,0467 12,0371 0,08 3 m uss ập + đ t ứ bậ 1: A1*exp(-(x-μ1)2/σ12)+ a1*x + a0 + A2*exp(-(x- μ2)2/σ22)+ A3*exp(-(x-μ3)2/σ32) Không trọng số A1 75 80,1944 80,2094 0,02 μ1 25 31,0066 31,0096 0,01 σ1 10 7,9983 8,0012 0,04 a1 1 1,9997 1,9998 0,00 a0 2 2,9995 2,9983 0,04 A2 100 90,0007 89,9736 0,03 μ2 45 50,9908 50,9791 0,02 σ2 8 9,9805 9,9628 0,18 A3 210 200,2460 200,4460 0,10 μ3 65 60,9977 60,9968 0,00 σ3 8 4,9986 5,0010 0,05 Có trọng số A1 75 80,6545 80,3449 0,38 μ1 25 31,1255 31,0127 0,36 σ1 10 8,1015 8,0189 1,02 a1 1 2,0004 2,0020 0,08 a0 2 2,9873 2,8098 5,94 A2 100 88,8030 90,0044 1,35 TẠP CHÍ KHOA HỌC - ĐẠI HỌC ĐỒNG NAI, SỐ 03 - 2016 ISSN 2354-1482 129 μ2 45 50,5029 50,9623 0,91 σ2 8 9,2869 9,9319 6,95 A3 210 208,4220 200,7630 3,67 μ3 65 60,9426 60,9965 0,09 σ3 8 5,0936 5,0069 1,70 4. K t qu Mô hình đầu tiên được sử dụng để so sánh là mô hình hàm lũy thừa cơ số tự nhiên. Mô hình hàm lũy thừa là dạng mô hình điển hình nhất khi tiến hành thủ tục làm khớp phi tuyến, do tham số ảnh hưởng rất mạnh tới giá trị của hàm. Chỉ một lượng nhỏ thay đổi trong tham số cũng khiến giá trị của hàm thay đổi một lượng lớn.Kết quả trong Bảng 1 cho thấy, khi làm khớp không trọng số, chương trình hội tụ về giá trị tham số hoàn toàn giống với ROOT. Đối với quá trình làm khớp có trọng số, kết quả thulệch so với ROOT một lượng nhỏ hơn .2 . Các mô hình gauss, gauss trên nền đa thức bậc một, chập 2 hàm gauss trên nền đa thức bậc 1, và chập 3 hàm gauss trên nền đa thức bậc một đều cho kết quả tương đồng với ROOT. Độ chênh lệch của giá trị tham số làm khớp thu được bởi chương trình với giá trị thu được từ ROOT phần lớn đều nhỏ hơn 1%. Chỉ có một số ít trường hợp, giá trị tham số làm khớp thu được bởi chương trình lệch so với ROOT cao hơn 1 . Tuy nhiên trong các trường hợp đó, các tham số có độ lệch cao là các tham số có mức độ ảnh hưởng tới giá trị của hàm số rất nhỏ. Ví dụ như trường hợp tham số a thu được khi làm khớp với mô hình gauss trên nền đa thức bậc 1, độ lệch của chương trình với ROOT là 10,4% (2,8585 so với 2,5562). Mặc dù độ lệch cao, nhưng ảnh hưởng của tham số này tới giá trị của hàm là rất nhỏ. Kết quả có sự tương đồng cao giữa chương trình với ROOT khi áp dụng vào các mô hình chập gauss cho thấy, chương trình hoàn toàn đáp ứng tốt bài toán tách đỉnh chập, vốn rất phổ biến khi phân tích phổ gamma. 5. K t luận Chương trình làm khớp có kết quả có độ tương đồng cao với ROOT. Cấu trúc của chương trình đơn giản, thuần túy chỉ sử dụng các thư viện có sẵn của C++, thuận tiện cho việc nhúng vào các chương trình con khác. Chương trình rất thích hợp để tích hợp vào các chương trình phân tích phổ tự thiết kế, qua đó giúp giảm chi phí mua phần mềm phân tích đắt tiền, với các tính năng ít hoặc không bao giờ được sử dụng. Ngoài ra, việc dễ dàng chỉnh sửa mã nguồn, giúp người dùng dễ dàng xây dựng các mô-đun chuyên biệt nhằm thực hiện các tác vụ theo yêu cầu cụ thể một cách thuận tiện và nhanh chóng. TẠP CHÍ KHOA HỌC - ĐẠI HỌC ĐỒNG NAI, SỐ 03 - 2016 ISSN 2354-1482 130 TÀI LIỆU THAM KHẢO 1. [Online]. Available: 2. [Online]. Available: 3. [Online]. Available: https://root.cern.ch/. 4. [Online]. Available: https://www.r-project.org/. 5. [Online]. Available: 6. [Online]. Available: 7. Gill, P. R.; Murray, W.; and Wright, M. H. "The Levenberg-Marquardt Method." §4.7.3 in Practical Optimization. London: Academic Press, pp. 136-137, 1981.. 8. [Online]. Available: 9. Rao, C. R.; Toutenburg, H.; et al. (2008). Linear Models: Least Squares and Alternatives. Springer Series in Statistics (3rd ed.). Berlin: Springer. ISBN 978- 3-540-74226-5 DEVELOPMENT OF SUBROUTINE FOR DATA FITTING WITH VARIOUS MODELS ABSTRACT Currently, there are many computer programs, which allow users to fit experimental data to any mathematical models. However, these programs either do not give users their source codes (commercial software) or have complicated libraries (open source software). Consequently, using their libraries to form homemade software becomes a difficult task, and even impossible, in case of commercial software. This work presents a group of sub-programs, written in C++, which permit users to fit experimental data to any mathematical models, including weighted fit and non-weighted fit. The sub-programs are packaged in one file with only 438 code lines; hence, make it easy to develop programs based on these sub- programs. The quality of these sub-programs was proved by comparing with ROOT. Keywords:Fitting C++ code, Levenberg–Marquardt algorithm
File đính kèm:
- phat_trien_chuong_trinh_con_lam_khop_du_lieu_voi_nhieu_mo_hi.pdf