Cải biên thuật toán bậc cao của Singh và ứng dụng trong dự báo chuỗi thời gian
Mô hình chuỗi thời gian mờ đang có nhiều ứng dụng trong công tác dự báo. Tuy nhiên kết quả dự
báo của các phương pháp đề xuất còn chưa cao. Do đó việc tìm tòi các mô hình có độ chính xác cao
hơn và thuật toán đơn giản hơn đang là một ưu tiên. Trong những năm gần đây một số công trình
đã được hoàn thành theo hướng nâng cao độ chính xác và giảm khối lượng tính toán trong mô hình
chuỗi thời gian mờ như các công trình của Chen và Hsu, Huarng, Singh,. Một cách tiếp cận khác
cho mô hình chuỗi thời gian mờ là sử dụng những kỹ thuật khác trong khai phá dữ liệu như phân
cụm, mạng nơ ron, để xây dựng mô hình. Ngoài ra còn có thể sử dụng các thuật toán bậc cao dự
báo. Singh [10] đã đề xuất một thuật toán như vậy.
Trong bài báo này, chúng tôi cải tiến thuật toán bậc cao của Singh cho mô hình chuỗi thời gian mờ.
Cải tiến này đã cho thấy hiệu quả được tăng lên rõ rệt thông qua các tính toán số cho chuỗi thời gian.
Tóm tắt nội dung tài liệu: Cải biên thuật toán bậc cao của Singh và ứng dụng trong dự báo chuỗi thời gian
Nguyễn Công Điều và cs Tạp chí KHOA HỌC & CÔNG NGHỆ 72(10): 59 - 65 Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên | 59 CẢI BIÊN THUẬT TOÁN BẬC CAO CỦA SINGH VÀ ỨNG DỤNG TRONG DỰ BÁO CHUỖI THỜI GIAN Nguyễn Công Điều1, Trần Thanh Thương2* 1Viện Công nghệ thông tin - VAST, 2Đại học Thái Nguyên TÓM TẮT Mô hình chuỗi thời gian mờ đang có nhiều ứng dụng trong công tác dự báo. Tuy nhiên kết quả dự báo của các phương pháp đề xuất còn chưa cao. Do đó việc tìm tòi các mô hình có độ chính xác cao hơn và thuật toán đơn giản hơn đang là một ưu tiên. Trong những năm gần đây một số công trình đã được hoàn thành theo hướng nâng cao độ chính xác và giảm khối lượng tính toán trong mô hình chuỗi thời gian mờ như các công trình của Chen và Hsu, Huarng, Singh,... Một cách tiếp cận khác cho mô hình chuỗi thời gian mờ là sử dụng những kỹ thuật khác trong khai phá dữ liệu như phân cụm, mạng nơ ron, để xây dựng mô hình. Ngoài ra còn có thể sử dụng các thuật toán bậc cao dự báo. Singh [10] đã đề xuất một thuật toán như vậy. Trong bài báo này, chúng tôi cải tiến thuật toán bậc cao của Singh cho mô hình chuỗi thời gian mờ. Cải tiến này đã cho thấy hiệu quả được tăng lên rõ rệt thông qua các tính toán số cho chuỗi thời gian. Từ khóa: Chuỗi thời gian mờ, biến ngôn ngữ, mối quan hệ mờ MỞ ĐẦU Chuỗi thời gian mờ và mô hình chuỗi thời gian mờ bậc nhất do Song và Chissom [4]-[6] phát triển từ năm 1993. Sau công trình này, một loạt các bài báo của nhiều tác giả khác nhau tiếp tục dựa trên ý tưởng này để dự báo chuỗi thời gian và ứng dụng trong nhiều lĩnh vực khác nhau như dự báo dân số, tài chính, nhiệt độ, nhu cầu điện, vv... Gần đây có rất nhiều tác giả liên tục cải tiến mô hình chuỗi thời gian mờ để dự báo đạt kết quả chính xác hơn. Chen [7] đã đưa ra phương pháp mới đơn giản và hữu hiệu hơn so với phương pháp của Song và Chissom bằng cách sử dụng các phép tính số học thay vì các phép tính hợp max- min phức tạp trong xử lý mối quan hệ mờ. Phương pháp của Chen cho hiệu quả cao hơn về mặt sai số dự báo và độ phức tạp của thuật toán. Nhiều công trình tiếp theo đã sử dụng cách tiếp cận này để dự báo cho chuỗi thời gian. Một trong các hướng được phát triển là sử dụng mối quan hệ mờ bậc cao trong mô hình chuỗi thời gian mờ. Singh [10] đã đưa ra một thuật toán mới khá đơn giản để dự báo số lượng sinh viên nhập học và sản lượng mùa màng trong nông nghiệp bằng cách sử dụng Tel: 0944550008; Email: thuong.cym@gmail.com sai phân các thông số như là mối quan hệ mờ để dự báo. Phát triển tiếp tục theo hướng sử dụng các thuật toán đơn giản để dự báo, trong [10] Singh đã sử dụng thuật toán này cho mô hình chuỗi thời gian mờ bậc cao. Trong bài báo này, chúng tôi cải tiến thuật toán bậc cao của Singh nhằm tăng mức độ chính xác của dự báo. MỘT SỐ KHÁI NIỆM Trong phần này, chúng ta sẽ sử dụng khái niệm và phương pháp dự báo của chuỗi thời gian mờ được Song và Chissom [4]-[6] phát triển và được Chen [7] cải tiến để xây dựng thuật toán dự báo cho chuỗi thời gian. Giả sử U là không gian nền: U = u1,u2,....,um. Tập A là mờ trên không gian nền U nếu A được xác định bởi hàm: A : U [0.1] A được gọi là hàm thuộc (Membership function). Còn với bất kỳ một phần tử u nào của A thì hàm A (u) được gọi là độ thuộc của u vào tập mờ A. Tập mờ A trên không gian nền U được viết như sau: Một số định nghĩa sau liên quan đến chuỗi thời gian mờ [5]. n nAAA u u u u u u A )( ... )()( 2 2 1 1 Nguyễn Công Điều và cs Tạp chí KHOA HỌC & CÔNG NGHỆ 72(10): 59 - 65 Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên | 60 Định nghĩa 1: Y(t) (t =...0,1,2,...) là một tập con của R1. Y(t) là tập nền trên đó xác định các tập mờ fi(t). F(t) là tập chứa các tập fi(t) (i = 1,2,...). Khi đó ta gọi F(t) là chuỗi thời gian mờ xác định trên tập nền Y(t). Định nghĩa 2: Tại các thời điểm t và t-1 có tồn tại một mối quan hệ mờ giữa F(t) và F(t-1) sao cho F(t) = F(t-1) * R(t-1, t) trong đó * là ký hiệu của một toán tử xác định trên tập mờ. R(t-1, t) là mối quan hệ mờ. Ta cũng có thể ký hiệu mối quan hệ mờ giữa F(t) và F(t-1) bằng F(t-1) F(t).Nếu đặt F(t-1) = Ai và F(t) = Aj thì ta ký hiệu mối quan hệ logic mờ giữa chúng như sau: Ai Aj. Định nghĩa 3: Giả sử F(t) suy ra từ F(t-1) và F(t) = F(t-1) * R(t-1, t) cho mọi t. Nếu R(t-1, t) không phụ thuộc vào t thì F(t) được gọi là chuỗi thời gian mờ dừng, còn ngược lại ta có chuỗi thời gian mờ không dừng. Định nghĩa 4: Giả sử F(t) suy đồng thời từ F(t-1), F(t-2),, F(t-m) m>0 và là chuỗi thời gian mờ dừng. Khi đó mối quan hệ mờ có thể viết được F(t-1), F(t-2),, F(t-m) F(t) và gọi đó là mô hình dự báo bậc m của chuỗi thời gian mờ. THUẬT TOÁN BẬC CAO CỦA SINGH Singh đã phát triển các phương thức tính toán để tìm ra một phương pháp tiếp cận tốt hơn nhằm khắc phục những nhược điểm của hiện tại của mô hình chuỗi thời gian mờ bậc cao. Sự đơn giản của phương pháp này nằm ở chỗ sử dụng sự sai phân để thay thế cho sự tính toán phức tạp trong quan hệ logic mờ. Phương pháp của Singh như sau: Bước 1: Xác định tập nền. Tập nền U được xác định như sau: lấy giá trị lớn nhất fmax và nhỏ nhất fmin của chuỗi thời gian và U =[fmin- f1, fmax+f2] trong đó f1,f2 là những giá trị dương nào đó. Bước 2: Chia đoạn U thành m khoảng con bằng nhau u1, u2,...um. Bước 3: Xây dựng các tập mờ Ai tương ứng với các khoảng con như trong trong bước 2 và sử dụng các hàm thuộc tam giác cho mỗi khoảng con của phép chia. Bước 4: Mờ hoá các giá trị của chuỗi thời gian và thiết lập mối quan hệ mờ theo quy tắc: nếu Ai là giá trị mờ hoá tại thời điểm t và Aj là giá trị mờ hoá tại thời điểm tiếp theo t+1 thì ta có mối quan hệ mờ Ai Aj như tại Định nghĩa 2. Ai là trạng thái hiện thời còn Aj là trạng thái tiếp theo. Bước 5: Tính toán và dự báo dựa trên các mối quan hệ mờ được thiết lập Thiết lập mối quan hệ mờ của các bậc khác nhau như đưa ra dưới đây: (i) Nếu cho thời điểm t - 2, t - 1 và t , giá trị chuỗi thời gian được mờ hóa tương ứng là Ai1, Ai và Aj, khi đó có mối quan hệ mờ bậc 2 như sau: Ai1, Ai → Aj. (ii) Nếu cho thời điểm t - 3, t - 2, t - 1 và t, giá trị chuỗi thời gian được mờ hóa tương ứng là Ai2, Ai1, Ai và Aj, khi đó có mối quan hệ mờ bậc 3 như sau: Ai2, Ai1, Ai → Aj. (iii) Tương tự như vậy nếu cho thời điểm t - 4, t - 3, t - 2, t - 1 và t, giá trị chuỗi thời gian được mờ hóa tương ứng là Ai3, Ai2, Ai1, Ai và Aj, khi đó có mối quan hệ mờ bậc 3 như sau: Ai3, Ai2, Ai1, Ai → Aj. Theo cách tương tự chúng ta có thể xác định được các cao hơn nhiều như: bậc năm, bậc sáu, bậc bảy, bậc tám và các mối quan hệ mờ tương ứng. Tính toán các tham số dn, n = 2, 3, 4,. . . của các bậc khác nhau: (i) khảo sát một toán tử khác d2 yi = |yi | và được định nghĩa là d 2 Ei = |Ei - Ei -1| d 3 Ei = |d 2 Ei - d 2 Ei -1| d 4 Ei = |d 3 Ei – d3Ei -1| d 5 Ei = |d 4 Ei – d4Ei -1| d 6 Ei = |d 5 Ei – d5Ei -1| d 7 Ei = |d 6 Ei – d6Ei -1| d n Ei= |d n-1 Ei – dn-1Ei -1| Do đó, d3 Ei= ||Ei - Ei -1| - |Ei -1 - Ei -2 || and d 4 Ei= |||Ei - Ei -1| -| Ei -1 - Ei -2 || - ||Ei -1 - Ei -2| - |Ei -2 - Ei -3 ||| and d 5 Ei = ||||Ei– Ei–1| – |Ei–1– Ei–2||– ||Ei–1– Ei–2 | – |Ei–2– Ei–3 ||| - |||Ei–1– Ei–2 | – |Ei–2– Ei–3 || – ||Ei–2– Ei–3| – |Ei–3– Ei–4 |||| và cứ tiếp tục như vậy. Nguyễn Công Điều và cs Tạp chí KHOA HỌC & CÔNG NGHỆ 72(10): 59 - 65 Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên | 61 (ii) Số bước w của dự báo mờ = int (số lượng khoảng / 2) thu được là: int (7/2) = 3. Tính toán và dự báo: Một số ký hiệu được sử dụng được định nghĩa như sau: [*Aj ] là khoảng tương ứng Uj mà hàm thuộc trong Aj đạt giá trị Supremum L[*Aj ] là giới hạn dưới của khoảng Uj U[*Aj ] là giới hạn trên của khoảng Uj l[*Aj ] là độ dài khoảng Uj trong đó hàm thuộc của Aj đạt Supremum M[*Aj ] là giá trị trung bình của khoảng Uj trong đó hàm thuộc của Aj đạt Supremum Đối với một mối quan hệ mờ Ai → Aj: Ai là giá trị mờ tại thời điểm t-1 Aj là giá trị mờ tại thời điểm t Ei là giá trị của chuỗi thời gian tại thời điểm t-1 Ei-1 là giá trị của chuỗi thời gian tại thời điểm t-2 Ei-2 là giá trị của chuỗi thời gian tại thời điểm t-3 Ei-3 là giá trị của chuỗi thời gian tại thời điểm t-4 Ei-4 là giá trị của chuỗi thời gian tại thời điểm t-5 Fj là giá trị dự báo của chuỗi thời gian tại thời điểm t Ở đây, sử dụng mô hình bậc 2 với các giá trị của chuỗi thời gian tại thời điểm t - 2, t - 1 cho khung quy tắc để thực hiện về mối quan hệ logic mờ, Ai → Aj, với Ai, trạng thái hiện hành, là mờ hóa số liệu tại thời điểm t - 1 và Aj, trạng thái kế tiếp, là mờ hóa số liệu tại thời điểm t. Thuật toán tính toán: Đối với dự báo chuỗi thời gian mờ của mô hình bậc hai, có thể dự báo từ năm thứ ba của dữ liệu chuỗi thời gian và do đó cần phải đặt n = 2 và t = 3. Đặt n = 2, t = 3 For t = 3 đến T (kết thúc dữ liệu chuỗi thời gian) Thu được mờ quan hệ từ thời điểm t – 1(Ai) đến t (Aj): Ai → Aj R = 0 và S = 0 Tính toán d n Ei= |d n-1 Ei- d n-1 Ei–1| Xi= Ei + d n Ei/2 XXi= Ei – d n Ei/2 Yi= Ei + d n Ei YYi= Ei - d n Ei Pi = Ei + d n Ei/4 PPi = Ei - d n Ei/4 Qi= Ei + 2*d n Ei QQi = Ei - 2*d n Ei Gi= Ei + d n Ei/6 GGi = Ei - d n Ei/6 Hi = Ei + 3*d n Ei HHi = Ei - 3*d n Ei If Xi ≥ L [* Aj] and Xi ≤ U [*Aj] Then R = R + Xi and S = S + 1 If XXi ≥ L [* Aj] and XXi ≤ U [* Aj] Then R = R + XXi and S = S + 1 If Yi ≥ L [* Aj] and Yi ≤ U [*Aj] Then R = R + Yi and S = S + 1 If YYi ≥ L [* Aj] and YYi ≤ U [* Aj] Then R = R + YYi and S = S + 1 If Pi ≥ L [* Aj] and Pi ≤ U [*Aj] Then R = R + Pi and S = S + 1 If PPi ≥ L [* Aj] and PPi ≤ U [* Aj] Then R = R + PPi and S = S + 1 If Qi ≥ L [*Aj] and Qi ≤ U [* Aj] Then R = R + Qi and S = S + 1 If QQi ≥ L [* Aj] and QQi ≤ U [* Aj] Then R = R + QQi and S = S + 1 If Gi ≥ L [*Aj] and Gi ≤ U [* Aj] Then R = R + Gi and S = S + 1 If GGi ≥ L [*Aj] and GGi ≤ U [*Aj] Then R = R + GGi and S = S + 1 If Hi ≥ L [*Aj] and Hi ≤ U [* Aj] Then R = R + Hi and S = S + 1 If HHi ≥ L [* Aj] and HHi ≤ U [* Aj] Then R = R + HHi and S = S + 1 Fj=(R + M(* Aj))=(S + 1) Next t Tương tự như vậy, thiết lập n = 3 và t = 4, ta có thể nhận được dự đoán bởi mô hình bậc ba và n = 4, t = 5 để có được dự đoán bởi mô hình bậc 4 và cứ tiếp tục như vậy. Như vậy Nguyễn Công Điều và cs Tạp chí KHOA HỌC & CÔNG NGHỆ 72(10): 59 - 65 Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên | 62 giá trị dự báo có thể thu được bằng các mô hình bậc cao khác nhau. Đề xuất cải biên cho thuật toán của Singh Chúng tôi đề xuất một cải biên đơn giản cho thuật toán bậc cao của Singh ở bước 2 của thuật toán. Chúng tôi thực hiện một thay đổi nhỏ trong bước 2 của thuật toán trên để phân bố các điểm rơi vào từng khoảng được đều hơn. Các bước còn lại được giữ nguyên như thuật toán của Singh. Cụ thể: sau khi chia U thành m đoạn con bằng nhau, có một vấn đề đặt ra là số liệu chuỗi thời gian sẽ phân bố không đều trong các khoảng đã chia. Có thể có những khoảng không có giá trị chuỗi thời gian đang xét rơi vào nhưng cũng có thể có những khoảng có rất nhiều giá trị sẽ quy tập tại đó. Như vậy dự báo sẽ có nhiều sai số do sự phân bố không đều này. Vì vậy sẽ nảy sinh ra vấn đề cần chia lại khoảng sao cho phân bố của chuỗi thời gian rơi vào các khoảng đã chia sẽ được đều hơn. Vấn đề này đã được quan tâm trong [6]. Nội dung chủ yếu của lập luận là tính toán phân bố của giá trị chuỗi thời gian trong từng khoảng con.Giả sử số lượng các giá trị chuỗi thời gian là p điểm. Số lượng khoảng cần chia là m. Khi đó trung bình mỗi khoảng chứa n=p/m giá trị chuỗi thời gian. Nếu khoảng nào có số lượng giá trị chuỗi thời gian rơi vào nhỏ hơn hoặc bằng n thì không chia nhỏ ra, còn số lượng điểm rơi vào khoảng này lớn hơn n bao nhiêu lần thì sẽ chia nhỏ khoảng đó ra làm từng đó lần. Kết quả, sau bước này việc chia khoảng sẽ không thành các khoảng đều nhau nữa nhưng giá trị chuỗi thời gian lại được phân bố đồng đều hơn trong từng khoảng con. ỨNG DỤNG TRONG DỰ BÁO CHỈ SỐ CHỨNG KHOÁN ĐÀI LOAN Xét bài toán dự báo cho chuỗi dữ liệu chỉ số thị trường chứng khoán Đài Loan TAIFEX [2,3]. Cụ thể như sau: Áp dụng thuật toán cải biên cho số liệu này như sau: Bước 1. Xây dựng tập nền U. Xác định giá trị lớn nhất và nhỏ nhất của chuỗi thời gian trên là 6200 và 7560 điểm. Do vậy tập nền U được xác định là giá trị trong khoảng [6200,7600]. Bước 2. Chia khoảng. Ta sẽ chia U thành 14 khoảng u1, u2, ..., u14 với độ rộng là 100, như vậy các khoảng sẽ là: u1 = [6200,6300], u2 = [6300,6400], , u14 = [7500,7600]. Chia lại khoảng Tính phân bố của các giá trị chuỗi thời gian rơi vào các khoảng đã chia. Điều này thực hiện để biết các khoảng nào có nhiều giá trị rơi vào để có thể phân khoảng tiếp làm tăng độ chính xác khi dự báo. Bảng sau đây sẽ cho thấy sự phân bố các giá trị của chuỗi thời gian rơi vào từng khoảng: Bảng 2. Phân bố giá trị trong từng khoảng Khoảng Số lượng Khoảng Số lượng 6200-6300 1 6900-7000 5 6300-6400 0 7000-7100 1 6400-6500 3 7100-7200 0 6500-6600 1 7200-7300 6 6600-6700 2 7300-7400 5 6700-6800 9 7400-7500 2 6800-6900 9 7500-7600 3 Xem xét bảng trên thấy sự phân bố các giá trị tại các khoảng khác nhau là không đều nhau. Có 47 giá trị trong 14 khoảng nên số lượng trung bình rơi vào mỗi khoảng là hơn 3. Vì vậy những khoảng nào có 5, 6 giá trị rơi vào ta chia tiếp làm 2 khoảng con, còn những đoạn nào có 8, 9 giá trị rơi vào ta tiếp tục chia thành 3 khoảng để sao cho mỗi khoảng con đó có xấp xỉ 3 giá trị rơi vào. Kết quả sẽ hình thành 21 khoảng sau: Bảng 3. Phân khoảng u1=[6200-6300] u8=[6766-6800] u15=[7100-7200] u2=[6300-6400] u9=[6800-6833] u16=[7200-7250] u3=[6400-6500] u10=[6833-6866] u17=[7250-7300] u4=[6500-6600] u11=[6866-6900] u18=[7300-7350] Nguyễn Công Điều và cs Tạp chí KHOA HỌC & CÔNG NGHỆ 72(10): 59 - 65 Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên | 63 u5=[6600-6700] u12=[6900-6950] u19=[7350-7400] u6=[6700-6733] u13=[6950-7000] u20=[7400-7500] u7=[6733-6766] u14=[7000-7100] u21=[7500-7600] Bảng 1. Giá trị chỉ số chứng khoán Đài Loan Năm Giá trị thực Năm Giá trị thực Năm Giá trị thực 3/8/1998 7552 24/08/1998 6955 11/9/1998 6726.5 4/8/1998 7560 25/08/1998 6949 14/09/1998 6774.55 5/8/1998 7487 26/08/1998 6790 15/09/1998 6762 6/8/1998 7462 27/08/1998 6835 16/09/1998 6952.75 7/8/1998 7515 28/08/1998 6695 17/09/1998 6906 10/8/1998 7365 29/08/1998 6728 18/09/1998 6842 11/8/1998 7360 31/08/1998 6566 19/08/1998 7039 12/8/1998 7330 1/9/1998 6409 21/09/1998 6861 13/08/1998 7291 2/9/1998 6430 22/09/1998 6926 14/08/1998 7320 3/9/1998 6200 23/09/1998 6852 15/08/1998 7300 4/9/1998 6403.2 24/09/1998 6890 17/08/1998 7219 5/9/1998 6697.5 25/09/1998 6871 18/08/1998 7220 7/9/1998 6722.3 28/09/1998 6840 19/08/1998 7283 8/9/1998 6859.4 29/09/1998 6806 20/08/1998 7274 9/9/1998 6769.6 30/09/1998 6787 21/08/1998 7225 10/9/1998 6709.75 Bước 3. Xây dựng các hàm mờ trên khoảng đã chia: Trong bước này ta xác định lại các tập mờ Ai tương ứng với từng khoảng và có thể gán lại các giá trị ngôn ngữ cho từng tập mờ này. Các tập mờ Ai i=1,2,...,21 được định nghĩa thông qua các hàm thuộc để đơn giản có dạng hình nón nhận 3 giá trị 0, 0.5 và 1 được viết như sau: A1 = 1/u1 + 0.5/u2 + 0/u3 +....+ 0/u20 + 0/u21 A2 = 0.5/u1 + 1/u2 + 0.5/u3 +...+ 0/u20 + 0/u21 A3 = 0/u1 + 0.5/u2 + 1/u3 + 0.5/u4 +...+ 0/u20 + 0/u21 ... A19 = 0/u1 + 0./u2 +... + 0.5/u18 + 1/u19 + 0.5/u20 + 0/u21 A20 = 0/u1 + 0./u2 + ...+ 0.5/u19 + 1/u20 + 0.5/u21 A21 = 0/u1 + 0/u2 + ...+ 0/u19 + 0.5/u20 + 1/u21 Bước 4. Mờ hoá các giá trị của chuỗi thời gian và thiết lập mối quan hệ mờ: Kết quả mờ hóa các giá trị của chuỗi thời gian thể hiện trong Bảng 4. Theo định nghĩa phần trên ta lập chuỗi thời gian mờ tương ứng với các tập mờ ở trên và xác định mối quan hệ mờ tại thời điểm t =1,2,...,47. Có thể thấy ngay được các mối quan hệ đầu tiên như sau: A21 A21 , A21 A20 , A20 A21 ,..., A9 A8. Bước 5. Tính toán và dự báo dựa trên các mối quan hệ mờ được thiết lập: Bảng 4. Mối quan hệ mờ Năm Giá trị thực Quan hệ mờ Năm Giá trị thực Quan hệ mờ 3/8/1998 7552 A22 2/9/1998 6430 A4 Nguyễn Công Điều và cs Tạp chí KHOA HỌC & CÔNG NGHỆ 72(10): 59 - 65 Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên | 64 4/8/1998 7560 A22 3/9/1998 6200 A1 5/8/1998 7487 A21 4/9/1998 6403.2 A4 6/8/1998 7462 A21 5/9/1998 6697.5 A6 7/8/1998 7515 A22 7/9/1998 6722.3 A7 10/8/1998 7365 A20 8/9/1998 6859.4 A11 11/8/1998 7360 A20 9/9/1998 6769.6 A9 12/8/1998 7330 A19 10/9/1998 6709.75 A7 13/08/1998 7291 A18 11/9/1998 6726.5 A7 14/08/1998 7320 A19 14/09/1998 6774.55 A9 15/08/1998 7300 A19 15/09/1998 6762 A8 17/08/1998 7219 A17 16/09/1998 6952.75 A14 18/08/1998 7220 A17 17/09/1998 6906 A13 19/08/1998 7283 A18 18/09/1998 6842 A11 20/08/1998 7274 A18 19/08/1998 7039 A15 21/08/1998 7225 A17 21/09/1998 6861 A11 24/08/1998 6955 A14 22/09/1998 6926 A13 25/08/1998 6949 A13 23/09/1998 6852 A11 26/08/1998 6790 A9 24/09/1998 6890 A12 27/08/1998 6835 A11 25/09/1998 6871 A12 28/08/1998 6695 A6 28/09/1998 6840 A11 29/08/1998 6728 A7 29/09/1998 6806 A10 31/08/1998 6566 A5 30/09/1998 6787 A9 1/9/1998 6409 A4 Trong bước này, chỉ ứng dụng tính toán với mô hình bậc 2 (nghĩa là n=2 và t=3). Kết quả tính toán và dự báo theo thuật toán biểu diễn ở Bảng 5. Sai số trung bình bình phương MSE được tính theo công thức: Ta có thể thấy rằng kết quả dự báo với thuật toán Singh là rất tốt, nhất là khi so sánh với các kết quả của Chen hay của Huarng. Kết quả khi sử dụng thuật toán cải biên còn tốt hơn nhiều, sai số MSE của phương pháp chỉ bằng 1/2 sai số theo phương pháp ban đầu Singh đưa ra. Trong đồ thị ở Hình 1, ta có thể nhận thấy giá trị dự báo gần như trùng khớp hoàn toàn với giá trị thực. KẾT LUẬN Bài báo này đưa ra một cải biên cho thuật toán bậc cao của Singh. Tuy chỉ là một cải biên nhỏ nhưng hiệu quả đạt được là khá tốt. Điều này thể hiện thông qua sai số trung bình bình phương (MSE) của phương pháp chỉ bằng ½ sai số theo phương pháp nguyên thuỷ của Singh. So sánh với kết quả của Huarng và các phương pháp khác có thể xem trong [1]-[3]. Đường dự báo của chúng tôi đưa ra bám khá sát với giá trị thực tế nên có thể sử dụng phương pháp cải tiến này cho dự báo cho một số chuỗi thời gian trong thực tiễn. TÀI LIỆU THAM KHẢO [1]. Nguyễn Công Điều (2008), Một thuật toán mới cho mô hình chuỗi thời gian mờ heuristic trong dự báo chứng khoán, Báo cáo tại Đại hội Toán học toàn tại Quy Nhơn. Bài gửi đăng tại Tạp chí Toán học ứng dụng. [2]. Nguyễn Công Điều (2009), “Cải biên cho một thuật toán đơn giản trong mô hình chuỗi thời gian mờ”, Báo cáo khoa học tại Viện Công nghệ thông tin. [3]. Q. Song, B.S. Chissom (1993), “Fuzzy Time Series and its Model”, Fuzzy set and system, vol. 54, pp. 269-277. [4]. Q.Song, B.S. Chissom (1993), “Forecasting Enrollments with Fuzzy Time Series – Part I,” Fuzzy set and system, vol. 54, pp. 1-9. [5]. Q.Song, B.S. Chissom (1994), “Forecasting Enrollments with Fuzzy Time Series – Part II,” Fuzzy set and system, vol. 62, pp. 1-8. 416 n )g(f MSE n 1i 2 ii Nguyễn Công Điều và cs Tạp chí KHOA HỌC & CÔNG NGHỆ 72(10): 59 - 65 Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên | 65 [6]S.M.Chen (1996), “Forecasting Enrollments based on Fuzzy Time Series,” Fuzzy set and system, vol. 81, pp. 311-319. [7]S.M.Chen (2002), “Forecasting Enrollments based on hight-order Fuzzy Time Series”, Inter. Jurnal: Cybernetic and Systems, N.33, pp. 1-16. [9]. S.R. Singh (2007), “A simple method of forecasting based on fuzzy time series”, Applied Mathematics and Computation, 186, pp. 330-339. [10]. S.R. Singh (2009), “A computational method of forecasting based on high-order fuzzy time series”, Expert Systems with Applications, 36 pp.10551–10559. Bảng 5. Kết quả khi sử dụng thuật toán cải biên Algorithms/ MSE Heuristic cải tiến Chen Huarng Singh Singh cải tiến MSE 1700 9737 5437 884 416 Hình 1. Đồ thị so sánh kết quả dự báo bằng thuật toán Singh cải biên với giá trị thực và giá trị dự báo bằng thuật toán nguyên thuỷ của Singh SUMMARY MODIFICATION OF SINGH'S HIGH ORDER ALGORITHM AND ITS APPLICATION IN FORECASTING TIME SERIES Nguyen Cong Dieu 1 , Tran Thanh Thuong 21 1Institute of Information Technology - VAST,2Thai Nguyen University Fuzzy time series models have many applications in forecastings. However, the predictive results of the proposed method were not very accurate. Thus the search for the more accurate models and simpler algorithm is in a priority. In recent years, a number of works have been completed under the direction of improving the accuracy and reducing the amount calculated in fuzzy time series models such as the works of Chen and Hsu, Huarng, Singh, ... A different approach for fuzzy time series model is to use these techniques in data mining such as clustering, Neural networking, ... to build the models. There is also possible to use high-order prediction algorithm. Singh [10] has proposed such an algorithm. In this paper, we modified the algorithm of Singh for high order fuzzy time series model. The modification method has showed a very good efficiency. Key words: Fuzzy time series, Linguistic variables, Fuzzy logical relations Nguyễn Công Điều và cs Tạp chí KHOA HỌC & CÔNG NGHỆ 72(10): 59 - 65 Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên | 66
File đính kèm:
- cai_bien_thuat_toan_bac_cao_cua_singh_va_ung_dung_trong_du_b.pdf