Ứng dụng giải thuật di truyền (GA) để tối ưu tham số hệ mờ trong phân lớp tín hiệu điện tim
Bài báo trình bày các bước xây dựng một mô hình phân lớp điện tim sử dụng hệ mờ không đơn trị
(NSFLS). Đầu tiên, các tín hiệu điện tim được cho qua một khối tiền xử lý để loại nhiễu do môi trường
ghi điện tâm đồ gây ra. Tín hiệu sau khi xử lý nhiễu sẽ được phân tích và trích rút các đặc trưng thích
hợp. Các đặc trưng này là đầu vào của một hệ phân lớp mờ không đơn trị. Sau khi xác định cấu trúc
của mô hình phân lớp, xây dựng các tham số của mô hình qua một quá trình học dựa vào tập dữ liệu
huấn luyện. Cuối cùng, nhóm tác giả sử dụng giải thuật di truyền để tối ưu tham số hệ mờ nhằm thu
được kết quả phân lớp tín hiệu điện tim tốt nhất.
Bạn đang xem tài liệu "Ứng dụng giải thuật di truyền (GA) để tối ưu tham số hệ mờ trong phân lớp tín hiệu điện tim", để tải tài liệu gốc về máy hãy click vào nút Download ở trên
Tóm tắt nội dung tài liệu: Ứng dụng giải thuật di truyền (GA) để tối ưu tham số hệ mờ trong phân lớp tín hiệu điện tim
LIÊN NGÀNH ĐIỆN - ĐIỆN TỬ - TỰ ĐỘNG HÓA Tạp chí Nghiên cứu khoa học - Đại học Sao Đỏ, ISSN 1859-4190 Số 4(59).2017 5 ỨNG DỤNG GIẢI THUẬT DI TRUYỀN (GA) ĐỂ TỐI ƯU THAM SỐ HỆ MỜ TRONG PHÂN LỚP TÍN HIỆU ĐIỆN TIM APPLICATION OF GA FOR OPTIMISING PARAMETERS OF FUZZY SYSTEMS IN ECG CLASSIFICATION Hoàng Thị Ngọc Diệp, Trần Duy Khánh, Hoàng Thị An Email: hoangdiepdtth@gmail.com Trường Đại Học Sao Đỏ Ngày nhận bài: 16/2/2017 Ngày nhận bài sửa sau phản biện: 6/11/2017 Ngày chấp nhận đăng: 28/12/2017 Tóm tắt Bài báo trình bày các bước xây dựng một mô hình phân lớp điện tim sử dụng hệ mờ không đơn trị (NSFLS). Đầu tiên, các tín hiệu điện tim được cho qua một khối tiền xử lý để loại nhiễu do môi trường ghi điện tâm đồ gây ra. Tín hiệu sau khi xử lý nhiễu sẽ được phân tích và trích rút các đặc trưng thích hợp. Các đặc trưng này là đầu vào của một hệ phân lớp mờ không đơn trị. Sau khi xác định cấu trúc của mô hình phân lớp, xây dựng các tham số của mô hình qua một quá trình học dựa vào tập dữ liệu huấn luyện. Cuối cùng, nhóm tác giả sử dụng giải thuật di truyền để tối ưu tham số hệ mờ nhằm thu được kết quả phân lớp tín hiệu điện tim tốt nhất. Từ khóa: Hệ mờ không đơn trị (NSFLS); giải thuật di truyền (GA); phân loại mẫu; phân lớp tín hiệu điện tim (ECG). Abstract The paper presents a method to construct a non-singleton fuzzy logic system (NSFLS) for ECG arrhythmic classification. The classifier is applied to distinguish normal sinus rhythm (NSR), ventricular fibrillation (VF) and ventricular tachycardia (VT). Two features of ECG signal, the average period and the pulse width, are inputs to the fuzzy classifier. The rule base used in the fuzzy system is constructed from training data. The generalized bell membership function is used to examine the performance of the classifier with different shapes of membership function. The results of experiments with data from the MIT-BIH Malignant Ventricular Arrhythmia Database show the viability of a non-singleton fuzzy system in ECG classification. Then, GA Optimisation of Non-Singleton Fuzzy Logic System for ECG Classification to obtain the best results. Keywords: Non-singleton fuzzy logic system (NSFLS); genetic algorithm (GA); pattern classification; electrocardiogram (ECG). 1. GIỚI THIỆU Trong thực tế có rất nhiều bài toán cần phân loại mẫu như bài toán phân loại ảnh khuôn mặt, phân loại văn bản, phát hiện lỗi trong các phân tích máy móc và y tế, phân loại chữ viết Có rất nhiều vấn đề con người xử lý khá đơn giản. Trái lại, trong nhiều trường hợp, phương án sử dụng máy tính đã chỉ ra mức độ khó của vấn đề. Tuy gặp nhiều khó khăn nhưng việc sử dụng máy tính trong các bài toán nhận dạng mẫu ngày càng trở nên phổ biến. Mục đích chính của việc phân loại mẫu là tự động trợ giúp con người khi phân tích khối lượng dữ liệu cực lớn và từ đó trích chọn ra những tri thức hữu ích. Mặc dù có nhiều phương thức khi phân loại nhưng chúng đều có chung cấu trúc nền tảng và các bước khi thiết kế. Theo [8] các thành phần của một bộ phân loại và trình tự thiết kế bộ phân loại được chỉ ra trên hình 1. Bước trích chọn đặc trưng biến đổi dữ liệu đầu vào (trong không gian quan sát) thành các vectơ đặc trưng (trong không gian đặc trưng). Không gian đặc trưng có số chiều ít hơn nhiều so với không gian quan sát. Bước tiếp theo là biến đổi từ không gian đặc trưng sang không gian quyết định được định nghĩa bởi tập các lớp (xác định). Một bộ phân loại hay một thuật toán sẽ sinh ra một phân hoạch của không gian đặc trưng bởi các miền quyết định. Sau khi thiết kế bộ phân loại với 6NGHIÊN CỨU KHOA HỌC Tạp chí Nghiên cứu khoa học - Đại học Sao Đỏ, ISSN 1859-4190 Số 4(59).2017 hiệu năng mong muốn, ta có thể sử dụng nó để phân loại các đối tượng mới. Điều này có nghĩa là bộ phân loại sẽ gán từng vectơ đặc trưng trong không gian đặc trưng với một lớp trong không gian quyết định. Trong bài toán phân loại mẫu, trích chọn đặc trưng là nhiệm vụ khó khăn nhất, quyết định đến độ chính xác của thuật toán. Khi trích chọn đặc trưng cần lựa chọn những đặc trưng hữu ích để tìm ra thuật toán học hiệu quả cho bài toán phân Đã có nhiều nghiên cứu để phân lớp tín hiệu điện tim. Theo [3] với mô hình mờ sử dụng logic mờ loại 2 khoảng đơn trị thì khả năng làm việc với nhiễu hiệu quả chưa cao. Theo [9] sử dụng hệ mờ loại hai khoảng và thuật toán VF - Filter Leakage thì khả năng phân lớp chưa tối ưu hóa hàm thuộc và cơ sở luật. Do đó, hệ mờ không đơn trị được chọn vì nó thích hợp hơn hệ mờ đơn trị khi làm việc với nhiễu. Giải thuật di truyền được dùng để tối ưu hóa đồng thời hàm thuộc và cơ sở luật. Bài báo này trình bày khả năng của hệ mờ không đơn trị và giải thuật di truyền để xử lý nhiễu trong các bài toán phân loại mẫu. Hiệu năng của các hệ thống đơn trị và không đơn trị được so sánh với nhau trong bài toán phân lớp điện tim. Các kết quả chỉ ra rằng giải thuật di truyền tốt hơn hệ mờ loại mẫu và tiết kiệm chi phí tính toán. Nếu những đặc trưng thừa hay không thích hợp ảnh hưởng đến hiệu năng cũng như chất lượng phân loại mẫu, thậm chí có thể dẫn tới việc phân loại sai. Do có nhiều cách lựa chọn thuật toán nên độ khó khi trích chọn đặc trưng cũng rất đa dạng. Hơn nữa, trong các ứng dụng ta luôn phải đối mặt với nhiễu. Nguyên nhân của chúng là do nhiễu điện trong các thiết bị trích chọn hoặc thao tác các thiết bị không đúng. a) b) Hình 1. a) Các thành phần của bộ phân loại; b) Trình tự thiết kế bộ phân loại sử dụng GA đơn trị khi có nhiễu trong các đặc trưng được trích chọn. Điều này rất hữu ích khi không thể tránh khỏi sự nhập nhằng trong dữ liệu đầu vào [8]. 2. GIẢI THUẬT DI TRUYỀN ÁP DỤNG VÀO BÀI TOÁN ECG 2.1. Bài toán ECG Bài toán phân lớp điện tim được mô tả theo sơ đồ như hình 2, trong đó: - Đầu vào gồm hai đặc trưng: độ rộng xung (PW), chu kỳ xung (T). - Đầu ra loại nhịp tim (phân làm ba lớp): NRS (nhịp tim bình thường), VF (chứng rung tâm thất) và VT (chứng tim đập nhanh). Dữ liệu vào Cảm biến Tiền xử lý Trích chọn đặc t Phân lớp Quyết định a) Thu thập dữ Lựa chọn đặc Lựa chọn lớp Huấn luyện phân Đánh giá hiệu ấ Kết thúc b) Thu nhập dữ liệu Lựa chọn đặc trưng Đánh giá hiệu suất Huấn luyện phân loại Kết thúcQuyết định P lớp Tiề lý Cả i n liệu vào Lựa chọ lớp Trích c ọn đặc trưng LIÊN NGÀNH ĐIỆN - ĐIỆN TỬ - TỰ ĐỘNG HÓA Tạp chí Nghiên cứu khoa học - Đại học Sao Đỏ, ISSN 1859-4190 Số 4(59).2017 7 Tín hiệu điện tim đầu vào Loạn nhịp tim Phân lớp tín hiệu Xử lý và trích rút đặc trưng của tín hiệu Hình 2. Sơ đồ bài toán ECG 2.2. Giải thuật di truyền Giải thuật di truyền sử dụng các mã hóa nhị phân, mỗi cá thể là một chuỗi bit, thông qua các toán tử di truyền: chọn lọc, lai ghép, đột biến, tái tạo. procedure Genetic_Algorithm; begin t ← 0; Khởi tạo thế hệ ban đầu P(t); Đánh giá P(t) (theo hàm thích nghi); repeat t ← t + 1; Sinh ra thế hệ mới P(t) từ P(t-1) bởi • Chọn lọc • Lai ghép • Đột biến Đánh giá P(t); until Điều kiện kết thúc được thỏa mãn; end; 2.3. Giải thuật di truyền ứng dụng vào bài toán ECG Khi thiết kế một hệ mờ giải quyết bài toán ECG dùng giải thuật di truyền, đầu tiên là xem xét chiến lược trình bày và cách thức mã hóa hệ mờ vào nhiễm sắc thể. Trong thiết kế giải thuật di truyền ở bài báo này có hai đầu vào và mỗi đầu vào gồm hai biến x1 và x2 (có thể là độ rộng xung và chu kỳ hoăc độ rộng xung và biên độ) được phân chia thành ba hàm, do đó, có 12 tham số (vì 2 tham số x 2 đầu vào x 3 chức năng thành viên = 12 tham số). Giả sử không mất tính tổng quát và độ lệch tiêu chuẩn của hàm tham gia là i l xm và i l xσ , với i = 1, 2 và l = 1, 2, 3. Ngoài ra có 9 luật (3x3) trong các quy tắc cơ sở, thêm kết quả phụ 9 tham số, rn trong đó n = 1, 2, , 9. Do vậy, tổng cộng 21 tham số (3 chức năng thành viên × 2 tham số × 2 biến đầu vào + 9 quy tắc) cần thiết để giải thuật di truyền điều chỉnh. + Mỗi tham số luật được mã hóa thành chuỗi nhị phân 2-bit. + Mỗi tham số của hàm được mã hóa thành chuỗi nhị phân 8-bit. Do đó, chiều dài của chuỗi nhị phân là 114 bit (12x8+2x9=114 bit). Minh họa cấu trúc của nhiễm sắc thể (hình 3). Hình 3. Cấu trúc của nhiễm sắc thể Trong quá trình thẩm định thích hợp các tham số phải được giải mã (kiểu hình đại diện). + Tham số luật giải mã thành dãy số nguyên 0-4. + Tham số hàm giải mã thành số thực bằng cách sử dụng phương trình lập bản đồ tuyến tính như dưới đây [3]: 12 )( minmaxmin − ×−+= N q qqqp A GGGg (1) trong đó: p và q: chuỗi gen tương ứng; gp biểu thị giá trị thực tế của các tham số qth; Aq biểu diễn các số nguyên đại diện là chuỗi gen N-bit; maxqG và min qG biểu thị cho người dùng xác định giới hạn trên và dưới của gen tương ứng. 3. CẤU TRÚC CỦA MÔ HÌNH PHÂN LỚP MỜ SỬ DỤNG GA ĐỂ TỐI ƯU THAM SỐ Về cơ bản, kiến trúc chung của mô hình GA giống với mô hình phân lớp loại hai khoảng. Tuy nhiên trong cấu trúc có thêm khối tiền xử lý và giảm bớt khối giảm loại và khử mờ. Hình 4. Cấu trúc của một hệ phân loại mờ sử dụng GA 8NGHIÊN CỨU KHOA HỌC Tạp chí Nghiên cứu khoa học - Đại học Sao Đỏ, ISSN 1859-4190 Số 4(59).2017 3.1. Khái niệm hệ mờ không đơn trị Kaufman và Gupta [7] định nghĩa phép mờ hóa không đơn trị: Một bộ mờ hóa không đơn trị có dạng ( ) 1( 1,..., )iX ix i pµ ′ = = và )( iX xiµ giảm dần từ 1 khi ix xa dần ix′ . 3.2. Khối tiền xử lý Xét một bộ phân loại, giả sử có thể có một số loại nhiễu. Đầu tiên, các đầu vào của bộ phân loại có thể bị hỏng. Các tín hiệu điện tim ghi được (đặc biệt là tín hiệu điện tim đo trên bề mặt) rất nhạy cảm với việc di chuyển cáp điện và các hoạt động của cơ. Ngoài ra, nhiễu từ mạng điện có thể sai lệch quá trình ghi nhận tín hiệu... Do đó, tín hiệu cần được tiền xử lý để có thể thu được thông tin từ tín hiệu chính xác hơn. Việc trích rút hai đặc trưng độ rộng xung, chu kỳ xung của tín hiệu được thực hiện qua hai bước. Tín hiệu điện tim sau khi lọc được biến đổi thành một chuỗi nhị phân để làm tăng khả năng trích chọn đặc trưng. Thuật toán biến đổi sử dụng trong bài báo được cải tiến (nội dung của bước 2) từ thuật toán trong [8]. Bài báo sử dụng thuật toán biến đổi hai bước thay vì thuật toán biến đổi một bước của Zhang. Tín hiệu điện tim sẽ được biến đổi từng phần thành chuỗi nhị phân thay vì biến đổi toàn bộ. Điều này có thể làm giảm việc phát hiện sai các đỉnh tích cực bằng cách khử đi tín hiệu có biên độ nhỏ. Sau bước này là bước biến đổi hoàn toàn chuỗi nhị phân nhằm xác định ngưỡng để cực đại hóa sự khác biệt giữa lớp NSR và lớp VF/VT. Sau đó, ta sẽ tính toán độ rộng xung, chu kỳ xung trung bình của tín hiệu dựa vào chuỗi nhị phân trên. VFDB - cơ sở liêu chứng loạn nhịp thất ác tính của MIT-BIH. CSDL điện tim MIT-BIH [10] với tập dữ liệu trích từ cơ sở dữ liệu điện tim từ dự án hợp tác giữa Học viện Kỹ thuật Massachusetts và Bệnh viện Beth Israel (MIT-BIH). Đây là một cơ sở dữ liệu điện tim phong phú đầy đủ, đã được sử dụng rộng rãi trong nghiên cứu và học tập trên thế giới. Các bước được trình bày như sau: Thuật toán: Bước 1: Chuyển mẫu tín hiệu (4s tín hiệu) ban đầu thành chuỗi nhị phân Với dữ liệu của VFDB, chọn 4s dữ liệu. Tại tần số 250 Hz các tín hiệu rời rạc nên có tất cả 1000 điểm dữ liệu trong cửa sổ dài 4s à ta có n = 1000 mẫu có các giá trị Xi với i = 1, 2,.., 1000. Lấy x[m] là trung bình cộng các phần tử của mảng {Xi}. Tạo một mảng X’ bằng cách lấy giá trị của mỗi phần từ trừ đi Xm: X’i = {xi – xm} Làm các công việc sau trên mảng X’: - Tính giá trị âm nhỏ nhất Vn và giá trị dương lớn nhất Vp. - Tạo một phần chuỗi nhị phân: Nếu các phần tử có giá trị trong khoảng (0<xi<0.2 Vp) hoặc (0.2 Vn<xi<0) thì x’(i) = 0. - Tính tham số Np và Nn. Np là ký hiệu số lượng dữ liệu xi>0 và Nn=n–Np. - Chuyển một phần chuỗi nhị phân thành toàn bộ chuỗi nhị phân bằng cách xác định ngưỡng Tr. Đây là bước quan trọng để tách biệt giữa các tín hiệu NSR, VF và VT. Nếu Np < 0.15n thì Tr = 0.7*Vp Nếu Np >= 0.15n thì Tr = 0 - Chuyển một phần chuỗi nhị phân thành chuỗi nhị phân hoàn toàn bằng cách so sánh x[i] với Tr: Nếu x[i] <= Tr thì x[i] = 0 Nếu x[i] > Tr thì x[i] = 1 Sau bước này ta có chuỗi nhị phân tương ứng với mẫu tín hiệu: dãy số 1 liên tiếp trong chuỗi nhị phân biểu diễn xung QRS của tín hiệu ban đầu. Bước 2: Tính Pw và T từ chuỗi nhị phân: Bước này sẽ tính độ rộng xung và chu kỳ xung trung bình trong khoảng 4s tín hiệu. Độ rộng xung của mẫu 4s tín hiệu được tính bằng trung bình độ rộng của tất cả các xung trong khoảng tín hiệu. Độ rộng của một xung trong mẫu tín hiệu là độ dài chuỗi số 1 liên tiếp trong chuỗi nhị phân tương ứng. 1 ( ) N iW PW ms N = ∑ (2) 1 1 ( ) 1 N iT T ms N − = − ∑ trong đó: Wi: độ rộng xung thứ i; Ti: khoảng cách giữa xung thứ (i) và xung thứ (i+1); N: tổng số xung trong đoạn tín hiệu. LIÊN NGÀNH ĐIỆN - ĐIỆN TỬ - TỰ ĐỘNG HÓA Tạp chí Nghiên cứu khoa học - Đại học Sao Đỏ, ISSN 1859-4190 Số 4(59).2017 9 Như vậy, sau bước này với mỗi tín hiệu ta sẽ thu được 2 giá trị độ rộng xung (PW) và chu kỳ xung (T). Giá trị của hai đặc trưng này sẽ là đầu vào cho mô hình phân lớp dựa trên luật mờ ở bước sau. (a) (b) (c) Hình 5. Ba dạng tín hiệu điện tim khác nhau với chuỗi nhị phân tương ứng Theo Teck Wee Chua và Woei Wan Tan [8], trong hình 5 có hai tham số được trích chọn từ chuỗi nhị phân này: độ rộng xung, chu kì xung. Tất cả các tham số được tính trung bình trong cửa sổ 4s và độ lệch chuẩn của chúng được tính tương ứng. 3.3. Khối mờ hóa Mặc dù, bộ mờ hóa đơn trị đơn giản và phổ biến hơn bộ mờ hóa không đơn trị. Nhưng khi lựa chọn phương pháp mờ hóa người ta lại lựa chọn bộ mờ hóa không đơn trị vì bộ mờ hóa không đơn trị có thể làm việc tốt hơn trong môi trường nhiễu và nó có thể mô hình hóa sự không chắc chắn, không chính xác của các đầu vào [4, 5]. Các tín hiệu điện tim ECG thường bị ngắt quãng khi ghi nên các điểm kề đó có thể cũng là các giá trị đúng nhưng với độ thuộc bé hơn. Do đó, theo Mouzouris và Mendel [2], bộ mờ hóa không đơn trị coi đầu vào x là đại diện tốt nhất từ tất cả các giá trị xung quanh nó. Tuy nhiên, ta có thể dễ dàng chuyển đổi bộ phân loại không đơn trị thành đơn trị và ngược lại bằng cách thay thế khối mờ hóa tương ứng (hình chữ nhật đậm trong hình 4). Sự khác biệt duy nhất giữa hệ logic mờ đơn trị và không đơn trị là số lượng các mức đốt cháy. Hiệu quả của “bộ tiền lọc” của FLS không đơn trị là chìa khóa để làm việc với sự không chắc chắn trong đầu vào [1]. Hiệu quả này là kết quả của phép hợp thành super-star trong phép mờ hóa của NSFLS framwork với việc biến x thành xlmax. Vì vậy, theo [8] xét một tập mờ với hàm thuộc Gauss −−= 2 2 1exp)( σ µ iiX xxx (3) trong đó: phương sai 2σ thể hiện độ rộng của ( )X ixµ . Giá trị này càng rộng thì càng có nhiều nhiễu trong dữ liệu. Bộ mờ hóa không đơn trị có thể sử dụng suy diễn dùng phép min hoặc phép product để biến x thành max lx . Giả sử tập mờ có đầu vào thứ k và tiền đề thứ k tương ứng có dạng: − −= 2 , 2 1exp),( k kk k x xik ikX mx xx σ µ − −= 2 , 2 1exp),( l k l kk l k F Fik ikF mx xx σ µ (4) + Với phép suy diễn min đầu vào biến thành , ax l k mx như sau: l kk klk l kk FX XFFXl k mm x σσ σσ + + =max, (5) + Với phép suy diễn dùng product đầu vào biến thành , ax l k mx như sau: l kk klk l kk FX XFFXl k mm x 22 22 max, σσ σσ + + = (6) 10 NGHIÊN CỨU KHOA HỌC Tạp chí Nghiên cứu khoa học - Đại học Sao Đỏ, ISSN 1859-4190 Số 4(59).2017 Với hai dữ liệu đầu vào con là k mΧ và lkFm , phương sai 2σ thể hiện độ rộng của tập mờ tương ứng. Giá trị này càng rộng thì càng có nhiều nhiễu trong dữ liệu. Vì một lý do nào đó mà dữ liệu đầu vào bị hỏng do nhiễu thì bộ mờ hóa không đơn trị vẫn có thể xử lý được. Ví dụ, đầu vào k mΧ bị hỏng bởi nhiễu, tức là: kXX nmm kk += 0 (7) Với 0kX m là tín hiệu có ích và kn là nhiễu. Thay kX m trong (5) bởi (7) ta có: l kk l k l kk klk l kk FX kF FX XFFXl k nmm x σσ σ σσ σσ + + + + =max, (8) Công thức (8) chỉ ra rằng bộ mờ hóa Gaussian làm việc được với nhiễu bởi thành phần / ( )l l kk k XF F σ σ σ+ . Tương tự, ta chứng minh được bộ mờ hóa tam giác cũng có khả năng làm việc được với nhiễu. Ngoài ra, hệ mờ không đơn trị là hàm thuộc đầu ra có độ cao cực đại lớn hơn hệ mờ đơn trị [3]. Vì với cùng một đầu vào thì hệ mờ không đơn trị có thể có độ thuộc trong nhiều tập mờ tiền đề hơn hệ mờ đơn trị; do đó khi có nhiều nhiễu trong đầu vào thì trong hệ mờ không đơn trị nhiều luật sẽ được đốt cháy hơn là trong hệ mờ đơn trị. 3.4. Khối quyết định Phần này bàn về đề xuất tiếp cận GA để phân lớp mờ, hàm Gaussian, các luật được chọn ngẫu nhiên và được điều chỉnh đồng thời bởi GA. Shi và cộng sự [6], các hàm và các luật được thiết kế và phát triển cùng một lúc vì hai tham số đó được gọi là đồng tác phụ thuộc. Sau đó, tiến hành lựa chọn hàm thích hợp. Nếu tìm được hàm thích hợp tốt có thể phản ánh được mục tiêu của hệ thống. Phương pháp dùng giải thuật di truyền GA có sự khác biệt hơn nhiều so với phương pháp truyền thống gradient, nó được sử dụng để phát triển hệ thống với bất kỳ loại hàm của phép đo thích hợp: không khả vi, không liên tục,... Để xác định hàm thẩm định thích hợp, bài báo này không dùng vấn đề dự báo hay ước lượng mà dùng vấn đề phụ thuộc. Với vấn đề phụ thuộc thường sử dụng sai số bình phương hoặc hàm liên quan lỗi khác biệt tuyệt đối. Vấn đề phân loại sử dụng số lượng các lớp được phân loại chính xác hoặc lớp được phân loại chưa chính xác. Hàm thích hợp được đề xuất như sau: (9) Trong đó: ACNSR: tỷ lệ phần trăm của lớp tim bình thường; ACVF: tỷ lệ phần trăm của lớp rung tâm thất và ACVT: tỷ lệ phần trăm của lớp tim đập nhanh được phân loại chính xác. Sau khi mỗi nhiễm sắc thể được đánh giá và liên quan tới một sự thích hợp. Dân số luôn luôn biến động, quá trình sinh sản để tạo ra một thế hệ tiếp theo của dân số. Để xác định các thành viên mới phát sinh dựa vào sơ đồ “sự thay thế”. Mục đích của cơ chế chọn lọc là tập trung tìm kiếm trên các vùng hứa hẹn nhất của không gian tìm kiếm. Trong giải thuật di truyền GA để tìm kiếm hiệu quả kể cả với vùng mới dùng biến thể của nhà khai thác (chéo và đột biến). Vì sự xuyên chéo tạo điều kiện thăm dò, còn đột biến tạo điều kiện khai thác không gian tìm kiếm. Trong bài báo, nhóm tác giả sử dụng chéo điểm duy nhất và từng bit đột biến. Trong toàn bộ hoạt động của giải thuật di truyền để đơn giản các xác suất là hằng số: của chéo là 0.8 và đột biến là 0,03. Để đáp ứng điểm dừng của bài toán những cải tiến trong hoạt động được lặp đi lặp lại cho phù hợp với một số tiêu chí dừng. 4. KẾT QUẢ THỬ NGHIỆM Với cùng cơ sở dữ liệu thử nghiệm như hệ mờ loại hai khoảng [3]. Kết quả của hệ mờ sử dụng giải thuật di truyền [8] như sau: Có ba cách đo hiệu suất (độ chính xác, độ nhạy cảm và đặc trưng) được dùng để chuẩn hóa hệ thống phân lớp. Độ nhạy cảm là khả năng mà nếu xét nghiệm là dương tính thì người có bệnh, trong khi đó đặc trưng là khả năng mà nếu xét nghiệm là âm tính thì người không có bệnh. Các tham số được định nghĩa như sau: Sensitivity, (10) Specificity, (11) trong đó: TP, TN, FP và FN được định nghĩa trong bảng 1. Bảng 1. Ký hiệu sử dụng giống nhau giữa độ nhạy cảm và đặc trưng Predicted / Real Rhythm A Rhythm B Rhythm A True Positive (TP) False Negative (FN) Rhythm B False Positive (FP) True Negative (TN) LIÊN NGÀNH ĐIỆN - ĐIỆN TỬ - TỰ ĐỘNG HÓA Tạp chí Nghiên cứu khoa học - Đại học Sao Đỏ, ISSN 1859-4190 Số 4(59).2017 11 Bảng 2. Kết quả phân lớp với các cấu hình khác nhau Cấu hình Nhịp tim AC (%) SE (%) SP (%) a NSR 100,00 100,00 100,00 VF 83,33 90,91 92,00 VT 91,67 84,62 95,65 Trung bình 91,67 91,84 95,88 b NSR 100,00 100,00 100,00 VF 95,00 100,00 97,56 VT 100 95,24 100,00 Trung bình 98,33 98,41 99,19 c NSR 100,00 98,36 100,00 VF 98,33 100,00 99,17 VT 100,00 100,00 100,00 Trung bình 98,44 98,45 99,72 d NSR 100,00 100,00 100,00 VF 100,00 100,00 100,00 VT 100,00 100,00 100,00 Trung bình 100,00 100,00 100,00 trong đó [8]: a: FLS đơn trị với đặc trưng đầu vào là độ rộng xung và chu kỳ; b: FLS đơn trị với đặc trưng đầu vào là độ rộng xung và biên độ; c: FLS không đơn trị với đặc trưng đầu vào là độ rộng xung và chu kỳ; d: FLS không đơn trị với đặc trưng đầu vào là độ rộng xung và biên độ. Trong thực tế, các cán bộ y tế luôn quan sát thông tin biên độ chứ không phải là thông tin chu kỳ để xác định các loại loạn nhịp thất. Thông tin về chu kỳ xung có thể là không đáng tin cậy vì chu kỳ xung ngắn hơn có thể là kết quả từ các hoạt động tập thể dục hay cảm xúc của bệnh nhân. Tuy nhiên, từ kết quả này ta thấy ưu thế của việc sử dụng hệ logic mờ không đơn trị. Bên cạnh đó, FLS không đơn trị cung cấp những lợi thế nhất khi tín hiệu đầu vào đơn gồm các đặc trưng không chắc chắn để phân lớp tín hiệu. Vấn đề được cải thiện chút ít nếu tín hiệu đầu vào là đặc trưng có ít sự chắc chắn hơn. Nói tóm lại, FLS không đơn trị được chứng minh là một công cụ rất hữu hiệu trong việc giải quyết những bất trắc tồn tại trong phân loại mẫu. Thuật toán giải thuật sử dụng các cửa sổ chiều dài ngắn nhất (4.0 s) để khai thác tính năng so với các thuật toán khác như sự liên quan giữa sự khác biệt và hiệu suất. Một số thuật toán đã dùng có độ dài của cửa sổ 4,0 s; 4,8 s; 8,0 s; 20,0 s; 8,0 s; 7,0 s và 5,5 s tương ứng để đạt được kết quả khá tốt. Một số cửa sổ chiều dài ngắn hơn sẽ cho phép phát hiện trong một thời gian ngắn hơn, cho rằng thời gian tính toán của các phân lớp là tương đương. Đề xuất FLS không đơn trị chỉ dùng ít hơn 0,05 ms để phân lớp một tập các dữ liệu tách ra, vì thế thời gian tính toán lấy của phân loại là không đáng kể so với các đặc trưng được chọn. Bảng 3 cho thấy hệ thống phân lớp sử dụng giải thuật di truyền tối ưu hệ mờ không đơn trị tốt hơn hệ thống phân lớp sử dụng hệ mờ loại hai khoảng và VF - Filter Leakage. Bảng 3. So sánh kết quả phân lớp tập dữ liệu (%) của các phương pháp khác nhau Thuật toán/ bài báo NSR VF VT Cơ sở dữ liệuAC (%) SE (%) SP (%) AC (%) SE (%) SP (%) AC (%) SE (%) SP (%) VF-Filter Leakage/[9] 97,55 94,12 98,24 89,22 89,41 89,08 89,71 84,71 93,28 VFDB Type-2 khoảng Fuzzy Classifier/[3] 100 100 100 92,3 92,5 98 93,3 93,3 95,8 MIT- BIH GA Fuzzy Classifier 100,0 98,36 100,0 98,33 100,0 99,17 100,0 100,0 100,0 VFDB 12 NGHIÊN CỨU KHOA HỌC Tạp chí Nghiên cứu khoa học - Đại học Sao Đỏ, ISSN 1859-4190 Số 4(59).2017 Vì 3 phương pháp: Type-2 khoảng Fuzzy, VF - Filter Leakage và GA Fuzzy Classifier cùng sử dụng cơ sở dữ liệu có sẵn của MIT-BIH để phân loại ra NSR, VF, VT. Nhưng kết quả của GA là tốt hơn hẳn. VFDB - cơ sở liêu chứng loạn nhịp thất ác tính của MIT- BIH. CSDL điện tim MIT-BIH [10] được sử dụng để đánh giá hiệu năng của mô hình phân lớp. 70 mẫu dữ liệu được chọn ngẫu nhiên từ CSDL để huấn luyện và thử nghiệm mô hình. Trong 70 mẫu dữ liệu bao gồm 30 mẫu thuộc lớp NSR, 25 mẫu thuộc lớp VT và 15 lớp thuộc lớp VF. CSDL bao gồm 48 bản ghi, mỗi bản ghi lưu trữ một điện tâm đồ trong khoảng thời gian 30 phút. Tần số lấy mẫu của tín hiệu điện tim là 250 Hz. 5. KẾT LUẬN Nhóm tác giả đã trình bày các bước xây dựng một mô hình phân lớp điện tim sử dụng hệ mờ không đơn trị kết hợp với giải thuật di truyền để tối ưu tham số hệ mờ. Kết quả chỉ ra rằng với cùng một dữ liệu đầu vào thì hệ mờ không đơn trị kết hợp GA luôn loại bỏ được nhiễu và phân lớp tốt hơn so với các hệ mờ đơn trị tương ứng. TÀI LIỆU THAM KHẢO [1]. J. M . Mendel (2001). Uncertain Rule-Based Fuzzy Logic Systems: Introduction and New Directions. Upper Saddle River, NJ Prentice-Hall, 2001. [2]. J. M. Mendel and R .I. John (2002). Type-2 Fuzzy Sets Made Simple. IEEE Transactions on Fuzzy Systems (2002), 10(2), 117-127. [3]. Teck Wee Chua and Woei Wan Tan (2007). Interval Type-2 Fuzzy System for ECG Arrhythmic Classification. Department of Electrical Engineering, National University of Singapore, Singapore, 1-18. [4]. L. X. Wang (1994). Adaptive Fuzzy Systems and Control Design and Stability Analysis. NJ: Prentice-Hall. [5]. N.V. Thakor, Y.S. Zhu, and K.Y. Pan (1990). Ventricular Tachycardia and Fibrillation Detection by A Sequential Hypothesis Testing Algorithm. IEEE Transactions on Biomedical Engineering, vol. 37, no. 9, pp. 837-843, 1990. [6]. A.S. Al-Fahoum, I.H. (1999). Combined Wavelet Transform and Radial Basis Neural Networks for the Classifying Life Threatening Cardiac Arrhythmias. Med. Bio. Eng. Comput., 1999. 37: p. 566-573. [7]. A. Kaufman and M. M. Gupta (1991). Introduction to Fuzzy Arithmetic: Theory and Applications. NY: Van Nostrand Reinhold. [8]. Teck Wee Chua and Woei Wan Tan (2009). GA Optimisation of Non-Singleton Fuzzy Logic System for ECG Classification. Department of Electrical and Computer Engineering National University of Singapore 4, Engineering Drive 3, Singapore 117576. [9]. X. S. Zhang, Y. S. Zhu and N. V. Thakor (1990). Detecting Ventricular Tachycardia and Fibrillation by Complexity Measure. IEEE Transactions on Biomedical Engineering, vol. 46, no. 5, pp. 837-843. [10]. MIT/BIH Database Distribution, Massachusetts Inst. Techno. Cambridge, MA. (2011) [11].
File đính kèm:
- ung_dung_giai_thuat_di_truyen_ga_de_toi_uu_tham_so_he_mo_tro.pdf