Ứng dụng giải thuật di truyền (GA) để tối ưu tham số hệ mờ trong phân lớp tín hiệu điện tim

Bài báo trình bày các bước xây dựng một mô hình phân lớp điện tim sử dụng hệ mờ không đơn trị

(NSFLS). Đầu tiên, các tín hiệu điện tim được cho qua một khối tiền xử lý để loại nhiễu do môi trường

ghi điện tâm đồ gây ra. Tín hiệu sau khi xử lý nhiễu sẽ được phân tích và trích rút các đặc trưng thích

hợp. Các đặc trưng này là đầu vào của một hệ phân lớp mờ không đơn trị. Sau khi xác định cấu trúc

của mô hình phân lớp, xây dựng các tham số của mô hình qua một quá trình học dựa vào tập dữ liệu

huấn luyện. Cuối cùng, nhóm tác giả sử dụng giải thuật di truyền để tối ưu tham số hệ mờ nhằm thu

được kết quả phân lớp tín hiệu điện tim tốt nhất.

8 trang kimcuc 19260

Download

Bạn đang xem tài liệu "Ứng dụng giải thuật di truyền (GA) để tối ưu tham số hệ mờ trong phân lớp tín hiệu điện tim", để tải tài liệu gốc về máy hãy click vào nút Download ở trên

Tóm tắt nội dung tài liệu: Ứng dụng giải thuật di truyền (GA) để tối ưu tham số hệ mờ trong phân lớp tín hiệu điện tim

LIÊN NGÀNH ĐIỆN - ĐIỆN TỬ - TỰ ĐỘNG HÓA
Tạp chí Nghiên cứu khoa học - Đại học Sao Đỏ, ISSN 1859-4190 Số 4(59).2017 5
ỨNG DỤNG GIẢI THUẬT DI TRUYỀN (GA) ĐỂ TỐI ƯU THAM SỐ
HỆ MỜ TRONG PHÂN LỚP TÍN HIỆU ĐIỆN TIM
APPLICATION OF GA FOR OPTIMISING PARAMETERS OF FUZZY
SYSTEMS IN ECG CLASSIFICATION
Hoàng Thị Ngọc Diệp, Trần Duy Khánh, Hoàng Thị An
Email: [email protected]
Trường Đại Học Sao Đỏ
Ngày nhận bài: 16/2/2017
Ngày nhận bài sửa sau phản biện: 6/11/2017
Ngày chấp nhận đăng: 28/12/2017
Tóm tắt
Bài báo trình bày các bước xây dựng một mô hình phân lớp điện tim sử dụng hệ mờ không đơn trị
(NSFLS). Đầu tiên, các tín hiệu điện tim được cho qua một khối tiền xử lý để loại nhiễu do môi trường
ghi điện tâm đồ gây ra. Tín hiệu sau khi xử lý nhiễu sẽ được phân tích và trích rút các đặc trưng thích
hợp. Các đặc trưng này là đầu vào của một hệ phân lớp mờ không đơn trị. Sau khi xác định cấu trúc
của mô hình phân lớp, xây dựng các tham số của mô hình qua một quá trình học dựa vào tập dữ liệu
huấn luyện. Cuối cùng, nhóm tác giả sử dụng giải thuật di truyền để tối ưu tham số hệ mờ nhằm thu
được kết quả phân lớp tín hiệu điện tim tốt nhất.
Từ khóa: Hệ mờ không đơn trị (NSFLS); giải thuật di truyền (GA); phân loại mẫu; phân lớp tín hiệu điện
tim (ECG).
Abstract
The paper presents a method to construct a non-singleton fuzzy logic system (NSFLS) for ECG
arrhythmic classification. The classifier is applied to distinguish normal sinus rhythm (NSR),
ventricular fibrillation (VF) and ventricular tachycardia (VT). Two features of ECG signal, the average
period and the pulse width, are inputs to the fuzzy classifier. The rule base used in the fuzzy system is
constructed from training data. The generalized bell membership function is used to examine the
performance of the classifier with different shapes of membership function. The results of experiments with
data from the MIT-BIH Malignant Ventricular Arrhythmia Database show the viability of a non-singleton
fuzzy system in ECG classification. Then, GA Optimisation of Non-Singleton Fuzzy Logic System for ECG
Classification to obtain the best results.
Keywords: Non-singleton fuzzy logic system (NSFLS); genetic algorithm (GA); pattern classiﬁcation;
electrocardiogram (ECG).
1. GIỚI THIỆU
Trong thực tế có rất nhiều bài toán cần phân loại
mẫu như bài toán phân loại ảnh khuôn mặt, phân
loại văn bản, phát hiện lỗi trong các phân tích máy
móc và y tế, phân loại chữ viết Có rất nhiều vấn
đề con người xử lý khá đơn giản. Trái lại, trong
nhiều trường hợp, phương án sử dụng máy tính
đã chỉ ra mức độ khó của vấn đề. Tuy gặp nhiều
khó khăn nhưng việc sử dụng máy tính trong các
bài toán nhận dạng mẫu ngày càng trở nên phổ
biến. Mục đích chính của việc phân loại mẫu là tự
động trợ giúp con người khi phân tích khối lượng
dữ liệu cực lớn và từ đó trích chọn ra những tri
thức hữu ích. Mặc dù có nhiều phương thức khi
phân loại nhưng chúng đều có chung cấu trúc nền
tảng và các bước khi thiết kế. Theo [8] các thành
phần của một bộ phân loại và trình tự thiết kế bộ
phân loại được chỉ ra trên hình 1.
Bước trích chọn đặc trưng biến đổi dữ liệu đầu
vào (trong không gian quan sát) thành các vectơ
đặc trưng (trong không gian đặc trưng). Không
gian đặc trưng có số chiều ít hơn nhiều so với
không gian quan sát. Bước tiếp theo là biến đổi
từ không gian đặc trưng sang không gian quyết
định được định nghĩa bởi tập các lớp (xác định).
Một bộ phân loại hay một thuật toán sẽ sinh ra
một phân hoạch của không gian đặc trưng bởi các
miền quyết định. Sau khi thiết kế bộ phân loại với
6NGHIÊN CỨU KHOA HỌC
Tạp chí Nghiên cứu khoa học - Đại học Sao Đỏ, ISSN 1859-4190 Số 4(59).2017
hiệu năng mong muốn, ta có thể sử dụng nó để
phân loại các đối tượng mới. Điều này có nghĩa
là bộ phân loại sẽ gán từng vectơ đặc trưng trong
không gian đặc trưng với một lớp trong không
gian quyết định.
Trong bài toán phân loại mẫu, trích chọn đặc
trưng là nhiệm vụ khó khăn nhất, quyết định đến
độ chính xác của thuật toán. Khi trích chọn đặc
trưng cần lựa chọn những đặc trưng hữu ích để
tìm ra thuật toán học hiệu quả cho bài toán phân
Đã có nhiều nghiên cứu để phân lớp tín hiệu điện
tim. Theo [3] với mô hình mờ sử dụng logic mờ
loại 2 khoảng đơn trị thì khả năng làm việc với
nhiễu hiệu quả chưa cao. Theo [9] sử dụng hệ mờ
loại hai khoảng và thuật toán VF - Filter Leakage
thì khả năng phân lớp chưa tối ưu hóa hàm thuộc
và cơ sở luật. Do đó, hệ mờ không đơn trị được
chọn vì nó thích hợp hơn hệ mờ đơn trị khi làm
việc với nhiễu. Giải thuật di truyền được dùng để
tối ưu hóa đồng thời hàm thuộc và cơ sở luật.
Bài báo này trình bày khả năng của hệ mờ không
đơn trị và giải thuật di truyền để xử lý nhiễu trong
các bài toán phân loại mẫu. Hiệu năng của các hệ
thống đơn trị và không đơn trị được so sánh với
nhau trong bài toán phân lớp điện tim. Các kết
quả chỉ ra rằng giải thuật di truyền tốt hơn hệ mờ
loại mẫu và tiết kiệm chi phí tính toán. Nếu những
đặc trưng thừa hay không thích hợp ảnh hưởng
đến hiệu năng cũng như chất lượng phân loại
mẫu, thậm chí có thể dẫn tới việc phân loại sai.
Do có nhiều cách lựa chọn thuật toán nên độ khó
khi trích chọn đặc trưng cũng rất đa dạng. Hơn
nữa, trong các ứng dụng ta luôn phải đối mặt với
nhiễu. Nguyên nhân của chúng là do nhiễu điện
trong các thiết bị trích chọn hoặc thao tác các thiết
bị không đúng.
a) b)
Hình 1. a) Các thành phần của bộ phân loại; b) Trình tự thiết kế bộ phân loại sử dụng GA
đơn trị khi có nhiễu trong các đặc trưng được trích
chọn. Điều này rất hữu ích khi không thể tránh
khỏi sự nhập nhằng trong dữ liệu đầu vào [8].
2. GIẢI THUẬT DI TRUYỀN ÁP DỤNG VÀO BÀI
TOÁN ECG
2.1. Bài toán ECG
Bài toán phân lớp điện tim được mô tả theo sơ đồ
như hình 2, trong đó:
- Đầu vào gồm hai đặc trưng: độ rộng xung (PW),
chu kỳ xung (T).
- Đầu ra loại nhịp tim (phân làm ba lớp): NRS (nhịp
tim bình thường), VF (chứng rung tâm thất) và VT
(chứng tim đập nhanh).
Dữ liệu vào
Cảm biến
Tiền xử lý
Trích chọn đặc
t
Phân lớp
Quyết định
a)
Thu thập dữ
Lựa chọn đặc
Lựa chọn lớp
Huấn luyện phân
Đánh giá hiệu
ấ
Kết thúc
b)
Thu nhập dữ liệu
Lựa chọn đặc trưng
Đánh giá hiệu suất
Huấn luyện phân loại
Kết thúcQuyết định
P lớp
Tiề lý
Cả i n
liệu vào
Lựa chọ lớp
Trích c ọn đặc trưng
LIÊN NGÀNH ĐIỆN - ĐIỆN TỬ - TỰ ĐỘNG HÓA
Tạp chí Nghiên cứu khoa học - Đại học Sao Đỏ, ISSN 1859-4190 Số 4(59).2017 7
Tín hiệu điện tim đầu vào
Loạn nhịp tim
Phân lớp tín hiệu
Xử lý và trích rút đặc trưng của tín hiệu
Hình 2. Sơ đồ bài toán ECG
2.2. Giải thuật di truyền
Giải thuật di truyền sử dụng các mã hóa nhị phân,
mỗi cá thể là một chuỗi bit, thông qua các toán tử
di truyền: chọn lọc, lai ghép, đột biến, tái tạo.
procedure Genetic_Algorithm;
begin
t ← 0;
Khởi tạo thế hệ ban đầu P(t);
Đánh giá P(t) (theo hàm thích nghi);
repeat
t ← t + 1;
Sinh ra thế hệ mới P(t) từ P(t-1) bởi
• Chọn lọc
• Lai ghép
• Đột biến
Đánh giá P(t);
until Điều kiện kết thúc được thỏa mãn;
end;
2.3. Giải thuật di truyền ứng dụng vào bài
toán ECG
Khi thiết kế một hệ mờ giải quyết bài toán ECG
dùng giải thuật di truyền, đầu tiên là xem xét chiến
lược trình bày và cách thức mã hóa hệ mờ vào
nhiễm sắc thể. Trong thiết kế giải thuật di truyền
ở bài báo này có hai đầu vào và mỗi đầu vào gồm
hai biến x1 và x2 (có thể là độ rộng xung và chu
kỳ hoăc độ rộng xung và biên độ) được phân chia
thành ba hàm, do đó, có 12 tham số (vì 2 tham số
x 2 đầu vào x 3 chức năng thành viên = 12 tham
số). Giả sử không mất tính tổng quát và độ lệch
tiêu chuẩn của hàm tham gia là
i
l
xm và i
l
xσ , với
i = 1, 2 và l = 1, 2, 3. Ngoài ra có 9 luật (3x3) trong
các quy tắc cơ sở, thêm kết quả phụ 9 tham số,
rn trong đó n = 1, 2, , 9. Do vậy, tổng cộng 21
tham số (3 chức năng thành viên × 2 tham số × 2
biến đầu vào + 9 quy tắc) cần thiết để giải thuật di
truyền điều chỉnh.
+ Mỗi tham số luật được mã hóa thành chuỗi
nhị phân 2-bit.
+ Mỗi tham số của hàm được mã hóa thành
chuỗi nhị phân 8-bit.
Do đó, chiều dài của chuỗi nhị phân là 114 bit
(12x8+2x9=114 bit). Minh họa cấu trúc của nhiễm
sắc thể (hình 3).
Hình 3. Cấu trúc của nhiễm sắc thể
Trong quá trình thẩm định thích hợp các tham số
phải được giải mã (kiểu hình đại diện).
+ Tham số luật giải mã thành dãy số
nguyên 0-4.
+ Tham số hàm giải mã thành số thực bằng
cách sử dụng phương trình lập bản đồ tuyến tính
như dưới đây [3]:
12
)( minmaxmin
−
×−+= N
q
qqqp
A
GGGg
(1)
trong đó: p và q: chuỗi gen tương ứng; gp biểu thị
giá trị thực tế của các tham số qth; Aq biểu diễn các
số nguyên đại diện là chuỗi gen N-bit; maxqG và min
qG biểu thị cho người dùng xác định giới hạn
trên và dưới của gen tương ứng.
3. CẤU TRÚC CỦA MÔ HÌNH PHÂN LỚP MỜ
SỬ DỤNG GA ĐỂ TỐI ƯU THAM SỐ
Về cơ bản, kiến trúc chung của mô hình GA giống
với mô hình phân lớp loại hai khoảng. Tuy nhiên
trong cấu trúc có thêm khối tiền xử lý và giảm bớt
khối giảm loại và khử mờ.
Hình 4. Cấu trúc của một hệ phân loại mờ
sử dụng GA
8NGHIÊN CỨU KHOA HỌC
Tạp chí Nghiên cứu khoa học - Đại học Sao Đỏ, ISSN 1859-4190 Số 4(59).2017
3.1. Khái niệm hệ mờ không đơn trị
Kaufman và Gupta [7] định nghĩa phép mờ hóa
không đơn trị: Một bộ mờ hóa không đơn trị có
dạng ( ) 1( 1,..., )iX ix i pµ ′ = = và )( iX xiµ giảm dần từ
1 khi ix xa dần ix′ .
3.2. Khối tiền xử lý
Xét một bộ phân loại, giả sử có thể có một số loại
nhiễu. Đầu tiên, các đầu vào của bộ phân loại có
thể bị hỏng. Các tín hiệu điện tim ghi được (đặc biệt
là tín hiệu điện tim đo trên bề mặt) rất nhạy cảm với
việc di chuyển cáp điện và các hoạt động của cơ.
Ngoài ra, nhiễu từ mạng điện có thể sai lệch quá
trình ghi nhận tín hiệu... Do đó, tín hiệu cần được
tiền xử lý để có thể thu được thông tin từ tín hiệu
chính xác hơn.
Việc trích rút hai đặc trưng độ rộng xung, chu kỳ
xung của tín hiệu được thực hiện qua hai bước.
Tín hiệu điện tim sau khi lọc được biến đổi thành
một chuỗi nhị phân để làm tăng khả năng trích
chọn đặc trưng. Thuật toán biến đổi sử dụng trong
bài báo được cải tiến (nội dung của bước 2) từ
thuật toán trong [8]. Bài báo sử dụng thuật toán
biến đổi hai bước thay vì thuật toán biến đổi một
bước của Zhang. Tín hiệu điện tim sẽ được biến
đổi từng phần thành chuỗi nhị phân thay vì biến đổi
toàn bộ. Điều này có thể làm giảm việc phát hiện
sai các đỉnh tích cực bằng cách khử đi tín hiệu
có biên độ nhỏ. Sau bước này là bước biến đổi
hoàn toàn chuỗi nhị phân nhằm xác định ngưỡng
để cực đại hóa sự khác biệt giữa lớp NSR và lớp
VF/VT. Sau đó, ta sẽ tính toán độ rộng xung, chu
kỳ xung trung bình của tín hiệu dựa vào chuỗi nhị
phân trên.
VFDB - cơ sở liêu chứng loạn nhịp thất ác tính
của MIT-BIH. CSDL điện tim MIT-BIH [10] với tập
dữ liệu trích từ cơ sở dữ liệu điện tim từ dự án
hợp tác giữa Học viện Kỹ thuật Massachusetts và
Bệnh viện Beth Israel (MIT-BIH). Đây là một cơ
sở dữ liệu điện tim phong phú đầy đủ, đã được
sử dụng rộng rãi trong nghiên cứu và học tập trên
thế giới.
Các bước được trình bày như sau:
Thuật toán:
Bước 1: Chuyển mẫu tín hiệu (4s tín hiệu) ban đầu
thành chuỗi nhị phân
Với dữ liệu của VFDB, chọn 4s dữ liệu. Tại tần số
250 Hz các tín hiệu rời rạc nên có tất cả 1000 điểm
dữ liệu trong cửa sổ dài 4s à ta có n = 1000 mẫu
có các giá trị Xi với i = 1, 2,.., 1000.
Lấy x[m] là trung bình cộng các phần tử của mảng
{Xi}. Tạo một mảng X’ bằng cách lấy giá trị của
mỗi phần từ trừ đi Xm: X’i = {xi – xm}
Làm các công việc sau trên mảng X’:
- Tính giá trị âm nhỏ nhất Vn và giá trị dương lớn
nhất Vp.
- Tạo một phần chuỗi nhị phân: Nếu các phần
tử có giá trị trong khoảng (0<xi<0.2 Vp) hoặc
(0.2 Vn<xi<0) thì x’(i) = 0.
- Tính tham số Np và Nn. Np là ký hiệu số lượng
dữ liệu xi>0 và Nn=n–Np.
- Chuyển một phần chuỗi nhị phân thành toàn bộ
chuỗi nhị phân bằng cách xác định ngưỡng Tr.
Đây là bước quan trọng để tách biệt giữa các tín
hiệu NSR, VF và VT.
Nếu Np < 0.15n thì Tr = 0.7*Vp
Nếu Np >= 0.15n thì Tr = 0
- Chuyển một phần chuỗi nhị phân thành chuỗi
nhị phân hoàn toàn bằng cách so sánh x[i]
với Tr:
Nếu x[i] <= Tr thì x[i] = 0
Nếu x[i] > Tr thì x[i] = 1
Sau bước này ta có chuỗi nhị phân tương ứng
với mẫu tín hiệu: dãy số 1 liên tiếp trong chuỗi nhị
phân biểu diễn xung QRS của tín hiệu ban đầu.
Bước 2: Tính Pw và T từ chuỗi nhị phân:
Bước này sẽ tính độ rộng xung và chu kỳ xung
trung bình trong khoảng 4s tín hiệu. Độ rộng xung
của mẫu 4s tín hiệu được tính bằng trung bình
độ rộng của tất cả các xung trong khoảng tín
hiệu. Độ rộng của một xung trong mẫu tín hiệu
là độ dài chuỗi số 1 liên tiếp trong chuỗi nhị phân
tương ứng.
1 ( )
N
iW
PW ms
N
=
∑ (2)
1
1 ( )
1
N
iT
T ms
N
−
=
−
∑
trong đó:
Wi: độ rộng xung thứ i;
Ti: khoảng cách giữa xung thứ (i) và xung thứ
(i+1);
N: tổng số xung trong đoạn tín hiệu.
LIÊN NGÀNH ĐIỆN - ĐIỆN TỬ - TỰ ĐỘNG HÓA
Tạp chí Nghiên cứu khoa học - Đại học Sao Đỏ, ISSN 1859-4190 Số 4(59).2017 9
Như vậy, sau bước này với mỗi tín hiệu ta sẽ thu
được 2 giá trị độ rộng xung (PW) và chu kỳ xung
(T). Giá trị của hai đặc trưng này sẽ là đầu vào cho
mô hình phân lớp dựa trên luật mờ ở bước sau.
(a)
(b)
(c)
Hình 5. Ba dạng tín hiệu điện tim khác nhau
với chuỗi nhị phân tương ứng
Theo Teck Wee Chua và Woei Wan Tan [8], trong
hình 5 có hai tham số được trích chọn từ chuỗi
nhị phân này: độ rộng xung, chu kì xung. Tất
cả các tham số được tính trung bình trong cửa
sổ 4s và độ lệch chuẩn của chúng được tính
tương ứng.
3.3. Khối mờ hóa
Mặc dù, bộ mờ hóa đơn trị đơn giản và phổ biến
hơn bộ mờ hóa không đơn trị. Nhưng khi lựa chọn
phương pháp mờ hóa người ta lại lựa chọn bộ mờ
hóa không đơn trị vì bộ mờ hóa không đơn trị có
thể làm việc tốt hơn trong môi trường nhiễu và nó
có thể mô hình hóa sự không chắc chắn, không
chính xác của các đầu vào [4, 5]. Các tín hiệu điện
tim ECG thường bị ngắt quãng khi ghi nên các
điểm kề đó có thể cũng là các giá trị đúng nhưng
với độ thuộc bé hơn. Do đó, theo Mouzouris và
Mendel [2], bộ mờ hóa không đơn trị coi đầu vào x
là đại diện tốt nhất từ tất cả các giá trị xung quanh
nó. Tuy nhiên, ta có thể dễ dàng chuyển đổi bộ
phân loại không đơn trị thành đơn trị và ngược lại
bằng cách thay thế khối mờ hóa tương ứng (hình
chữ nhật đậm trong hình 4).
Sự khác biệt duy nhất giữa hệ logic mờ đơn trị và
không đơn trị là số lượng các mức đốt cháy.
Hiệu quả của “bộ tiền lọc” của FLS không đơn trị
là chìa khóa để làm việc với sự không chắc chắn
trong đầu vào [1]. Hiệu quả này là kết quả của
phép hợp thành super-star trong phép mờ hóa
của NSFLS framwork với việc biến x thành xlmax.
Vì vậy, theo [8] xét một tập mờ với hàm thuộc Gauss













 −−=
2
2
1exp)(
σ
µ iiX
xxx
(3)
trong đó: phương sai 2σ thể hiện độ rộng của
( )X ixµ . Giá trị này càng rộng thì càng có nhiều
nhiễu trong dữ liệu. Bộ mờ hóa không đơn trị có
thể sử dụng suy diễn dùng phép min hoặc phép
product để biến x thành max
lx . Giả sử tập mờ có
đầu vào thứ k và tiền đề thứ k tương ứng có dạng:















 −
−=
2
,
2
1exp),(
k
kk
k
x
xik
ikX
mx
xx
σ
µ















 −
−=
2
,
2
1exp),(
l
k
l
kk
l
k
F
Fik
ikF
mx
xx
σ
µ
(4)
+ Với phép suy diễn min đầu vào biến thành
, ax
l
k mx như sau:
l
kk
klk
l
kk
FX
XFFXl
k
mm
x
σσ
σσ
+
+
=max, (5)
+ Với phép suy diễn dùng product đầu vào biến
thành , ax
l
k mx như sau:
l
kk
klk
l
kk
FX
XFFXl
k
mm
x 22
22
max, σσ
σσ
+
+
=
(6)
10
NGHIÊN CỨU KHOA HỌC
Tạp chí Nghiên cứu khoa học - Đại học Sao Đỏ, ISSN 1859-4190 Số 4(59).2017
Với hai dữ liệu đầu vào con là
k
mΧ và lkFm , phương
sai 2σ thể hiện độ rộng của tập mờ tương ứng.
Giá trị này càng rộng thì càng có nhiều nhiễu trong
dữ liệu. Vì một lý do nào đó mà dữ liệu đầu vào
bị hỏng do nhiễu thì bộ mờ hóa không đơn trị vẫn
có thể xử lý được. Ví dụ, đầu vào
k
mΧ bị hỏng bởi
nhiễu, tức là: kXX nmm kk += 0
(7)
Với
0kX
m là tín hiệu có ích và kn là nhiễu.
Thay
kX
m trong (5) bởi (7) ta có:
l
kk
l
k
l
kk
klk
l
kk
FX
kF
FX
XFFXl
k
nmm
x
σσ
σ
σσ
σσ
+
+
+
+
=max,
(8)
Công thức (8) chỉ ra rằng bộ mờ hóa Gaussian
làm việc được với nhiễu bởi thành phần
/ ( )l l
kk k
XF F
σ σ σ+ . Tương tự, ta chứng minh
được bộ mờ hóa tam giác cũng có khả năng làm
việc được với nhiễu. Ngoài ra, hệ mờ không đơn trị
là hàm thuộc đầu ra có độ cao cực đại lớn hơn hệ
mờ đơn trị [3]. Vì với cùng một đầu vào thì hệ mờ
không đơn trị có thể có độ thuộc trong nhiều tập mờ
tiền đề hơn hệ mờ đơn trị; do đó khi có nhiều nhiễu
trong đầu vào thì trong hệ mờ không đơn trị nhiều
luật sẽ được đốt cháy hơn là trong hệ mờ đơn trị.
3.4. Khối quyết định
Phần này bàn về đề xuất tiếp cận GA để phân
lớp mờ, hàm Gaussian, các luật được chọn ngẫu
nhiên và được điều chỉnh đồng thời bởi GA. Shi
và cộng sự [6], các hàm và các luật được thiết kế
và phát triển cùng một lúc vì hai tham số đó được
gọi là đồng tác phụ thuộc. Sau đó, tiến hành lựa
chọn hàm thích hợp. Nếu tìm được hàm thích hợp
tốt có thể phản ánh được mục tiêu của hệ thống.
Phương pháp dùng giải thuật di truyền GA có sự
khác biệt hơn nhiều so với phương pháp truyền
thống gradient, nó được sử dụng để phát triển hệ
thống với bất kỳ loại hàm của phép đo thích hợp:
không khả vi, không liên tục,... Để xác định hàm
thẩm định thích hợp, bài báo này không dùng vấn
đề dự báo hay ước lượng mà dùng vấn đề phụ
thuộc. Với vấn đề phụ thuộc thường sử dụng sai
số bình phương hoặc hàm liên quan lỗi khác biệt
tuyệt đối. Vấn đề phân loại sử dụng số lượng các
lớp được phân loại chính xác hoặc lớp được phân
loại chưa chính xác. Hàm thích hợp được đề xuất
như sau:
(9)
Trong đó: ACNSR: tỷ lệ phần trăm của lớp tim bình
thường; ACVF: tỷ lệ phần trăm của lớp rung tâm
thất và ACVT: tỷ lệ phần trăm của lớp tim đập nhanh
được phân loại chính xác. Sau khi mỗi nhiễm sắc
thể được đánh giá và liên quan tới một sự thích
hợp. Dân số luôn luôn biến động, quá trình sinh
sản để tạo ra một thế hệ tiếp theo của dân số. Để
xác định các thành viên mới phát sinh dựa vào
sơ đồ “sự thay thế”. Mục đích của cơ chế chọn
lọc là tập trung tìm kiếm trên các vùng hứa hẹn
nhất của không gian tìm kiếm. Trong giải thuật di
truyền GA để tìm kiếm hiệu quả kể cả với vùng
mới dùng biến thể của nhà khai thác (chéo và đột
biến). Vì sự xuyên chéo tạo điều kiện thăm dò,
còn đột biến tạo điều kiện khai thác không gian
tìm kiếm. Trong bài báo, nhóm tác giả sử dụng
chéo điểm duy nhất và từng bit đột biến. Trong
toàn bộ hoạt động của giải thuật di truyền để đơn
giản các xác suất là hằng số: của chéo là 0.8 và
đột biến là 0,03. Để đáp ứng điểm dừng của bài
toán những cải tiến trong hoạt động được lặp đi
lặp lại cho phù hợp với một số tiêu chí dừng.
4. KẾT QUẢ THỬ NGHIỆM
Với cùng cơ sở dữ liệu thử nghiệm như hệ mờ
loại hai khoảng [3]. Kết quả của hệ mờ sử dụng
giải thuật di truyền [8] như sau: Có ba cách đo
hiệu suất (độ chính xác, độ nhạy cảm và đặc
trưng) được dùng để chuẩn hóa hệ thống phân
lớp. Độ nhạy cảm là khả năng mà nếu xét nghiệm
là dương tính thì người có bệnh, trong khi đó đặc
trưng là khả năng mà nếu xét nghiệm là âm tính
thì người không có bệnh. Các tham số được định
nghĩa như sau:
Sensitivity,
(10)
Specificity,
(11)
trong đó: TP, TN, FP và FN được định nghĩa trong
bảng 1.
Bảng 1. Ký hiệu sử dụng giống nhau giữa độ nhạy
cảm và đặc trưng
Predicted /
Real
Rhythm A Rhythm B
Rhythm A True Positive (TP)
False
Negative (FN)
Rhythm B False Positive (FP)
True Negative
(TN)
LIÊN NGÀNH ĐIỆN - ĐIỆN TỬ - TỰ ĐỘNG HÓA
Tạp chí Nghiên cứu khoa học - Đại học Sao Đỏ, ISSN 1859-4190 Số 4(59).2017 11
Bảng 2. Kết quả phân lớp với các cấu hình
khác nhau
Cấu
hình
Nhịp tim
AC
(%)
SE
(%)
SP
(%)
a
NSR 100,00 100,00 100,00
VF 83,33 90,91 92,00
VT 91,67 84,62 95,65
Trung bình 91,67 91,84 95,88
b
NSR 100,00 100,00 100,00
VF 95,00 100,00 97,56
VT 100 95,24 100,00
Trung bình 98,33 98,41 99,19
c
NSR 100,00 98,36 100,00
VF 98,33 100,00 99,17
VT 100,00 100,00 100,00
Trung bình 98,44 98,45 99,72
d
NSR 100,00 100,00 100,00
VF 100,00 100,00 100,00
VT 100,00 100,00 100,00
Trung bình 100,00 100,00 100,00
trong đó [8]:
a: FLS đơn trị với đặc trưng đầu vào là độ rộng
xung và chu kỳ;
b: FLS đơn trị với đặc trưng đầu vào là độ rộng
xung và biên độ;
c: FLS không đơn trị với đặc trưng đầu vào là độ
rộng xung và chu kỳ;
d: FLS không đơn trị với đặc trưng đầu vào là độ
rộng xung và biên độ.
Trong thực tế, các cán bộ y tế luôn quan sát thông
tin biên độ chứ không phải là thông tin chu kỳ
để xác định các loại loạn nhịp thất. Thông tin về
chu kỳ xung có thể là không đáng tin cậy vì chu
kỳ xung ngắn hơn có thể là kết quả từ các hoạt
động tập thể dục hay cảm xúc của bệnh nhân.
Tuy nhiên, từ kết quả này ta thấy ưu thế của việc
sử dụng hệ logic mờ không đơn trị. Bên cạnh đó,
FLS không đơn trị cung cấp những lợi thế nhất khi
tín hiệu đầu vào đơn gồm các đặc trưng không
chắc chắn để phân lớp tín hiệu. Vấn đề được cải
thiện chút ít nếu tín hiệu đầu vào là đặc trưng có
ít sự chắc chắn hơn. Nói tóm lại, FLS không đơn
trị được chứng minh là một công cụ rất hữu hiệu
trong việc giải quyết những bất trắc tồn tại trong
phân loại mẫu.
Thuật toán giải thuật sử dụng các cửa sổ chiều
dài ngắn nhất (4.0 s) để khai thác tính năng so
với các thuật toán khác như sự liên quan giữa sự
khác biệt và hiệu suất. Một số thuật toán đã dùng
có độ dài của cửa sổ 4,0 s; 4,8 s; 8,0 s; 20,0 s;
8,0 s; 7,0 s và 5,5 s tương ứng để đạt được kết
quả khá tốt. Một số cửa sổ chiều dài ngắn hơn sẽ
cho phép phát hiện trong một thời gian ngắn hơn,
cho rằng thời gian tính toán của các phân lớp là
tương đương. Đề xuất FLS không đơn trị chỉ dùng
ít hơn 0,05 ms để phân lớp một tập các dữ liệu
tách ra, vì thế thời gian tính toán lấy của phân loại
là không đáng kể so với các đặc trưng được chọn.
Bảng 3 cho thấy hệ thống phân lớp sử dụng giải
thuật di truyền tối ưu hệ mờ không đơn trị tốt hơn
hệ thống phân lớp sử dụng hệ mờ loại hai khoảng
và VF - Filter Leakage.
Bảng 3. So sánh kết quả phân lớp tập dữ liệu (%) của các phương pháp khác nhau
Thuật toán/
bài báo
NSR VF VT Cơ sở
dữ liệuAC (%)
SE
(%)
SP
(%)
AC
(%)
SE
(%)
SP
(%)
AC
(%)
SE
(%)
SP
(%)
VF-Filter
Leakage/[9] 97,55 94,12 98,24 89,22 89,41 89,08 89,71 84,71 93,28 VFDB
Type-2
khoảng
Fuzzy
Classifier/[3]
100 100 100 92,3 92,5 98 93,3 93,3 95,8
MIT-
BIH
GA Fuzzy
Classifier 100,0 98,36 100,0 98,33 100,0 99,17 100,0 100,0 100,0 VFDB
12
NGHIÊN CỨU KHOA HỌC
Tạp chí Nghiên cứu khoa học - Đại học Sao Đỏ, ISSN 1859-4190 Số 4(59).2017
Vì 3 phương pháp: Type-2 khoảng Fuzzy,
VF - Filter Leakage và GA Fuzzy Classifier cùng
sử dụng cơ sở dữ liệu có sẵn của MIT-BIH để
phân loại ra NSR, VF, VT. Nhưng kết quả của GA
là tốt hơn hẳn. VFDB - cơ sở liêu chứng loạn nhịp
thất ác tính của MIT- BIH. CSDL điện tim MIT-BIH
[10] được sử dụng để đánh giá hiệu năng của mô
hình phân lớp. 70 mẫu dữ liệu được chọn ngẫu
nhiên từ CSDL để huấn luyện và thử nghiệm mô
hình. Trong 70 mẫu dữ liệu bao gồm 30 mẫu thuộc
lớp NSR, 25 mẫu thuộc lớp VT và 15 lớp thuộc lớp
VF. CSDL bao gồm 48 bản ghi, mỗi bản ghi lưu trữ
một điện tâm đồ trong khoảng thời gian 30 phút.
Tần số lấy mẫu của tín hiệu điện tim là 250 Hz.
5. KẾT LUẬN
Nhóm tác giả đã trình bày các bước xây dựng một
mô hình phân lớp điện tim sử dụng hệ mờ không
đơn trị kết hợp với giải thuật di truyền để tối ưu
tham số hệ mờ. Kết quả chỉ ra rằng với cùng một
dữ liệu đầu vào thì hệ mờ không đơn trị kết hợp
GA luôn loại bỏ được nhiễu và phân lớp tốt hơn so
với các hệ mờ đơn trị tương ứng.
TÀI LIỆU THAM KHẢO
[1]. J. M . Mendel (2001). Uncertain Rule-Based Fuzzy
Logic Systems: Introduction and New Directions.
Upper Saddle River, NJ Prentice-Hall, 2001.
[2]. J. M. Mendel and R .I. John (2002). Type-2 Fuzzy
Sets Made Simple. IEEE Transactions on Fuzzy
Systems (2002), 10(2), 117-127.
[3]. Teck Wee Chua and Woei Wan Tan (2007).
Interval Type-2 Fuzzy System for ECG Arrhythmic
Classiﬁcation. Department of Electrical
Engineering, National University of Singapore,
Singapore, 1-18.
[4]. L. X. Wang (1994). Adaptive Fuzzy Systems
and Control Design and Stability Analysis. NJ:
Prentice-Hall.
[5]. N.V. Thakor, Y.S. Zhu, and K.Y. Pan (1990).
Ventricular Tachycardia and Fibrillation Detection
by A Sequential Hypothesis Testing Algorithm.
IEEE Transactions on Biomedical Engineering,
vol. 37, no. 9, pp. 837-843, 1990.
[6]. A.S. Al-Fahoum, I.H. (1999). Combined Wavelet
Transform and Radial Basis Neural Networks
for the Classifying Life Threatening Cardiac
Arrhythmias. Med. Bio. Eng. Comput., 1999. 37:
p. 566-573.
[7]. A. Kaufman and M. M. Gupta (1991). Introduction
to Fuzzy Arithmetic: Theory and Applications. NY:
Van Nostrand Reinhold.
[8]. Teck Wee Chua and Woei Wan Tan (2009).
GA Optimisation of Non-Singleton Fuzzy Logic
System for ECG Classiﬁcation. Department of
Electrical and Computer Engineering National
University of Singapore 4, Engineering Drive 3,
Singapore 117576.
[9]. X. S. Zhang, Y. S. Zhu and N. V. Thakor (1990).
Detecting Ventricular Tachycardia and Fibrillation
by Complexity Measure. IEEE Transactions
on Biomedical Engineering, vol. 46, no. 5, pp.
837-843.
[10]. MIT/BIH Database Distribution, Massachusetts
Inst. Techno. Cambridge, MA. (2011)
[11].

File đính kèm:

ung_dung_giai_thuat_di_truyen_ga_de_toi_uu_tham_so_he_mo_tro.pdf