Một phương pháp mới nâng cao độ tương phản ảnh màu theo hướng tiếp cận trực tiếp

Nâng cao độ tương phản ảnh là một vấn đề quan

trọng trong xử lý và phân tích hình ảnh, là một bước

cơ bản trong phân đoạn ảnh. Các kỹ thuật thông dụng

nâng cao độ tương phản ảnh được phân loại theo hai

tiếp cận chính: (1) Các phương pháp gián tiếp [1, 2, 5,

12, 13, 17]; và (2) các phương pháp trực tiếp [6, 7].

Có rất nhiều kỹ thuật đã được đề xuất được tìm

thấy trong tài liệu tham khảo, hầu hết trong số đó là

phương pháp gián tiếp, chúng biến đổi histogram mà

không sử dụng bất kỳ một độ đo tương phản nào.

Các kỹ thuật biến đổi histogram được khai thác ở

nhiều khía cạnh như thuật toán khung biến đổi

histogram và thích nghi nội dung [2], biến đổi logarit

histogram [1], kỹ thuật cân bằng động histogram [5],

chuẩn hóa nhiều histogram [17], biến đổi Cosine rời

rạc [13], xây dựng toán tử tăng cường mở rộng của

toán tử INT của Zadeh để mờ hóa thông tin trong

miền không gian [12] v.v

Mặc dù vậy có rất ít các nghiên cứu theo phương

pháp trực tiếp trong đó biến đổi độ tương phản ảnh

dựa trên một độ đo tương phản xác định tại mỗi điểm

ảnh, chẳng hạn các nghiên cứu [9, 3, 8, 6, 7]. Trong

[9, 3], các kết quả đã chứng tỏ rằng phương pháp trực

tiếp có thể tạo ra các kỹ thuật nâng cao độ tương phản

hiệu quả.

 

pdf 16 trang kimcuc 8720
Bạn đang xem tài liệu "Một phương pháp mới nâng cao độ tương phản ảnh màu theo hướng tiếp cận trực tiếp", để tải tài liệu gốc về máy hãy click vào nút Download ở trên

Tóm tắt nội dung tài liệu: Một phương pháp mới nâng cao độ tương phản ảnh màu theo hướng tiếp cận trực tiếp

Một phương pháp mới nâng cao độ tương phản ảnh màu theo hướng tiếp cận trực tiếp
Các công trình nghiên cứu phát triển CNTT và Truyền thông Tập V-1, Số 17 (37), tháng 6/2017 
 - 59 - 
Một phƣơng pháp mới nâng cao độ tƣơng phản ảnh 
màu theo hƣớng tiếp cận trực tiếp 
A New Method to Enhancement The Contrast of Color Images based on 
Direct Method 
Nguyễn Văn Quyền, Trần Thái Sơn, Nguyễn Tân Ân, Ngô Hoàng Huy, Đặng Duy An
Abstract: Image contrast enhancement techniques 
have two mainly methods: indirect method and direct 
method. While indirect methods only modify the 
histogram without defining any specific contrast 
measure, the direct methods establish a criterion of 
contrast measurement and enhance the image by 
improving the contrast measure. Among many direct 
methods, only the studies by Cheng and Xu modified 
the contrast at each point of grayscale image using a 
contrast measure [6, 7]. 
In this paper we propose a new method for 
enhancing the contrast of color images based on the 
direct method. The experimental results demonstrate 
that the combination of our proposed method with 
Fuzzy C_Mean (FCM) clustering algorithms performs 
well on different color images. 
Keywords: Direct contrast enhancement, 
homogeneity measure, contrast measure, FCM, S-
function, histogram, the dynamic range of gray, HSV, 
entropy, fuzzy entropy, the image details. 
I. GIỚI THIỆU 
Nâng cao độ tƣơng phản ảnh là một vấn đề quan 
trọng trong xử lý và phân tích hình ảnh, là một bƣớc 
cơ bản trong phân đoạn ảnh. Các kỹ thuật thông dụng 
nâng cao độ tƣơng phản ảnh đƣợc phân loại theo hai 
tiếp cận chính: (1) Các phƣơng pháp gián tiếp [1, 2, 5, 
12, 13, 17]; và (2) các phƣơng pháp trực tiếp [6, 7]. 
Có rất nhiều kỹ thuật đã đƣợc đề xuất đƣợc tìm 
thấy trong tài liệu tham khảo, hầu hết trong số đó là 
phƣơng pháp gián tiếp, chúng biến đổi histogram mà 
không sử dụng bất kỳ một độ đo tƣơng phản nào. 
Các kỹ thuật biến đổi histogram đƣợc khai thác ở 
nhiều khía cạnh nhƣ thuật toán khung biến đổi 
histogram và thích nghi nội dung [2], biến đổi logarit 
histogram [1], kỹ thuật cân bằng động histogram [5], 
chuẩn hóa nhiều histogram [17], biến đổi Cosine rời 
rạc [13], xây dựng toán tử tăng cƣờng mở rộng của 
toán tử INT của Zadeh để mờ hóa thông tin trong 
miền không gian [12] v.v 
Mặc dù vậy có rất ít các nghiên cứu theo phƣơng 
pháp trực tiếp trong đó biến đổi độ tƣơng phản ảnh 
dựa trên một độ đo tƣơng phản xác định tại mỗi điểm 
ảnh, chẳng hạn các nghiên cứu [9, 3, 8, 6, 7]. Trong 
[9, 3], các kết quả đã chứng tỏ rằng phƣơng pháp trực 
tiếp có thể tạo ra các kỹ thuật nâng cao độ tƣơng phản 
hiệu quả. 
Nhƣ nhận xét ở trên, trong một thời gian dài cho 
đến nay hầu nhƣ chỉ có các nghiên cứu của Cheng và 
Xu [6, 7] là đề xuất một phƣơng pháp biến đổi độ 
tƣơng phản tại mỗi điểm ảnh dựa trên định nghĩa một 
độ đo tƣơng phản giữa độ sáng điểm ảnh và lân cận 
xung quanh nó. Độ đo tƣơng phản của [6, 7] đƣợc xây 
dựng dựa trên các đặc trƣng địa phƣơng nhƣ gradient, 
entropy, độ lệch chuẩn trung bình và moment bậc 4 tại 
từng điểm ảnh. 
Ngay từ đầu, phƣơng pháp nâng cao độ tƣơng phản 
này chỉ đƣợc thực hiện trong ảnh đa cấp xám. Mở 
rộng những phƣơng pháp này để nâng cao độ tƣơng 
phản của ảnh màu không phải là một nhiệm vụ dễ 
dàng do gặp phải một số yếu tố, chẳng hạn nhƣ sự lựa 
chọn một mô hình màu thích hợp để biểu diễn và xử 
lý ảnh, ảnh hƣởng hệ thống thị giác của con ngƣời. 
Các công trình nghiên cứu phát triển CNTT và Truyền thông Tập V-1, Số 17 (37), tháng 6/2017 
 - 60 - 
Việc lựa chọn một mô hình màu là rất quan trọng 
để cải thiện độ tƣơng phản của ảnh màu. Biểu diễn 
màu RGB đƣợc sử dụng cho việc hiển thị màu sắc, 
trong khi biểu diễn màu HSV là cho hệ thống thị giác 
của con ngƣời. Trong mô hình màu HSV, kênh H biểu 
diễn màu sắc, kênh S chỉ độ bão hòa, và kênh V là 
cƣờng độ của màu. Bằng cách bảo toàn kênh H, chỉ 
thay đổi kênh V hoặc thay đổi cả kênh S và kênh V, 
chúng ta có thể nâng cao chất lƣợng ảnh màu mà 
không làm suy giảm chất lƣợng ảnh gốc [12]. 
Trong khi các thuật toán trong [6, 7] là cơ sở của 
phép nâng cao độ tƣơng phản các ảnh đa cấp xám, 
chúng không đảm bảo hiệu quả khi áp dụng trực tiếp 
cho ảnh màu do một số nguyên nhân sau: 
(i) Ảnh nâng cao độ tƣơng phản không thay đổi 
mức độ sáng của màu so với ảnh gốc. 
Khi áp dụng thuật toán [7] trên kênh V của ảnh 
màu trong biểu diễn màu HSV, chúng tôi nhận thấy 
với nhiều ảnh màu, đặc biệt là các ảnh tối, các điểm 
ảnh nhƣ vậy có thể chiếm rất nhiều. Do đó ảnh đƣợc 
nâng cao sẽ không thay đổi mức sáng ở những vùng 
này và không khác biệt với ảnh gốc nếu chỉ dựa trên 
cảm nhận bằng mắt. 
Hình 1. Ảnh kết quả khi sử dụng [7] cho ảnh #1 (Xem 
hình 5) 
(ii) Chi tiết của ảnh gốc bị suy giảm. 
Trong [6], các tác giả đề xuất một thuật toán sử 
dụng hàm S-function có tham số để biến đổi ảnh đa 
cấp xám I đầu vào sau đó nâng cao độ tƣơng phản của 
ảnh biến đổi theo phƣơng pháp trực tiếp. 
  ( , ) ( , , ) ( ( , ); , , ) ,opt optI I i j SI a b c S func I i j a b c (1) 
trong đó a, bopt và c là các tham số đƣợc ƣớc lƣợng tự 
động khi khảo sát các đỉnh histogram và dựa trên 
nguyên lý cực đại fuzzy entropy: 
 
[ 1, 1]
( ; , , ) ,argmaxopt
b a c
b H I a b c
 (2) 
và H là độ đo fuzzy entropy thông dụng (xem công 
thức (33), mục IV.3). 
Hình 2. Ảnh biến đổi sử dụng hàm S-function bị mất 
chi tiết [6]. 
Hình 2 chứng tỏ khi áp dụng phép biến đổi dạng S-
function ở trên cho từng kênh R, G và B của ảnh #1 
chúng ta sẽ nhận đƣợc một ảnh bị mất chi tiết nhƣ đã 
đƣợc thể hiện ở vùng đánh dấu chữ nhật. Điều này 
cũng xảy ra khi áp dụng biến đổi này cho kênh V 
trong biểu diễn màu HSV của ảnh #1. 
Phần còn lại của bài báo đƣợc tổ chức nhƣ sau: 
Phần II, trình bày một số nghiên cứu liên quan của 
thuật toán nâng cao độ tƣơng phản theo hƣớng trực 
tiếp của Cheng và cộng sự; Phần III là đề xuất thuật 
toán sử dụng phân cụm mờ để ƣớc lƣợng nhiều 
khoảng động mức xám, xây dựng hàm biến đổi kênh 
ảnh trƣớc khi tính độ tƣơng phản điểm ảnh và thuật 
toán nâng cao độ tƣơng phản ảnh màu trong biểu diễn 
màu HSV; Các kết quả thực nghiệm trình bày trong 
phần IV; Kết luận đƣợc đƣa ra ở phần V. 
II. NGHIÊN CỨU LIÊN QUAN 
Bảng 1 liệt kê một số kí hiệu đƣợc sử dụng trong 
bài báo này. 
Bảng 1. Các ký hiệu và các định nghĩa của nó 
Ký hiệu Định nghĩa 
I Ảnh RGB nói chung 
M, N 
M x N là kích thƣớc theo pixel của ảnh 
đầu vào. 
IR, IG, IB 
Kênh ảnh R,G và B của ảnh màu trong 
biểu diễn màu RGB. 
Các công trình nghiên cứu phát triển CNTT và Truyền thông Tập V-1, Số 17 (37), tháng 6/2017 
 - 61 - 
IS, IH, IV 
Kênh ảnh H,S và V của ảnh màu trong 
biểu diễn màu HSV 
Lk, min, 
Lk, max 
Miền giá trị mức xám của kênh ảnh thứ 
k của ảnh đầu vào, thông thƣờng Lk, min 
= 0, Lk, max = 255. 
d 
d x d là kích thƣớc cửa sổ lân cận của 
điểm ảnh. 
Eij 
Các giá trị gradient lấy tại điểm ảnh (i, 
j) đƣợc chuẩn hóa về miền [0, 1] theo 
một toán tử tìm kiếm biên chẳng hạn 
toán tử Sobel. 
Hij 
Giá trị entropy địa phƣơng lấy tại điểm 
ảnh (i, j) đƣợc chuẩn hóa về miền [0, 1]. 
Vij 
Độ lệch chuẩn trung bình mức xám lấy 
tại điểm ảnh (i, j) đƣợc chuẩn hóa về 
miền [0, 1] 
R4,ij 
Giá trị moment bậc 4 lấy tại điểm ảnh 
(i, j) đƣợc chuẩn hóa về miền [0, 1] 
HOij 
Giá trị kết nhập dạng f(Eij, Hij, Vij, 
R4,ij)[7] 
ij Giá trị thuần nhất tại điểm ảnh (i, j) 
ij 
Giá trị trung bình không thuần nhất tại 
điểm ảnh (i, j) 
ξij Số mũ khuếch đại tại (i, j) 
t 
t (0,1): Tham số của phép nâng độ 
khuếch đại 
f1,f2 
f1, f2 (0, 1): Tham số xác định dải 
động mức xám [7] 
K Số kênh ảnh cần xử lý của ảnh đầu vào 
C 
Số cụm cần phân cụm của tổ hợp kênh 
ảnh đầu vào. 
i,j,c 
Giá trị độ thuộc cụm thứ c của điểm ảnh 
(i, j), đầu ra của thủ tục phân cụm FCM 
fcut 
fcut (0, 1): Tham số xác định C dải 
động mức xám của một kênh ảnh (mục 
III) 
II.1. Độ tƣơng phản trực tiếp tại từng điểm ảnh 
Thông thƣờng, độ tƣơng phản chỉ sự chênh lệch về 
độ sáng giữa một đối tƣợng (ký hiệu là f) và vùng 
xung quanh của nó (ký hiệu là b). Tƣơng tự nhƣ [6, 
7], trong bài báo này chúng ta cũng sử dụng độ đo 
tƣơng phản sau: 
f b
C
f b
 (3) 
Nâng cao độ tƣơng phản theo phƣơng pháp trực 
tiếp, theo [6, 7] là việc thực hiện một dãy biến đổi 
, , ,( , ) f b new new f bf b C C f , 0 ≤ Cf,b ≤ Cnew ≤ 1 và 
, ,
1
,
1
1
,
1
new
new
new f b
new
new
C
b f b
C
f
C
b f b
C
(4) 
II.2. S-function 
Trong lý thuyết tập mờ, Zadeh đã định nghĩa một 
toán tử tăng cƣờng gọi là INT (intensification), và 
dạng tổng quát của nó đƣợc gọi là S-function [7], 
đƣợc xác định nhƣ sau: 
2
2
0, 0
,
( ; , , )
1 ,
1,
x a
x a
a x b
b a c a
S x a b c
x c
b x c
c b c a
c x
(5) 
Trong [6] Cheng và cộng sự đã sử dụng hàm S-
function để chuyển một ảnh xám sang miền fuzzy, sau 
đó nghiên cứu nâng cao độ tƣơng phản của ảnh trong 
miền fuzzy. 
Trong [7] đề xuất xây dựng phép nâng cao độ 
tƣơng phản trực tiếp của ảnh đa cấp xám dựa trên các 
đặc trƣng địa phƣơng của điểm ảnh. Đây là phƣơng 
pháp gốc đƣợc dùng phát triển các thuật toán sẽ đƣợc 
đề xuất trong phần III. 
II.3. Ƣớc lƣợng độ sáng nền và độ tƣơng phản 
điểm ảnh 
Phép nâng cao độ tƣơng phản trực tiếp của một 
ảnh xám đƣợc công bố trong [7] có thể đƣợc tóm tắt 
nhƣ sau: 
Giả sử gij là mức xám của một điểm ảnh I(i,j) at 
của ảnh đa cấp xám I kích thƣớc M × N, và Wij cửa sổ 
lân cận tại (i, j) kích thƣớc d × d. Thực hiện tuần tự 
các bƣớc sau: 
Bƣớc 1: Tính các tham số địa phƣơng đƣợc chuẩn hóa 
giá trị về đoạn [0, 1], gradient Eij, entropy Hij, trung 
bình độ lệch chuẩn Vij, và moment bậc 4 R4,ij: 
1.1: Tính cƣờng độ biên ảnh: 
e = {eij} là giá trị cƣờng độ biên ảnh xám đầu vào 
bằng một toán tử xác định ảnh biên nhƣ toán tử Sobel. 
Các công trình nghiên cứu phát triển CNTT và Truyền thông Tập V-1, Số 17 (37), tháng 6/2017 
 - 62 - 
1.2: Giá trị trung bình, độ lệch chuẩn 
 = {ij}, v = {vij}, trong đó ij là giá trị trung bình 
mức xám, vij là độ lệch chuẩn mức xám lấy tại lân cận 
điểm ảnh gij 
ij( , ) W
ij 2
pq
p q
g
d


, 
ij
2
ij
( , ) W
ij 2
pq
p q
g
v
d


(6) 
1.3: Tính giá trị entropy địa phƣơng 
1
ij
log
2log
L
k k
k
p p
h
d

, 
 ij ,
2
# ( , ) W : p q
k
p q g k
p
d
(7) 
1.4: Tính moment bậc 4 
ij
4
ij
( , ) W
4,ij 2 1
pq
p q
g
d



(8) 
1.5: Chuẩn hóa về miền giá trị là đoạn [0, 1] 
 
ij
ij
ijmax
e
E
e
 , 
 
ij
ij
ijmax
v
V
v
 
ij
ijmax
ij
h
H
h
 ,
 
4,ij
4,
4,ijmax
ijR


(9) 
Bƣớc 2: Tính giá trị độ thuần nhất của điểm ảnh và 
giá trị mức xám không thuần nhất 
2.1: Tính giá trị đo độ thuần nhất tại điểm ảnh 
ij
ij
ij
,
max
HO
HO
 
(10) 
trong đó 
ij 4
ij 4,
* * *
1 * 1 * 1 * 1
ij ij ij
ij ij ij
HO E V H R
E V H R
 
(11) 
2.2: Tính giá trị mức xám không thuần nhất (non-
homogeneity gray value [7]) 
ij
ij
( , ) W
ij
( , ) W
(1 )
(1 )
pq pq
p q
pq
p q
g 




(12) 
Bƣớc 3: Tính giá trị độ tƣơng phản tại từng điểm ảnh 
và số mũ khuếch đại 
3.1: Giá trị độ tƣơng phản 
ij ij
ij
ij ij
g
C
g


(13) 
3.2: Số mũ khuếch đại 
 ax min ij min
ij min
ax min
*
,
m
m
   
 
 
(14) 
trong đó: 1
min
ax 1
k
m
g g
g g

, max 1 , gk, g1 
(15) 
là các đỉnh của histogram đƣợc xác định theo [3] 
3.3: Nâng độ tƣơng phản 
ij'
ij ij ,
t
C C (16) 
trong đó tham số t {0.25, 0.5} [7] 
3.4: Tính giá trị mức xám mới tại từng điểm ảnh 
ij
ij
ij
ij
'
ij ij
ij ij ij ij'
ij ij'
ij
'
ij ij
ij ij ij ij'
ij ij
1 1
,
1 1
1 1
,
1 1
t
t
t
t
C C
g
C C
g
C C
g
C C




  
  
(17) 
Thuật toán [6, 7] thỏa mãn điều kiện sau: Tại từng 
điểm ảnh, độ thuần nhất càng cao thì mức độ nâng 
tƣơng phản càng thấp. 
Hình 3. Đồ thị số mũ khuếch đại của [7] (gần tuyến 
tính) 
Nhƣ đã đề cập trong phần I, đối với ảnh tối, thuật 
toán nâng cao độ tƣơng phản trực tiếp trên không thay 
đổi đƣợc độ sáng của ảnh. Để giải quyết vấn đề thay 
đổi độ sáng của ảnh sau khi tăng cƣờng độ tƣơng phản 
(địa phƣơng) chúng tôi đề xuất xây dựng một biến đổi 
ảnh F của từng kênh ảnh xám của tổ hợp kênh ảnh đầu 
vào. Khi đó độ tƣơng phản đƣợc tính công thức (13) 
sẽ đƣợc thay đổi thành: 
ij
ij
ij
(i, j) ( )
,
( , ) ( )
F F
C
F i j F


(18) 
ở đây ta đồng nhất biến đổi F với ảnh {F(i, j)}. 
Các công trình nghiên cứu phát triển CNTT và Truyền thông Tập V-1, Số 17 (37), tháng 6/2017 
 - 63 - 
Trong [6], các tác giả cũng đã xây dựng một biến 
đổi mờ hóa ảnh áp dụng cho quy trình nâng cao độ 
tƣơng phản trực tiếp. Nhƣ đã phân tích ở phần I, biến 
đổi ảnh này có thể làm mất chi tiết ảnh. Để chi tiết 
chúng tôi sẽ tóm lƣợc lại phép mờ hóa kênh ảnh của 
[7] nhƣ mục sau: 
II.4. Ƣớc lƣợng dải động mức xám và biến đổi - mờ 
hóa ảnh sử dụng S-function 
Dựa trên histogram của ảnh, trong [6, 7] các tác 
giả đã nhận thấy đỉnh đầu tiên của histogram của ảnh 
liên quan đến vùng nền và mức xám lớn hơn đỉnh sau 
cùng có thể là nhiễu. Vì vậy các tác giả đã đề xuất 
cách xác định một dải động của mức xám nhƣ sau: 
Đặt 
ax
1
ax
is ( )
is ( ) ,
k
m i
i
m
H g
H g
k

(19) 
trong đó k là số điểm cực đại địa phƣơng) của 
histogram, Hismax(g1), , Hismax(gk) là các điểm cực 
đại địa phƣơng của histogram, g1, gk là điểm cực đại 
địa phƣơng đầu tiên và sau cùng tƣơng ứng sao cho: 
Hismax(g1) axis ( ),mH g Hismax(gk) axis ( )mH g 
(20) 
Dải động mức xám là đoạn [a, c] ở đó 
a = min{(1 - f2)(g1 - Lmin) + Lmin, B1} 
c = max{f2(Lmax - gk) + gk, B2}, 
(21) 
trong đó B1, B2 đƣợc xác định : 
ax1
min min
1is( ) is( )
mLB
i L i L
H i f H i
   
ax ax
2 min
1is( ) is( ),
m mL L
i B i L
H i f H i
   
(22) 
và Lmin, Lmax là giá trị mức xám nhỏ nhất và lớn nhất 
của kênh ảnh, các hằng số f1 = 0.01, f2 = 0.5 đƣợc xác 
định bằng thực nghiệm. 
Từ dải động mức xám [a, c] đã ƣớc lƣợng trên, 
trong [6] đã trình bày một thuật toán để mờ hóa ảnh 
đầu vào trƣớc khi nâng cao độ tƣơng phản của ảnh 
đầu vào. 
III. KỸ THUẬT ĐỀ XUẤT 
Phần này trình bày kỹ thuật ƣớc lƣợng các dải 
động của mức xám sử dụng phân cụm mờ FCM, phép 
biến đổi kênh ảnh và kỹ thuật nâng cao độ tƣơng phản 
của ảnh màu xét trong biểu diễn màu HSV. 
III.1. Ƣớc lƣợng nhiều dải động mức xám dựa 
vào phân cụm mờ FCM 
Phân cụm mờ c-mean (FCM [4]), đƣợc sử dụng 
hiệu quả trong một số nghiên cứu về nâng cao độ 
tƣơng phản của ảnh một kênh. 
Trong [16] đã trình bày một cách xác định dải 
động của miền giá trị mức xám bằng cách sử dụng 
thuật toán phân cụm mờ FCM, khi đó các cụm ảnh có 
tính chất đều hơn, và do đó việc xác định dải động 
mức xám là tƣơng đối dễ dàng. Ngoài ra trong [15] 
các tác giả cũng sử dụng FCM để phân đoạn 
histogram và nâng cao độ tƣơng phản theo bộ phận 
của histogram. 
 Để có thể ƣớc lƣợng tự động dải động mức xám 
cho nhiều loại ảnh khác nhau nhƣ ảnh tối, ảnh sáng, 
ảnh có độ tƣơng phản thấp và ảnh có độ tƣơng phản 
cao, chúng tôi đề xuất sử dụng phân cụm mờ để ƣớc 
lƣợng dải động của mức xám của từng kênh ảnh của 
ảnh đa kênh. Lƣu ý rằng trong một số biểu diễn màu 
nhƣ biểu diễn màu RGB, các kênh ảnh là không độc 
lập mà có độ tƣơng quan cao, vì thế cách làm ƣớc 
lƣợng dải động của từng kênh ảnh độc lập là không 
h ... 1
t
t
t
t
C
I i j
C
i j
C
I i j
C




 
 
V,ij
V,ij
V,ij
V,ij
V,ij
V,ij V V,ij
V,ij
,
V,ij
V,ij V V,ij
V,ij
1
, ( , )
1
( , )
1
, ( , )
1
t
t
t
t
V new
C
I i j
C
I i j
C
I i j
C




 
 
Bƣớc 4: Chuyển đổi ảnh (IH, IS,new, IV,new) trong biểu 
diễn màu HSV về biểu diễn màu RGB, ta đƣợc ảnh 
Inew. 
Bƣớc 5: Bƣớc tùy chọn, tính các chỉ số CM{R,G,B} cho 
kênh R, G và B, Eavg và Havg nhƣ sau: 
5.1: Tính tham số của [7] cho kênh IR, IG và IB của 
ảnh gốc I nhƣ đã trình bày trong mục II.3 (xem các 
công thức tử (6) đến (12) với kích thƣớc cửa sổ dxd, 
cụ thể là các giá trị mức xám không thuần nhất {δR,ij}, 
{δG,ij}, và {δB,ij} của các ảnh đa cấp xám IR, IG và IB 
tƣơng ứng. 
5.2: Tính CMR, CMG, CMB theo công thức (31), cụ 
thể là: 
, ,ij
ij , ,ij
( , )
( , )
*
new R R
new R R
R
I i j
I i j
CM
M N



, ,ij
ij , ,ij
( , )
( , )
*
new G G
new G G
G
I i j
I i j
CM
M N



, ,ij
ij , ,ij
( , )
( , )
*
new B B
new B B
B
I i j
I i j
CM
M N



5.3: Tính Eavg = Eavg{Inew,R, Inew,G, Inew,B} theo công 
thức (32). Tính Havg = Havg{Inew,R, Inew,G, Inew,B} theo 
công thức (35) 
Trả về: Inew, và các tùy chọn trả về 
CMR, CMG, CMB , Eavg , Havg 
Bảng 2 là giá trị chỉ số của các ảnh #1 - #6, đƣợc 
tính từ các công thức (31) đến (35). 
Bảng 2. Giá trị chỉ số ảnh thể hiện. 
Ảnh CMR CMG CMB Eavg Havg 
#1 0.1180 0.1914 0.2482 5.9395 0.3456 
#2 0.0160 0.0191 0.0314 7.315 0.8216 
#3 0.0154 0.0188 0.0548 7.4847 0.8001 
#4 0.0256 0.0298 0.0511 7.4536 0.8642 
#5 0.0170 0.0293 0.0345 7.3092 0.8504 
#6 0.0273 0.0304 0.0364 3.4443 0.2861 
Các công trình nghiên cứu phát triển CNTT và Truyền thông Tập V-1, Số 17 (37), tháng 6/2017 
 - 70 - 
IV.4. Các kết quả và luận giải 
Trong phần này chúng tôi trình bày hai kiểm thử, 
chúng bao gồm: 
(A) Phép mờ hóa - biến đổi ảnh sử dụng phân cụm 
mờ cho tổ hợp kênh ảnh 
(B) Thử nghiệm nâng cao độ tương phản sử dụng 
biến đổi ảnh trên 2 kênh ảnh (kênh S và kênh V) trong 
biểu diễn màu HSV. 
A. Thực nghiệm để kiểm tra hiệu quả của Phép mờ 
hóa-biến đổi ảnh sử dụng phân cụm mờ cho tổ hợp 
kênh ảnh so với phép mờ hóa của [7]. 
Trong thử nghiệm này, trên từng kênh ảnh riêng rẽ 
R, G và B chúng tôi thực hiện phép mờ hóa bằng biến 
đổi S-function đƣợc xây dựng trong [6]. 
Hàm biến đổi S(x; a, b, c) với các tham số a và c 
đƣợc xác định dựa trên phân tích histogram của kênh 
ảnh và tham số b đƣợc dò tìm bằng phép cực đại hóa 
fuzzy entropy. 
Thuật toán 1 của chúng tôi thực hiện đồng thời cho 
3 kênh ảnh R, G và B, tham số f1, f2 để ƣớc lƣợng 
khoảng động mức xám [B1,c,k B2,c,k] của từng cụm c 
ứng với kênh R, G và B đƣợc xác định dựa trên thực 
nghiệm, fcut = 0.005. Thuật toán phân cụm tập vector 
giá trị điểm ảnh {IR(i, j), IG(i, j), IB(i, j)} sử dụng số 
cụm C [2,10]. Trong thực nghiệm này chúng tôi 
chọn C = 5. 
Bảng 3. So sánh giá trị Havg trên kênh R, G và B của 
các ảnh là kết quả của phép mờ hóa – biến đổi ảnh 
Ảnh Havg 
(sử dụng [7]) 
Havg 
(sử dụng thuật toán 1) 
#1 0.4478 0.4950 
#2 0.6931 0.7879 
#3 0.5736 0.7200 
#4 0.5822 0.7624 
#5 0.6227 0.8157 
#6 0.3374 0.3512 
Bảng 3 cho chúng ta thấy độ không chắc chắn của 
phép mờ hóa sử dụng nhiều dải động mức xám của 
thuật toán đề xuất 1 cao hơn so với phƣơng pháp sử 
dụng một dải động mức xám của [6]. Điều này cũng 
phù hợp với trực quan khi quan sát các ảnh mờ hóa 
minh họa của #1 và #2. 
(a) 
(b) 
Hình 9. (a) Ảnh mờ hóa của ảnh #1 sử dụng [6]; 
(b) Ảnh kết quả sử dụng thuật toán đề xuất 1 
Trên hình ảnh mờ hóa của ảnh #1 sử dụng biến đổi 
của [6], chúng ta thấy rõ chi tiết ảnh ở các vùng đƣợc 
đánh dấu hình chữ nhật là bị mất, trong khi đó ảnh 
biến đổi sử dụng nhiều dải động ƣớc lƣợng từ phân 
cụm FCM cho tổ hợp kênh RGB (thuật toán 1) chi tiết 
ảnh đƣợc giữ tốt hơn. 
Quan sát các kênh G và B của ảnh biến đổi của ảnh 
#2 sau đây ta cũng thấy độ chi tiết của ảnh biến đổi sử 
dụng [6] cũng bị suy giảm nhiều hơn biến đổi ảnh dựa 
trên thuật toán 1 đã đề xuất. 
(a) 
(b) 
(c) 
(d) 
Hình 10. Kênh G và kênh B của ảnh biến đổi sử 
dụng [6] (a), (c). Kênh G và kênh B của ảnh biến đổi 
sử dụng thuật toán 1 (b), (d). 
Phân tích trên lại cho thấy việc biến đổi của [6] chỉ 
sử dụng chỉ một bộ tham số {a, bopt, c} liên quan đến 
dải động mức xám của kênh ảnh cho một dạng hàm 
biến đổi nhƣ S-function để biến đổi ảnh có thể làm 
mất chi tiết ảnh. Trái lại, phƣơng pháp sử dụng nhiều 
dải động của mức xám {B1,c,k, B2,c,k} đƣợc ƣớc lƣợng 
Các công trình nghiên cứu phát triển CNTT và Truyền thông Tập V-1, Số 17 (37), tháng 6/2017 
 - 71 - 
từ histogram mờ, nhƣ của thuật toán 1 đã giữ đƣợc chi 
tiết ảnh tốt hơn. 
(a) 
(b) 
Hình 11. Sử dụng biến đổi ảnh [6] với một dải động 
mức xám cho ảnh #3(a), #5 (b) và áp dụng [7]. 
Trên Hình 11, các ảnh kết quả minh họa bị mất chi tiết 
ảnh, xem ở các vùng chữ nhật đánh dấu. Điều đó 
chứng tỏ sự hạn chế của việc chỉ dùng một dải động 
mức xám cho các biến đổi ảnh. 
B. Thử nghiệm nâng cao độ tƣơng phản sử dụng 
thuật toán đề xuất 2 trên hai kênh ảnh S và V trong 
biểu diễn màu HSV của ảnh đầu vào so với sử dụng 
thủ tục 1 (dựa vào thuật toán gốc). 
Trong thử nghiệm này, chúng tôi thực hiện kiểm 
tra hiệu quả của thuật toán 2 đề xuất sử dụng phép 
phân cụm FCM để xác định tham số cho phép biến 
đổi ảnh trong định nghĩa 3.2, công thức (27) so với sử 
dụng thủ tục 1 trên 2 kênh ảnh S và V riêng rẽ. Các 
bƣớc đƣợc thực hiện nhƣ sau: 
 Đầu tiên, chuyển biểu diễn màu RGB sang biểu 
diễn màu HSV của ảnh đầu vào. Phân cụm dữ liệu 
mức xám tổ hợp kênh S và kênh V với tham số đƣợc 
chọn nhƣ trong thử nghiệm A (số cụm C = 5 v.v). 
trên từng kênh ảnh S và kênh V riêng rẽ ƣớc lƣợng 
{B1,c,k, B2,c,k} (k {S, V}) và thực hiện biến đổi ảnh 
cho kênh S và kênh V tƣơng ứng sử dụng hàm biến 
đổi FS, FV (công thức (27)) có tham số của các hàm 
biến đổi là các dải động mức xám ƣớc lƣợng từ thuật 
toán 1. 
 Thứ hai, xác định giá trị độ tƣơng phản theo 
thuật toán 2 và các bƣớc liên quan cho kênh ảnh S và 
V đã biến đổi ở bƣớc thứ nhất với kích thƣớc cửa sổ 
3x3 và tham số t = 0.25 (công thức (16)). 
 Thứ ba, tổng hợp lại các kênh ảnh H gốc, kênh 
S và kênh V đã nâng cao độ tƣơng phản, sau đó biến 
đổi ngƣợc từ biểu diễn HSV sang biểu diễn RGB. 
 Cuối cùng, tính giá trị mức xám không thuần 
nhất tại từng điểm ảnh ứng với các kênh ảnh R, G và 
B (các giá trị này đƣợc dùng để tính độ đo tƣơng phản 
trung bình trên từng kênh R, G và B trong bảng 4). 
Giá trị trung bình độ tƣơng phản trực tiếp CM 
đƣợc tính trên kênh R, G và B trong biểu diễn màu 
RGB của ảnh đầu vào đƣợc tính với ảnh giá trị mức 
xám trung bình không thuần nhất của từng kênh R, G 
và B của ảnh RGB gốc và ảnh kết quả đầu ra khi sử 
dụng thủ tục 1 và phƣơng pháp đề xuất (thuật toán 2) 
đƣợc thể hiện ở Bảng 4. 
Bảng 4. Kết quả chỉ số ảnh đầu ra của thủ tục 1(gốc), 
và thuật toán 2 đề xuất trên từng kênh ảnh R, G và B. 
Ảnh 
CMR CMG CMB 
Thủ tục 
1 gốc 
Thuật 
toán 2 
Thủ tục 
1 gốc 
Thuật 
toán 2 
Thủ tục1 
gốc 
Thuật 
toán 2 
#1 0.1244 0.2143 0.1961 0.2575 0.2511 0.3373 
#2 0.0157 0.1676 0.0193 0.1685 0.0320 0.1728 
#3 0.0155 0.2157 0.0192 0.2166 0.0543 0.2351 
#4 0.0284 0.1232 0.0338 0.1254 0.0570 0.1385 
#5 0.0170 0.0967 0.0299 0.1003 0.0352 0.1033 
#6 0.0275 0.0861 0.0307 0.0879 0.0375 0.0870 
Bảng 5. Kết quả chỉ số ảnh đầu ra của thủ tục 1(gốc), 
và thuật toán 2 đề xuất trên từng kênh ảnh R, G và B. 
Ảnh 
Eavg Havg 
Thủ tục 
1 gốc 
Thuật 
toán 2 
Thủ tục 
1 gốc 
Thuật 
toán 2 
#1 5.8446 6.1855 0.3456 0.3077 
#2 6.8158 7.2568 0.8216 0.7004 
#3 6.9599 7.0051 0.8001 0.6737 
#4 7.2337 7.4179 0.8642 0.7947 
#5 7.0103 7.5376 0.8504 0.8233 
#6 3.0140 4.0173 0.2868 0.2861 
Bảng 4 và 5 của kết quả thực nghiệm của các ảnh 
#1 - #6 đã thể hiện các chỉ số khách quan độ tƣơng 
phản trực tiếp trên từng kênh R, G và B khi sử dụng 
thuật toán 2 đều cho kết quả cao hơn khi sử dụng 
thuật toán [7]. Chỉ số khách quan Eavg khi áp dụng 
thuật toán 2 cũng cao hơn so với áp dụng thủ tục 1. 
Cũng vậy, chỉ số khách quan Havg khi áp dụng thuật 
toán 2, ngoài ảnh #1, đều có giá trị nhỏ hơn so với chỉ 
số ảnh kết quả khi áp dụng thủ tục 1. 
Các công trình nghiên cứu phát triển CNTT và Truyền thông Tập V-1, Số 17 (37), tháng 6/2017 
 - 72 - 
(a) 
(b) 
(c) 
(d) 
(e) 
(g) 
(h) 
(k) 
(l) 
(m) 
(n) 
(p) 
Hình 12. Ảnh kết quả (các ảnh cột bên trái ) sử dụng [7] 
Ảnh kết quả (các ảnh cột bên phải) sử dụng thuật toán 2. 
V. KẾT LUẬN 
Trong bài báo này chúng tôi đã đề xuất 3 đóng góp 
mới cho phƣơng pháp nâng cao độ tƣơng phản ảnh 
màu theo tiếp cận trực tiếp. 
Thứ nhất, chúng tôi đề xuất một phƣơng pháp biến 
đổi ảnh mới sử dụng nhiều hàm S-function đƣợc tham 
số hóa ứng với từng dải động mức xám. Các dải động 
mức xám này đƣợc ƣớc lƣợng tự động bằng thuật toán 
phân cụm FCM. Phƣơng pháp này đƣợc so sánh trực 
tiếp với phƣơng pháp biến đổi sử dụng một hàm S-
function với tham số hóa dựa trên cực đại fuzzy 
entropy [6]. 
Thứ hai, chúng tôi cũng đề xuất một thuật toán 
mới theo phƣơng pháp nâng cao độ tƣơng phản trực 
tiếp cho ảnh màu dựa trên thuật toán trong [7]. 
Cuối cùng, là một cải tiến nhỏ để tăng độ trơn của 
các giá trị độ thuần nhất của điểm ảnh khi thay đổi 
cách kết nhập các giá trị địa phƣơng (tại từng điểm 
ảnh) nhƣ gradient, entropy, độ lệch chuẩn trung bình 
và moment bậc 4 so với cách kết nhập của [7]. 
Kết qủa thực nghiệm đã chứng tỏ rằng các kỹ thuật 
đề xuất của chúng tôi làm việc tốt với đa dạng ảnh 
màu. Ảnh nâng cao độ tƣơng phản trơn và sự thay đổi 
mức độ sáng trong khi vẫn bảo toàn chi tiết ảnh gốc 
tốt hơn so với phƣơng pháp đƣợc công bố trong [6, 7]. 
Độ sáng của các kênh ảnh sau khi nâng cao độ tƣơng 
phản tƣơng đồng với độ sáng ảnh đầu ra của các 
phƣơng pháp gián tiếp. Trong các nghiên cứu tiếp 
theo, chúng tôi sẽ tiếp tục nghiên cứu các dạng kết 
nhập khác của các đặc trƣng địa phƣơng nhƣ gradient, 
entropy, độ lệch trung bình và moment bậc 4 dạng 
HOij = f(Eij, Hij, Vij, R4,ij) khi tính độ thuần nhất tại 
từng điểm ảnh. 
TÀI LIỆU THAM KHẢO 
[1] S. S. Agaian, S. Blair and K. A. Panetta, 
“Transform coefficient histogram-based image 
enhancement algorithms using contrast entropy”, 
IEEE Trans. Image Processing, vol. 16, no. 3, (2007): 
741-758. 
[2] Arici T., Dikbas S., and Altunbasak Y., “A 
Histogram Modification Framework and Its 
Application for Image Contrast Enhancement,” IEEE 
Transactions on Image Processing, vol. 18, no. 9, 
(2009):1921-1935. 
Các công trình nghiên cứu phát triển CNTT và Truyền thông Tập V-1, Số 17 (37), tháng 6/2017 
 - 73 - 
[3] A. Beghdadi, A.L. Negrate, “Contrast 
enhancement technique based on local detection of 
edges”, Comput. Vision Graphics Image Process. 46 
(1989):162–174. 
[4] Bezdek, James C. Pattern recognition with fuzzy 
objective function algorithms. Springer Science & 
Business Media, (2013). 
[5] A.O. Boudraa and E. H. S. Diop, “Image contrast 
enhancement based on 2D teager-kaiser operator”, 
Proc. of the IEEE International Conference on Image 
Processing, (2008.): 3180-3183. 
[6] Cheng H.D, Huijuan Xu, “A novel fuzzy logic 
approach to contrast enhancement”, Pattern 
Recognition 33 (2000):809-819. 
[7] Cheng H.D., Mei Xue, Shi X,J., “Contrast 
enhancement based on a novel homogeneity 
measurement”, Pattern Recognition 36 (2003):2687 – 
2697. 
[8] L.Dash, B.N. Chatterji, “Adaptive contrast 
enhancement and de-enhancement” , Pattern 
Recognition 24 (1991) :289–302. 
[9] A.P. Dhnawan, G. Buelloni, R. Gordon, 
Enhancement of mammographic features by optimal 
adaptive neighborhood image processing, IEEE 
Trans. Med. Imaging 5 (1986):8–15. 
[10] M. M. Gupta, J. Qi, “Theory of T-norms and fuzzy 
inference methods”, Fuzzy Sets and Systems 40, 
(1991):431-450. 
[11] Hanmandlu M., Devendra Jha, Rochak, 
“Color image enhancement by fuzzy intensification”, 
Pattern Recognition Letters 24 (2003):81–87. 
[12] Hanmandlu M, Devendra Jha, “An Optimal 
Fuzzy System for Color Image Enhancement”, IEEE 
Transactiong on Image Processiong, Vol. 15, No.10 
(2006): 2956-2966. 
[13] S. Lee, “An efficient content-based image 
enhancement in the compressed domain using Retinex 
theory”, IEEE Trans. Circuits and Systems for Video 
Technology, vol. 17, no. 2, pp. (2007):199-213. 
[14] Ponomarenko N. Ponomarenko, L. Jin, O. 
Ieremeiev, V. Lukin, K. Egiazarian, J. 
Astola, B. Vozel, K. Chehdi, M. Carli, 
F.Battisti, C.-C. Jay Kuo, “Image database 
TID2013: Peculiarities, results and perspectives, 
Signal Processing”, Imag Communication, vol. 30, 
Jan. (2015):57-77. 
[15] M. Shakeri, M.H. Dezfoulian, H. 
Khotanlou, A.H. Barati, Y. Masoumi, 
Image contrast enhancement using fuzzy clustering 
with adaptive cluster parameter and sub-histogram 
equalization, Digital Signal Processing 62, (2017) 
:224–237. 
[16] Shen-Chuan Tai, Ting-Chou Tsai, Yi-Ying 
Chang, Wei-Ting Tsai and Kuang-Hui 
Tang, “Contrast Enhancement through Clustered 
Histogram Equalization”, Research Journal of 
Applied Sciences, Engineering and Technology 4(20), 
(2012):3965-3968, ISSN: 2040-7467. 
[17] M. J. Soha and A. A. Schwartz, “Multi-
dimensional histogram normalization contrast 
enhancement,” in Proc. 5th Canad. Symp.. Remote 
Sensing, (1978):86–93. 
Nhận bài ngày: 12/01/2017 
Các công trình nghiên cứu phát triển CNTT và Truyền thông Tập V-1, Số 17 (37), tháng 6/2017 
 - 74 - 
SƠ LƢỢC VỀ TÁC GIẢ 
NGUYỄN VĂN QUYỀN 
Sinh năm 1979 tại Hải Phòng. 
Nhận bằng thạc sĩ chuyên ngành 
Khoa học máy tính tại trƣờng ĐH 
Sƣ phạm Hà Nội, năm 2008 
Đang là NCS tại Viện CNTT – 
Viện Hàn lâm KH&CN Việt Nam 
Hiện công tác tại Phòng QLSĐH, 
trƣờng ĐH Hải Phòng 
Lĩnh vực nghiên cứu: Xử lý ảnh, khai phá dữ liệu, tính 
toán mềm 
Điện thoại: 0904.815.444 
Email: quyenqlkh.dhhp@gmail.com 
TRẦN THÁI SƠN 
Sinh năm 1955, tại Nghệ An 
Nhận học vị tiến sĩ năm 1990, tại 
Viện hàn lâm Khoa học Liên Xô 
Hiện công tác tại Viện CNTT, 
Viện Hàn lâm KH&CN Việt Nam 
Lĩnh vực nghiên cứu: Lập luận 
xấp xỉ, tính toán mềm 
Điện thoại: 0903409894 
Mail: ttson@ioit.ac.vn 
NGUYỄN TÂN ÂN 
Sinh năm 1953 tại Hà Nội. 
Nhận bằng tiến sĩ năm 2002, tại 
trƣờng ĐH Năng lƣợng Maxcơva; 
nhận học hàm PGS năm 2012 tại 
Viêt Nam. 
Hiện công tác tại Khoa CNTT, 
Học viện Quản lý Giáo dục. Lĩnh 
vực nghiên: Trí tuệ nhân tạo, Mạng nơron nhân tạo, 
Tính toán mềm, Giáo dục tin học 
Điện thoại: 0912 321 559 
Email: nguyentanan@yahoo.com 
NGÔ HOÀNG HUY 
Sinh năm 1969 tại Hà Nội. 
Tốt nghiệp chuyên ngành Toán 
tin tại trƣờng ĐH Sƣ phạm Hà 
Nội năm 1990. 
Hiện công tác tại Viện CNTT, 
Viện Hàn lâm KH&CN Việt 
Nam 
Lĩnh vực nghiên cứu: Xử lý ảnh, 
Xử lý tiếng nói, Trí tuệ nhân 
tạo, Khai phá dữ liệu, Hệ thống nhúng. 
Điện thoại: 0904140022 
Email: huyngo3i@gmail.com 
ĐẶNG DUY AN 
Sinh năm 1974 tại Thái Nguyên. 
Nhận bằng thạc sĩ tại Đại học 
Thái Nguyên, năm 2014. 
Hiện công tác tại Công ty tập 
đoàn CDC CORP - Viện máy và 
Dụng cụ Công nghiệp - Bộ 
Công Thƣơng 
Lĩnh vực nghiên cứu: Trí tuệ 
nhân tạo, khai phá dữ liệu, hệ thống nhúng 
Điện thoại: 0913215111 
Mail: duyanimi@gmail.com 

File đính kèm:

  • pdfmot_phuong_phap_moi_nang_cao_do_tuong_phan_anh_mau_theo_huon.pdf