Một phương pháp mới nâng cao độ tương phản ảnh màu theo hướng tiếp cận trực tiếp
Nâng cao độ tương phản ảnh là một vấn đề quan
trọng trong xử lý và phân tích hình ảnh, là một bước
cơ bản trong phân đoạn ảnh. Các kỹ thuật thông dụng
nâng cao độ tương phản ảnh được phân loại theo hai
tiếp cận chính: (1) Các phương pháp gián tiếp [1, 2, 5,
12, 13, 17]; và (2) các phương pháp trực tiếp [6, 7].
Có rất nhiều kỹ thuật đã được đề xuất được tìm
thấy trong tài liệu tham khảo, hầu hết trong số đó là
phương pháp gián tiếp, chúng biến đổi histogram mà
không sử dụng bất kỳ một độ đo tương phản nào.
Các kỹ thuật biến đổi histogram được khai thác ở
nhiều khía cạnh như thuật toán khung biến đổi
histogram và thích nghi nội dung [2], biến đổi logarit
histogram [1], kỹ thuật cân bằng động histogram [5],
chuẩn hóa nhiều histogram [17], biến đổi Cosine rời
rạc [13], xây dựng toán tử tăng cường mở rộng của
toán tử INT của Zadeh để mờ hóa thông tin trong
miền không gian [12] v.v
Mặc dù vậy có rất ít các nghiên cứu theo phương
pháp trực tiếp trong đó biến đổi độ tương phản ảnh
dựa trên một độ đo tương phản xác định tại mỗi điểm
ảnh, chẳng hạn các nghiên cứu [9, 3, 8, 6, 7]. Trong
[9, 3], các kết quả đã chứng tỏ rằng phương pháp trực
tiếp có thể tạo ra các kỹ thuật nâng cao độ tương phản
hiệu quả.
Tóm tắt nội dung tài liệu: Một phương pháp mới nâng cao độ tương phản ảnh màu theo hướng tiếp cận trực tiếp
Các công trình nghiên cứu phát triển CNTT và Truyền thông Tập V-1, Số 17 (37), tháng 6/2017
- 59 -
Một phƣơng pháp mới nâng cao độ tƣơng phản ảnh
màu theo hƣớng tiếp cận trực tiếp
A New Method to Enhancement The Contrast of Color Images based on
Direct Method
Nguyễn Văn Quyền, Trần Thái Sơn, Nguyễn Tân Ân, Ngô Hoàng Huy, Đặng Duy An
Abstract: Image contrast enhancement techniques
have two mainly methods: indirect method and direct
method. While indirect methods only modify the
histogram without defining any specific contrast
measure, the direct methods establish a criterion of
contrast measurement and enhance the image by
improving the contrast measure. Among many direct
methods, only the studies by Cheng and Xu modified
the contrast at each point of grayscale image using a
contrast measure [6, 7].
In this paper we propose a new method for
enhancing the contrast of color images based on the
direct method. The experimental results demonstrate
that the combination of our proposed method with
Fuzzy C_Mean (FCM) clustering algorithms performs
well on different color images.
Keywords: Direct contrast enhancement,
homogeneity measure, contrast measure, FCM, S-
function, histogram, the dynamic range of gray, HSV,
entropy, fuzzy entropy, the image details.
I. GIỚI THIỆU
Nâng cao độ tƣơng phản ảnh là một vấn đề quan
trọng trong xử lý và phân tích hình ảnh, là một bƣớc
cơ bản trong phân đoạn ảnh. Các kỹ thuật thông dụng
nâng cao độ tƣơng phản ảnh đƣợc phân loại theo hai
tiếp cận chính: (1) Các phƣơng pháp gián tiếp [1, 2, 5,
12, 13, 17]; và (2) các phƣơng pháp trực tiếp [6, 7].
Có rất nhiều kỹ thuật đã đƣợc đề xuất đƣợc tìm
thấy trong tài liệu tham khảo, hầu hết trong số đó là
phƣơng pháp gián tiếp, chúng biến đổi histogram mà
không sử dụng bất kỳ một độ đo tƣơng phản nào.
Các kỹ thuật biến đổi histogram đƣợc khai thác ở
nhiều khía cạnh nhƣ thuật toán khung biến đổi
histogram và thích nghi nội dung [2], biến đổi logarit
histogram [1], kỹ thuật cân bằng động histogram [5],
chuẩn hóa nhiều histogram [17], biến đổi Cosine rời
rạc [13], xây dựng toán tử tăng cƣờng mở rộng của
toán tử INT của Zadeh để mờ hóa thông tin trong
miền không gian [12] v.v
Mặc dù vậy có rất ít các nghiên cứu theo phƣơng
pháp trực tiếp trong đó biến đổi độ tƣơng phản ảnh
dựa trên một độ đo tƣơng phản xác định tại mỗi điểm
ảnh, chẳng hạn các nghiên cứu [9, 3, 8, 6, 7]. Trong
[9, 3], các kết quả đã chứng tỏ rằng phƣơng pháp trực
tiếp có thể tạo ra các kỹ thuật nâng cao độ tƣơng phản
hiệu quả.
Nhƣ nhận xét ở trên, trong một thời gian dài cho
đến nay hầu nhƣ chỉ có các nghiên cứu của Cheng và
Xu [6, 7] là đề xuất một phƣơng pháp biến đổi độ
tƣơng phản tại mỗi điểm ảnh dựa trên định nghĩa một
độ đo tƣơng phản giữa độ sáng điểm ảnh và lân cận
xung quanh nó. Độ đo tƣơng phản của [6, 7] đƣợc xây
dựng dựa trên các đặc trƣng địa phƣơng nhƣ gradient,
entropy, độ lệch chuẩn trung bình và moment bậc 4 tại
từng điểm ảnh.
Ngay từ đầu, phƣơng pháp nâng cao độ tƣơng phản
này chỉ đƣợc thực hiện trong ảnh đa cấp xám. Mở
rộng những phƣơng pháp này để nâng cao độ tƣơng
phản của ảnh màu không phải là một nhiệm vụ dễ
dàng do gặp phải một số yếu tố, chẳng hạn nhƣ sự lựa
chọn một mô hình màu thích hợp để biểu diễn và xử
lý ảnh, ảnh hƣởng hệ thống thị giác của con ngƣời.
Các công trình nghiên cứu phát triển CNTT và Truyền thông Tập V-1, Số 17 (37), tháng 6/2017
- 60 -
Việc lựa chọn một mô hình màu là rất quan trọng
để cải thiện độ tƣơng phản của ảnh màu. Biểu diễn
màu RGB đƣợc sử dụng cho việc hiển thị màu sắc,
trong khi biểu diễn màu HSV là cho hệ thống thị giác
của con ngƣời. Trong mô hình màu HSV, kênh H biểu
diễn màu sắc, kênh S chỉ độ bão hòa, và kênh V là
cƣờng độ của màu. Bằng cách bảo toàn kênh H, chỉ
thay đổi kênh V hoặc thay đổi cả kênh S và kênh V,
chúng ta có thể nâng cao chất lƣợng ảnh màu mà
không làm suy giảm chất lƣợng ảnh gốc [12].
Trong khi các thuật toán trong [6, 7] là cơ sở của
phép nâng cao độ tƣơng phản các ảnh đa cấp xám,
chúng không đảm bảo hiệu quả khi áp dụng trực tiếp
cho ảnh màu do một số nguyên nhân sau:
(i) Ảnh nâng cao độ tƣơng phản không thay đổi
mức độ sáng của màu so với ảnh gốc.
Khi áp dụng thuật toán [7] trên kênh V của ảnh
màu trong biểu diễn màu HSV, chúng tôi nhận thấy
với nhiều ảnh màu, đặc biệt là các ảnh tối, các điểm
ảnh nhƣ vậy có thể chiếm rất nhiều. Do đó ảnh đƣợc
nâng cao sẽ không thay đổi mức sáng ở những vùng
này và không khác biệt với ảnh gốc nếu chỉ dựa trên
cảm nhận bằng mắt.
Hình 1. Ảnh kết quả khi sử dụng [7] cho ảnh #1 (Xem
hình 5)
(ii) Chi tiết của ảnh gốc bị suy giảm.
Trong [6], các tác giả đề xuất một thuật toán sử
dụng hàm S-function có tham số để biến đổi ảnh đa
cấp xám I đầu vào sau đó nâng cao độ tƣơng phản của
ảnh biến đổi theo phƣơng pháp trực tiếp.
( , ) ( , , ) ( ( , ); , , ) ,opt optI I i j SI a b c S func I i j a b c (1)
trong đó a, bopt và c là các tham số đƣợc ƣớc lƣợng tự
động khi khảo sát các đỉnh histogram và dựa trên
nguyên lý cực đại fuzzy entropy:
[ 1, 1]
( ; , , ) ,argmaxopt
b a c
b H I a b c
(2)
và H là độ đo fuzzy entropy thông dụng (xem công
thức (33), mục IV.3).
Hình 2. Ảnh biến đổi sử dụng hàm S-function bị mất
chi tiết [6].
Hình 2 chứng tỏ khi áp dụng phép biến đổi dạng S-
function ở trên cho từng kênh R, G và B của ảnh #1
chúng ta sẽ nhận đƣợc một ảnh bị mất chi tiết nhƣ đã
đƣợc thể hiện ở vùng đánh dấu chữ nhật. Điều này
cũng xảy ra khi áp dụng biến đổi này cho kênh V
trong biểu diễn màu HSV của ảnh #1.
Phần còn lại của bài báo đƣợc tổ chức nhƣ sau:
Phần II, trình bày một số nghiên cứu liên quan của
thuật toán nâng cao độ tƣơng phản theo hƣớng trực
tiếp của Cheng và cộng sự; Phần III là đề xuất thuật
toán sử dụng phân cụm mờ để ƣớc lƣợng nhiều
khoảng động mức xám, xây dựng hàm biến đổi kênh
ảnh trƣớc khi tính độ tƣơng phản điểm ảnh và thuật
toán nâng cao độ tƣơng phản ảnh màu trong biểu diễn
màu HSV; Các kết quả thực nghiệm trình bày trong
phần IV; Kết luận đƣợc đƣa ra ở phần V.
II. NGHIÊN CỨU LIÊN QUAN
Bảng 1 liệt kê một số kí hiệu đƣợc sử dụng trong
bài báo này.
Bảng 1. Các ký hiệu và các định nghĩa của nó
Ký hiệu Định nghĩa
I Ảnh RGB nói chung
M, N
M x N là kích thƣớc theo pixel của ảnh
đầu vào.
IR, IG, IB
Kênh ảnh R,G và B của ảnh màu trong
biểu diễn màu RGB.
Các công trình nghiên cứu phát triển CNTT và Truyền thông Tập V-1, Số 17 (37), tháng 6/2017
- 61 -
IS, IH, IV
Kênh ảnh H,S và V của ảnh màu trong
biểu diễn màu HSV
Lk, min,
Lk, max
Miền giá trị mức xám của kênh ảnh thứ
k của ảnh đầu vào, thông thƣờng Lk, min
= 0, Lk, max = 255.
d
d x d là kích thƣớc cửa sổ lân cận của
điểm ảnh.
Eij
Các giá trị gradient lấy tại điểm ảnh (i,
j) đƣợc chuẩn hóa về miền [0, 1] theo
một toán tử tìm kiếm biên chẳng hạn
toán tử Sobel.
Hij
Giá trị entropy địa phƣơng lấy tại điểm
ảnh (i, j) đƣợc chuẩn hóa về miền [0, 1].
Vij
Độ lệch chuẩn trung bình mức xám lấy
tại điểm ảnh (i, j) đƣợc chuẩn hóa về
miền [0, 1]
R4,ij
Giá trị moment bậc 4 lấy tại điểm ảnh
(i, j) đƣợc chuẩn hóa về miền [0, 1]
HOij
Giá trị kết nhập dạng f(Eij, Hij, Vij,
R4,ij)[7]
ij Giá trị thuần nhất tại điểm ảnh (i, j)
ij
Giá trị trung bình không thuần nhất tại
điểm ảnh (i, j)
ξij Số mũ khuếch đại tại (i, j)
t
t (0,1): Tham số của phép nâng độ
khuếch đại
f1,f2
f1, f2 (0, 1): Tham số xác định dải
động mức xám [7]
K Số kênh ảnh cần xử lý của ảnh đầu vào
C
Số cụm cần phân cụm của tổ hợp kênh
ảnh đầu vào.
i,j,c
Giá trị độ thuộc cụm thứ c của điểm ảnh
(i, j), đầu ra của thủ tục phân cụm FCM
fcut
fcut (0, 1): Tham số xác định C dải
động mức xám của một kênh ảnh (mục
III)
II.1. Độ tƣơng phản trực tiếp tại từng điểm ảnh
Thông thƣờng, độ tƣơng phản chỉ sự chênh lệch về
độ sáng giữa một đối tƣợng (ký hiệu là f) và vùng
xung quanh của nó (ký hiệu là b). Tƣơng tự nhƣ [6,
7], trong bài báo này chúng ta cũng sử dụng độ đo
tƣơng phản sau:
f b
C
f b
(3)
Nâng cao độ tƣơng phản theo phƣơng pháp trực
tiếp, theo [6, 7] là việc thực hiện một dãy biến đổi
, , ,( , ) f b new new f bf b C C f , 0 ≤ Cf,b ≤ Cnew ≤ 1 và
, ,
1
,
1
1
,
1
new
new
new f b
new
new
C
b f b
C
f
C
b f b
C
(4)
II.2. S-function
Trong lý thuyết tập mờ, Zadeh đã định nghĩa một
toán tử tăng cƣờng gọi là INT (intensification), và
dạng tổng quát của nó đƣợc gọi là S-function [7],
đƣợc xác định nhƣ sau:
2
2
0, 0
,
( ; , , )
1 ,
1,
x a
x a
a x b
b a c a
S x a b c
x c
b x c
c b c a
c x
(5)
Trong [6] Cheng và cộng sự đã sử dụng hàm S-
function để chuyển một ảnh xám sang miền fuzzy, sau
đó nghiên cứu nâng cao độ tƣơng phản của ảnh trong
miền fuzzy.
Trong [7] đề xuất xây dựng phép nâng cao độ
tƣơng phản trực tiếp của ảnh đa cấp xám dựa trên các
đặc trƣng địa phƣơng của điểm ảnh. Đây là phƣơng
pháp gốc đƣợc dùng phát triển các thuật toán sẽ đƣợc
đề xuất trong phần III.
II.3. Ƣớc lƣợng độ sáng nền và độ tƣơng phản
điểm ảnh
Phép nâng cao độ tƣơng phản trực tiếp của một
ảnh xám đƣợc công bố trong [7] có thể đƣợc tóm tắt
nhƣ sau:
Giả sử gij là mức xám của một điểm ảnh I(i,j) at
của ảnh đa cấp xám I kích thƣớc M × N, và Wij cửa sổ
lân cận tại (i, j) kích thƣớc d × d. Thực hiện tuần tự
các bƣớc sau:
Bƣớc 1: Tính các tham số địa phƣơng đƣợc chuẩn hóa
giá trị về đoạn [0, 1], gradient Eij, entropy Hij, trung
bình độ lệch chuẩn Vij, và moment bậc 4 R4,ij:
1.1: Tính cƣờng độ biên ảnh:
e = {eij} là giá trị cƣờng độ biên ảnh xám đầu vào
bằng một toán tử xác định ảnh biên nhƣ toán tử Sobel.
Các công trình nghiên cứu phát triển CNTT và Truyền thông Tập V-1, Số 17 (37), tháng 6/2017
- 62 -
1.2: Giá trị trung bình, độ lệch chuẩn
= {ij}, v = {vij}, trong đó ij là giá trị trung bình
mức xám, vij là độ lệch chuẩn mức xám lấy tại lân cận
điểm ảnh gij
ij( , ) W
ij 2
pq
p q
g
d
,
ij
2
ij
( , ) W
ij 2
pq
p q
g
v
d
(6)
1.3: Tính giá trị entropy địa phƣơng
1
ij
log
2log
L
k k
k
p p
h
d
,
ij ,
2
# ( , ) W : p q
k
p q g k
p
d
(7)
1.4: Tính moment bậc 4
ij
4
ij
( , ) W
4,ij 2 1
pq
p q
g
d
(8)
1.5: Chuẩn hóa về miền giá trị là đoạn [0, 1]
ij
ij
ijmax
e
E
e
,
ij
ij
ijmax
v
V
v
ij
ijmax
ij
h
H
h
,
4,ij
4,
4,ijmax
ijR
(9)
Bƣớc 2: Tính giá trị độ thuần nhất của điểm ảnh và
giá trị mức xám không thuần nhất
2.1: Tính giá trị đo độ thuần nhất tại điểm ảnh
ij
ij
ij
,
max
HO
HO
(10)
trong đó
ij 4
ij 4,
* * *
1 * 1 * 1 * 1
ij ij ij
ij ij ij
HO E V H R
E V H R
(11)
2.2: Tính giá trị mức xám không thuần nhất (non-
homogeneity gray value [7])
ij
ij
( , ) W
ij
( , ) W
(1 )
(1 )
pq pq
p q
pq
p q
g
(12)
Bƣớc 3: Tính giá trị độ tƣơng phản tại từng điểm ảnh
và số mũ khuếch đại
3.1: Giá trị độ tƣơng phản
ij ij
ij
ij ij
g
C
g
(13)
3.2: Số mũ khuếch đại
ax min ij min
ij min
ax min
*
,
m
m
(14)
trong đó: 1
min
ax 1
k
m
g g
g g
, max 1 , gk, g1
(15)
là các đỉnh của histogram đƣợc xác định theo [3]
3.3: Nâng độ tƣơng phản
ij'
ij ij ,
t
C C (16)
trong đó tham số t {0.25, 0.5} [7]
3.4: Tính giá trị mức xám mới tại từng điểm ảnh
ij
ij
ij
ij
'
ij ij
ij ij ij ij'
ij ij'
ij
'
ij ij
ij ij ij ij'
ij ij
1 1
,
1 1
1 1
,
1 1
t
t
t
t
C C
g
C C
g
C C
g
C C
(17)
Thuật toán [6, 7] thỏa mãn điều kiện sau: Tại từng
điểm ảnh, độ thuần nhất càng cao thì mức độ nâng
tƣơng phản càng thấp.
Hình 3. Đồ thị số mũ khuếch đại của [7] (gần tuyến
tính)
Nhƣ đã đề cập trong phần I, đối với ảnh tối, thuật
toán nâng cao độ tƣơng phản trực tiếp trên không thay
đổi đƣợc độ sáng của ảnh. Để giải quyết vấn đề thay
đổi độ sáng của ảnh sau khi tăng cƣờng độ tƣơng phản
(địa phƣơng) chúng tôi đề xuất xây dựng một biến đổi
ảnh F của từng kênh ảnh xám của tổ hợp kênh ảnh đầu
vào. Khi đó độ tƣơng phản đƣợc tính công thức (13)
sẽ đƣợc thay đổi thành:
ij
ij
ij
(i, j) ( )
,
( , ) ( )
F F
C
F i j F
(18)
ở đây ta đồng nhất biến đổi F với ảnh {F(i, j)}.
Các công trình nghiên cứu phát triển CNTT và Truyền thông Tập V-1, Số 17 (37), tháng 6/2017
- 63 -
Trong [6], các tác giả cũng đã xây dựng một biến
đổi mờ hóa ảnh áp dụng cho quy trình nâng cao độ
tƣơng phản trực tiếp. Nhƣ đã phân tích ở phần I, biến
đổi ảnh này có thể làm mất chi tiết ảnh. Để chi tiết
chúng tôi sẽ tóm lƣợc lại phép mờ hóa kênh ảnh của
[7] nhƣ mục sau:
II.4. Ƣớc lƣợng dải động mức xám và biến đổi - mờ
hóa ảnh sử dụng S-function
Dựa trên histogram của ảnh, trong [6, 7] các tác
giả đã nhận thấy đỉnh đầu tiên của histogram của ảnh
liên quan đến vùng nền và mức xám lớn hơn đỉnh sau
cùng có thể là nhiễu. Vì vậy các tác giả đã đề xuất
cách xác định một dải động của mức xám nhƣ sau:
Đặt
ax
1
ax
is ( )
is ( ) ,
k
m i
i
m
H g
H g
k
(19)
trong đó k là số điểm cực đại địa phƣơng) của
histogram, Hismax(g1), , Hismax(gk) là các điểm cực
đại địa phƣơng của histogram, g1, gk là điểm cực đại
địa phƣơng đầu tiên và sau cùng tƣơng ứng sao cho:
Hismax(g1) axis ( ),mH g Hismax(gk) axis ( )mH g
(20)
Dải động mức xám là đoạn [a, c] ở đó
a = min{(1 - f2)(g1 - Lmin) + Lmin, B1}
c = max{f2(Lmax - gk) + gk, B2},
(21)
trong đó B1, B2 đƣợc xác định :
ax1
min min
1is( ) is( )
mLB
i L i L
H i f H i
ax ax
2 min
1is( ) is( ),
m mL L
i B i L
H i f H i
(22)
và Lmin, Lmax là giá trị mức xám nhỏ nhất và lớn nhất
của kênh ảnh, các hằng số f1 = 0.01, f2 = 0.5 đƣợc xác
định bằng thực nghiệm.
Từ dải động mức xám [a, c] đã ƣớc lƣợng trên,
trong [6] đã trình bày một thuật toán để mờ hóa ảnh
đầu vào trƣớc khi nâng cao độ tƣơng phản của ảnh
đầu vào.
III. KỸ THUẬT ĐỀ XUẤT
Phần này trình bày kỹ thuật ƣớc lƣợng các dải
động của mức xám sử dụng phân cụm mờ FCM, phép
biến đổi kênh ảnh và kỹ thuật nâng cao độ tƣơng phản
của ảnh màu xét trong biểu diễn màu HSV.
III.1. Ƣớc lƣợng nhiều dải động mức xám dựa
vào phân cụm mờ FCM
Phân cụm mờ c-mean (FCM [4]), đƣợc sử dụng
hiệu quả trong một số nghiên cứu về nâng cao độ
tƣơng phản của ảnh một kênh.
Trong [16] đã trình bày một cách xác định dải
động của miền giá trị mức xám bằng cách sử dụng
thuật toán phân cụm mờ FCM, khi đó các cụm ảnh có
tính chất đều hơn, và do đó việc xác định dải động
mức xám là tƣơng đối dễ dàng. Ngoài ra trong [15]
các tác giả cũng sử dụng FCM để phân đoạn
histogram và nâng cao độ tƣơng phản theo bộ phận
của histogram.
Để có thể ƣớc lƣợng tự động dải động mức xám
cho nhiều loại ảnh khác nhau nhƣ ảnh tối, ảnh sáng,
ảnh có độ tƣơng phản thấp và ảnh có độ tƣơng phản
cao, chúng tôi đề xuất sử dụng phân cụm mờ để ƣớc
lƣợng dải động của mức xám của từng kênh ảnh của
ảnh đa kênh. Lƣu ý rằng trong một số biểu diễn màu
nhƣ biểu diễn màu RGB, các kênh ảnh là không độc
lập mà có độ tƣơng quan cao, vì thế cách làm ƣớc
lƣợng dải động của từng kênh ảnh độc lập là không
h ... 1
t
t
t
t
C
I i j
C
i j
C
I i j
C
V,ij
V,ij
V,ij
V,ij
V,ij
V,ij V V,ij
V,ij
,
V,ij
V,ij V V,ij
V,ij
1
, ( , )
1
( , )
1
, ( , )
1
t
t
t
t
V new
C
I i j
C
I i j
C
I i j
C
Bƣớc 4: Chuyển đổi ảnh (IH, IS,new, IV,new) trong biểu
diễn màu HSV về biểu diễn màu RGB, ta đƣợc ảnh
Inew.
Bƣớc 5: Bƣớc tùy chọn, tính các chỉ số CM{R,G,B} cho
kênh R, G và B, Eavg và Havg nhƣ sau:
5.1: Tính tham số của [7] cho kênh IR, IG và IB của
ảnh gốc I nhƣ đã trình bày trong mục II.3 (xem các
công thức tử (6) đến (12) với kích thƣớc cửa sổ dxd,
cụ thể là các giá trị mức xám không thuần nhất {δR,ij},
{δG,ij}, và {δB,ij} của các ảnh đa cấp xám IR, IG và IB
tƣơng ứng.
5.2: Tính CMR, CMG, CMB theo công thức (31), cụ
thể là:
, ,ij
ij , ,ij
( , )
( , )
*
new R R
new R R
R
I i j
I i j
CM
M N
, ,ij
ij , ,ij
( , )
( , )
*
new G G
new G G
G
I i j
I i j
CM
M N
, ,ij
ij , ,ij
( , )
( , )
*
new B B
new B B
B
I i j
I i j
CM
M N
5.3: Tính Eavg = Eavg{Inew,R, Inew,G, Inew,B} theo công
thức (32). Tính Havg = Havg{Inew,R, Inew,G, Inew,B} theo
công thức (35)
Trả về: Inew, và các tùy chọn trả về
CMR, CMG, CMB , Eavg , Havg
Bảng 2 là giá trị chỉ số của các ảnh #1 - #6, đƣợc
tính từ các công thức (31) đến (35).
Bảng 2. Giá trị chỉ số ảnh thể hiện.
Ảnh CMR CMG CMB Eavg Havg
#1 0.1180 0.1914 0.2482 5.9395 0.3456
#2 0.0160 0.0191 0.0314 7.315 0.8216
#3 0.0154 0.0188 0.0548 7.4847 0.8001
#4 0.0256 0.0298 0.0511 7.4536 0.8642
#5 0.0170 0.0293 0.0345 7.3092 0.8504
#6 0.0273 0.0304 0.0364 3.4443 0.2861
Các công trình nghiên cứu phát triển CNTT và Truyền thông Tập V-1, Số 17 (37), tháng 6/2017
- 70 -
IV.4. Các kết quả và luận giải
Trong phần này chúng tôi trình bày hai kiểm thử,
chúng bao gồm:
(A) Phép mờ hóa - biến đổi ảnh sử dụng phân cụm
mờ cho tổ hợp kênh ảnh
(B) Thử nghiệm nâng cao độ tương phản sử dụng
biến đổi ảnh trên 2 kênh ảnh (kênh S và kênh V) trong
biểu diễn màu HSV.
A. Thực nghiệm để kiểm tra hiệu quả của Phép mờ
hóa-biến đổi ảnh sử dụng phân cụm mờ cho tổ hợp
kênh ảnh so với phép mờ hóa của [7].
Trong thử nghiệm này, trên từng kênh ảnh riêng rẽ
R, G và B chúng tôi thực hiện phép mờ hóa bằng biến
đổi S-function đƣợc xây dựng trong [6].
Hàm biến đổi S(x; a, b, c) với các tham số a và c
đƣợc xác định dựa trên phân tích histogram của kênh
ảnh và tham số b đƣợc dò tìm bằng phép cực đại hóa
fuzzy entropy.
Thuật toán 1 của chúng tôi thực hiện đồng thời cho
3 kênh ảnh R, G và B, tham số f1, f2 để ƣớc lƣợng
khoảng động mức xám [B1,c,k B2,c,k] của từng cụm c
ứng với kênh R, G và B đƣợc xác định dựa trên thực
nghiệm, fcut = 0.005. Thuật toán phân cụm tập vector
giá trị điểm ảnh {IR(i, j), IG(i, j), IB(i, j)} sử dụng số
cụm C [2,10]. Trong thực nghiệm này chúng tôi
chọn C = 5.
Bảng 3. So sánh giá trị Havg trên kênh R, G và B của
các ảnh là kết quả của phép mờ hóa – biến đổi ảnh
Ảnh Havg
(sử dụng [7])
Havg
(sử dụng thuật toán 1)
#1 0.4478 0.4950
#2 0.6931 0.7879
#3 0.5736 0.7200
#4 0.5822 0.7624
#5 0.6227 0.8157
#6 0.3374 0.3512
Bảng 3 cho chúng ta thấy độ không chắc chắn của
phép mờ hóa sử dụng nhiều dải động mức xám của
thuật toán đề xuất 1 cao hơn so với phƣơng pháp sử
dụng một dải động mức xám của [6]. Điều này cũng
phù hợp với trực quan khi quan sát các ảnh mờ hóa
minh họa của #1 và #2.
(a)
(b)
Hình 9. (a) Ảnh mờ hóa của ảnh #1 sử dụng [6];
(b) Ảnh kết quả sử dụng thuật toán đề xuất 1
Trên hình ảnh mờ hóa của ảnh #1 sử dụng biến đổi
của [6], chúng ta thấy rõ chi tiết ảnh ở các vùng đƣợc
đánh dấu hình chữ nhật là bị mất, trong khi đó ảnh
biến đổi sử dụng nhiều dải động ƣớc lƣợng từ phân
cụm FCM cho tổ hợp kênh RGB (thuật toán 1) chi tiết
ảnh đƣợc giữ tốt hơn.
Quan sát các kênh G và B của ảnh biến đổi của ảnh
#2 sau đây ta cũng thấy độ chi tiết của ảnh biến đổi sử
dụng [6] cũng bị suy giảm nhiều hơn biến đổi ảnh dựa
trên thuật toán 1 đã đề xuất.
(a)
(b)
(c)
(d)
Hình 10. Kênh G và kênh B của ảnh biến đổi sử
dụng [6] (a), (c). Kênh G và kênh B của ảnh biến đổi
sử dụng thuật toán 1 (b), (d).
Phân tích trên lại cho thấy việc biến đổi của [6] chỉ
sử dụng chỉ một bộ tham số {a, bopt, c} liên quan đến
dải động mức xám của kênh ảnh cho một dạng hàm
biến đổi nhƣ S-function để biến đổi ảnh có thể làm
mất chi tiết ảnh. Trái lại, phƣơng pháp sử dụng nhiều
dải động của mức xám {B1,c,k, B2,c,k} đƣợc ƣớc lƣợng
Các công trình nghiên cứu phát triển CNTT và Truyền thông Tập V-1, Số 17 (37), tháng 6/2017
- 71 -
từ histogram mờ, nhƣ của thuật toán 1 đã giữ đƣợc chi
tiết ảnh tốt hơn.
(a)
(b)
Hình 11. Sử dụng biến đổi ảnh [6] với một dải động
mức xám cho ảnh #3(a), #5 (b) và áp dụng [7].
Trên Hình 11, các ảnh kết quả minh họa bị mất chi tiết
ảnh, xem ở các vùng chữ nhật đánh dấu. Điều đó
chứng tỏ sự hạn chế của việc chỉ dùng một dải động
mức xám cho các biến đổi ảnh.
B. Thử nghiệm nâng cao độ tƣơng phản sử dụng
thuật toán đề xuất 2 trên hai kênh ảnh S và V trong
biểu diễn màu HSV của ảnh đầu vào so với sử dụng
thủ tục 1 (dựa vào thuật toán gốc).
Trong thử nghiệm này, chúng tôi thực hiện kiểm
tra hiệu quả của thuật toán 2 đề xuất sử dụng phép
phân cụm FCM để xác định tham số cho phép biến
đổi ảnh trong định nghĩa 3.2, công thức (27) so với sử
dụng thủ tục 1 trên 2 kênh ảnh S và V riêng rẽ. Các
bƣớc đƣợc thực hiện nhƣ sau:
Đầu tiên, chuyển biểu diễn màu RGB sang biểu
diễn màu HSV của ảnh đầu vào. Phân cụm dữ liệu
mức xám tổ hợp kênh S và kênh V với tham số đƣợc
chọn nhƣ trong thử nghiệm A (số cụm C = 5 v.v).
trên từng kênh ảnh S và kênh V riêng rẽ ƣớc lƣợng
{B1,c,k, B2,c,k} (k {S, V}) và thực hiện biến đổi ảnh
cho kênh S và kênh V tƣơng ứng sử dụng hàm biến
đổi FS, FV (công thức (27)) có tham số của các hàm
biến đổi là các dải động mức xám ƣớc lƣợng từ thuật
toán 1.
Thứ hai, xác định giá trị độ tƣơng phản theo
thuật toán 2 và các bƣớc liên quan cho kênh ảnh S và
V đã biến đổi ở bƣớc thứ nhất với kích thƣớc cửa sổ
3x3 và tham số t = 0.25 (công thức (16)).
Thứ ba, tổng hợp lại các kênh ảnh H gốc, kênh
S và kênh V đã nâng cao độ tƣơng phản, sau đó biến
đổi ngƣợc từ biểu diễn HSV sang biểu diễn RGB.
Cuối cùng, tính giá trị mức xám không thuần
nhất tại từng điểm ảnh ứng với các kênh ảnh R, G và
B (các giá trị này đƣợc dùng để tính độ đo tƣơng phản
trung bình trên từng kênh R, G và B trong bảng 4).
Giá trị trung bình độ tƣơng phản trực tiếp CM
đƣợc tính trên kênh R, G và B trong biểu diễn màu
RGB của ảnh đầu vào đƣợc tính với ảnh giá trị mức
xám trung bình không thuần nhất của từng kênh R, G
và B của ảnh RGB gốc và ảnh kết quả đầu ra khi sử
dụng thủ tục 1 và phƣơng pháp đề xuất (thuật toán 2)
đƣợc thể hiện ở Bảng 4.
Bảng 4. Kết quả chỉ số ảnh đầu ra của thủ tục 1(gốc),
và thuật toán 2 đề xuất trên từng kênh ảnh R, G và B.
Ảnh
CMR CMG CMB
Thủ tục
1 gốc
Thuật
toán 2
Thủ tục
1 gốc
Thuật
toán 2
Thủ tục1
gốc
Thuật
toán 2
#1 0.1244 0.2143 0.1961 0.2575 0.2511 0.3373
#2 0.0157 0.1676 0.0193 0.1685 0.0320 0.1728
#3 0.0155 0.2157 0.0192 0.2166 0.0543 0.2351
#4 0.0284 0.1232 0.0338 0.1254 0.0570 0.1385
#5 0.0170 0.0967 0.0299 0.1003 0.0352 0.1033
#6 0.0275 0.0861 0.0307 0.0879 0.0375 0.0870
Bảng 5. Kết quả chỉ số ảnh đầu ra của thủ tục 1(gốc),
và thuật toán 2 đề xuất trên từng kênh ảnh R, G và B.
Ảnh
Eavg Havg
Thủ tục
1 gốc
Thuật
toán 2
Thủ tục
1 gốc
Thuật
toán 2
#1 5.8446 6.1855 0.3456 0.3077
#2 6.8158 7.2568 0.8216 0.7004
#3 6.9599 7.0051 0.8001 0.6737
#4 7.2337 7.4179 0.8642 0.7947
#5 7.0103 7.5376 0.8504 0.8233
#6 3.0140 4.0173 0.2868 0.2861
Bảng 4 và 5 của kết quả thực nghiệm của các ảnh
#1 - #6 đã thể hiện các chỉ số khách quan độ tƣơng
phản trực tiếp trên từng kênh R, G và B khi sử dụng
thuật toán 2 đều cho kết quả cao hơn khi sử dụng
thuật toán [7]. Chỉ số khách quan Eavg khi áp dụng
thuật toán 2 cũng cao hơn so với áp dụng thủ tục 1.
Cũng vậy, chỉ số khách quan Havg khi áp dụng thuật
toán 2, ngoài ảnh #1, đều có giá trị nhỏ hơn so với chỉ
số ảnh kết quả khi áp dụng thủ tục 1.
Các công trình nghiên cứu phát triển CNTT và Truyền thông Tập V-1, Số 17 (37), tháng 6/2017
- 72 -
(a)
(b)
(c)
(d)
(e)
(g)
(h)
(k)
(l)
(m)
(n)
(p)
Hình 12. Ảnh kết quả (các ảnh cột bên trái ) sử dụng [7]
Ảnh kết quả (các ảnh cột bên phải) sử dụng thuật toán 2.
V. KẾT LUẬN
Trong bài báo này chúng tôi đã đề xuất 3 đóng góp
mới cho phƣơng pháp nâng cao độ tƣơng phản ảnh
màu theo tiếp cận trực tiếp.
Thứ nhất, chúng tôi đề xuất một phƣơng pháp biến
đổi ảnh mới sử dụng nhiều hàm S-function đƣợc tham
số hóa ứng với từng dải động mức xám. Các dải động
mức xám này đƣợc ƣớc lƣợng tự động bằng thuật toán
phân cụm FCM. Phƣơng pháp này đƣợc so sánh trực
tiếp với phƣơng pháp biến đổi sử dụng một hàm S-
function với tham số hóa dựa trên cực đại fuzzy
entropy [6].
Thứ hai, chúng tôi cũng đề xuất một thuật toán
mới theo phƣơng pháp nâng cao độ tƣơng phản trực
tiếp cho ảnh màu dựa trên thuật toán trong [7].
Cuối cùng, là một cải tiến nhỏ để tăng độ trơn của
các giá trị độ thuần nhất của điểm ảnh khi thay đổi
cách kết nhập các giá trị địa phƣơng (tại từng điểm
ảnh) nhƣ gradient, entropy, độ lệch chuẩn trung bình
và moment bậc 4 so với cách kết nhập của [7].
Kết qủa thực nghiệm đã chứng tỏ rằng các kỹ thuật
đề xuất của chúng tôi làm việc tốt với đa dạng ảnh
màu. Ảnh nâng cao độ tƣơng phản trơn và sự thay đổi
mức độ sáng trong khi vẫn bảo toàn chi tiết ảnh gốc
tốt hơn so với phƣơng pháp đƣợc công bố trong [6, 7].
Độ sáng của các kênh ảnh sau khi nâng cao độ tƣơng
phản tƣơng đồng với độ sáng ảnh đầu ra của các
phƣơng pháp gián tiếp. Trong các nghiên cứu tiếp
theo, chúng tôi sẽ tiếp tục nghiên cứu các dạng kết
nhập khác của các đặc trƣng địa phƣơng nhƣ gradient,
entropy, độ lệch trung bình và moment bậc 4 dạng
HOij = f(Eij, Hij, Vij, R4,ij) khi tính độ thuần nhất tại
từng điểm ảnh.
TÀI LIỆU THAM KHẢO
[1] S. S. Agaian, S. Blair and K. A. Panetta,
“Transform coefficient histogram-based image
enhancement algorithms using contrast entropy”,
IEEE Trans. Image Processing, vol. 16, no. 3, (2007):
741-758.
[2] Arici T., Dikbas S., and Altunbasak Y., “A
Histogram Modification Framework and Its
Application for Image Contrast Enhancement,” IEEE
Transactions on Image Processing, vol. 18, no. 9,
(2009):1921-1935.
Các công trình nghiên cứu phát triển CNTT và Truyền thông Tập V-1, Số 17 (37), tháng 6/2017
- 73 -
[3] A. Beghdadi, A.L. Negrate, “Contrast
enhancement technique based on local detection of
edges”, Comput. Vision Graphics Image Process. 46
(1989):162–174.
[4] Bezdek, James C. Pattern recognition with fuzzy
objective function algorithms. Springer Science &
Business Media, (2013).
[5] A.O. Boudraa and E. H. S. Diop, “Image contrast
enhancement based on 2D teager-kaiser operator”,
Proc. of the IEEE International Conference on Image
Processing, (2008.): 3180-3183.
[6] Cheng H.D, Huijuan Xu, “A novel fuzzy logic
approach to contrast enhancement”, Pattern
Recognition 33 (2000):809-819.
[7] Cheng H.D., Mei Xue, Shi X,J., “Contrast
enhancement based on a novel homogeneity
measurement”, Pattern Recognition 36 (2003):2687 –
2697.
[8] L.Dash, B.N. Chatterji, “Adaptive contrast
enhancement and de-enhancement” , Pattern
Recognition 24 (1991) :289–302.
[9] A.P. Dhnawan, G. Buelloni, R. Gordon,
Enhancement of mammographic features by optimal
adaptive neighborhood image processing, IEEE
Trans. Med. Imaging 5 (1986):8–15.
[10] M. M. Gupta, J. Qi, “Theory of T-norms and fuzzy
inference methods”, Fuzzy Sets and Systems 40,
(1991):431-450.
[11] Hanmandlu M., Devendra Jha, Rochak,
“Color image enhancement by fuzzy intensification”,
Pattern Recognition Letters 24 (2003):81–87.
[12] Hanmandlu M, Devendra Jha, “An Optimal
Fuzzy System for Color Image Enhancement”, IEEE
Transactiong on Image Processiong, Vol. 15, No.10
(2006): 2956-2966.
[13] S. Lee, “An efficient content-based image
enhancement in the compressed domain using Retinex
theory”, IEEE Trans. Circuits and Systems for Video
Technology, vol. 17, no. 2, pp. (2007):199-213.
[14] Ponomarenko N. Ponomarenko, L. Jin, O.
Ieremeiev, V. Lukin, K. Egiazarian, J.
Astola, B. Vozel, K. Chehdi, M. Carli,
F.Battisti, C.-C. Jay Kuo, “Image database
TID2013: Peculiarities, results and perspectives,
Signal Processing”, Imag Communication, vol. 30,
Jan. (2015):57-77.
[15] M. Shakeri, M.H. Dezfoulian, H.
Khotanlou, A.H. Barati, Y. Masoumi,
Image contrast enhancement using fuzzy clustering
with adaptive cluster parameter and sub-histogram
equalization, Digital Signal Processing 62, (2017)
:224–237.
[16] Shen-Chuan Tai, Ting-Chou Tsai, Yi-Ying
Chang, Wei-Ting Tsai and Kuang-Hui
Tang, “Contrast Enhancement through Clustered
Histogram Equalization”, Research Journal of
Applied Sciences, Engineering and Technology 4(20),
(2012):3965-3968, ISSN: 2040-7467.
[17] M. J. Soha and A. A. Schwartz, “Multi-
dimensional histogram normalization contrast
enhancement,” in Proc. 5th Canad. Symp.. Remote
Sensing, (1978):86–93.
Nhận bài ngày: 12/01/2017
Các công trình nghiên cứu phát triển CNTT và Truyền thông Tập V-1, Số 17 (37), tháng 6/2017
- 74 -
SƠ LƢỢC VỀ TÁC GIẢ
NGUYỄN VĂN QUYỀN
Sinh năm 1979 tại Hải Phòng.
Nhận bằng thạc sĩ chuyên ngành
Khoa học máy tính tại trƣờng ĐH
Sƣ phạm Hà Nội, năm 2008
Đang là NCS tại Viện CNTT –
Viện Hàn lâm KH&CN Việt Nam
Hiện công tác tại Phòng QLSĐH,
trƣờng ĐH Hải Phòng
Lĩnh vực nghiên cứu: Xử lý ảnh, khai phá dữ liệu, tính
toán mềm
Điện thoại: 0904.815.444
Email: [email protected]
TRẦN THÁI SƠN
Sinh năm 1955, tại Nghệ An
Nhận học vị tiến sĩ năm 1990, tại
Viện hàn lâm Khoa học Liên Xô
Hiện công tác tại Viện CNTT,
Viện Hàn lâm KH&CN Việt Nam
Lĩnh vực nghiên cứu: Lập luận
xấp xỉ, tính toán mềm
Điện thoại: 0903409894
Mail: [email protected]
NGUYỄN TÂN ÂN
Sinh năm 1953 tại Hà Nội.
Nhận bằng tiến sĩ năm 2002, tại
trƣờng ĐH Năng lƣợng Maxcơva;
nhận học hàm PGS năm 2012 tại
Viêt Nam.
Hiện công tác tại Khoa CNTT,
Học viện Quản lý Giáo dục. Lĩnh
vực nghiên: Trí tuệ nhân tạo, Mạng nơron nhân tạo,
Tính toán mềm, Giáo dục tin học
Điện thoại: 0912 321 559
Email: [email protected]
NGÔ HOÀNG HUY
Sinh năm 1969 tại Hà Nội.
Tốt nghiệp chuyên ngành Toán
tin tại trƣờng ĐH Sƣ phạm Hà
Nội năm 1990.
Hiện công tác tại Viện CNTT,
Viện Hàn lâm KH&CN Việt
Nam
Lĩnh vực nghiên cứu: Xử lý ảnh,
Xử lý tiếng nói, Trí tuệ nhân
tạo, Khai phá dữ liệu, Hệ thống nhúng.
Điện thoại: 0904140022
Email: [email protected]
ĐẶNG DUY AN
Sinh năm 1974 tại Thái Nguyên.
Nhận bằng thạc sĩ tại Đại học
Thái Nguyên, năm 2014.
Hiện công tác tại Công ty tập
đoàn CDC CORP - Viện máy và
Dụng cụ Công nghiệp - Bộ
Công Thƣơng
Lĩnh vực nghiên cứu: Trí tuệ
nhân tạo, khai phá dữ liệu, hệ thống nhúng
Điện thoại: 0913215111
Mail: [email protected]
File đính kèm:
mot_phuong_phap_moi_nang_cao_do_tuong_phan_anh_mau_theo_huon.pdf

