Một phương pháp mới nâng cao độ tương phản ảnh màu theo hướng tiếp cận trực tiếp
Nâng cao độ tương phản ảnh là một vấn đề quan
trọng trong xử lý và phân tích hình ảnh, là một bước
cơ bản trong phân đoạn ảnh. Các kỹ thuật thông dụng
nâng cao độ tương phản ảnh được phân loại theo hai
tiếp cận chính: (1) Các phương pháp gián tiếp [1, 2, 5,
12, 13, 17]; và (2) các phương pháp trực tiếp [6, 7].
Có rất nhiều kỹ thuật đã được đề xuất được tìm
thấy trong tài liệu tham khảo, hầu hết trong số đó là
phương pháp gián tiếp, chúng biến đổi histogram mà
không sử dụng bất kỳ một độ đo tương phản nào.
Các kỹ thuật biến đổi histogram được khai thác ở
nhiều khía cạnh như thuật toán khung biến đổi
histogram và thích nghi nội dung [2], biến đổi logarit
histogram [1], kỹ thuật cân bằng động histogram [5],
chuẩn hóa nhiều histogram [17], biến đổi Cosine rời
rạc [13], xây dựng toán tử tăng cường mở rộng của
toán tử INT của Zadeh để mờ hóa thông tin trong
miền không gian [12] v.v
Mặc dù vậy có rất ít các nghiên cứu theo phương
pháp trực tiếp trong đó biến đổi độ tương phản ảnh
dựa trên một độ đo tương phản xác định tại mỗi điểm
ảnh, chẳng hạn các nghiên cứu [9, 3, 8, 6, 7]. Trong
[9, 3], các kết quả đã chứng tỏ rằng phương pháp trực
tiếp có thể tạo ra các kỹ thuật nâng cao độ tương phản
hiệu quả.
Tóm tắt nội dung tài liệu: Một phương pháp mới nâng cao độ tương phản ảnh màu theo hướng tiếp cận trực tiếp
Các công trình nghiên cứu phát triển CNTT và Truyền thông Tập V-1, Số 17 (37), tháng 6/2017 - 59 - Một phƣơng pháp mới nâng cao độ tƣơng phản ảnh màu theo hƣớng tiếp cận trực tiếp A New Method to Enhancement The Contrast of Color Images based on Direct Method Nguyễn Văn Quyền, Trần Thái Sơn, Nguyễn Tân Ân, Ngô Hoàng Huy, Đặng Duy An Abstract: Image contrast enhancement techniques have two mainly methods: indirect method and direct method. While indirect methods only modify the histogram without defining any specific contrast measure, the direct methods establish a criterion of contrast measurement and enhance the image by improving the contrast measure. Among many direct methods, only the studies by Cheng and Xu modified the contrast at each point of grayscale image using a contrast measure [6, 7]. In this paper we propose a new method for enhancing the contrast of color images based on the direct method. The experimental results demonstrate that the combination of our proposed method with Fuzzy C_Mean (FCM) clustering algorithms performs well on different color images. Keywords: Direct contrast enhancement, homogeneity measure, contrast measure, FCM, S- function, histogram, the dynamic range of gray, HSV, entropy, fuzzy entropy, the image details. I. GIỚI THIỆU Nâng cao độ tƣơng phản ảnh là một vấn đề quan trọng trong xử lý và phân tích hình ảnh, là một bƣớc cơ bản trong phân đoạn ảnh. Các kỹ thuật thông dụng nâng cao độ tƣơng phản ảnh đƣợc phân loại theo hai tiếp cận chính: (1) Các phƣơng pháp gián tiếp [1, 2, 5, 12, 13, 17]; và (2) các phƣơng pháp trực tiếp [6, 7]. Có rất nhiều kỹ thuật đã đƣợc đề xuất đƣợc tìm thấy trong tài liệu tham khảo, hầu hết trong số đó là phƣơng pháp gián tiếp, chúng biến đổi histogram mà không sử dụng bất kỳ một độ đo tƣơng phản nào. Các kỹ thuật biến đổi histogram đƣợc khai thác ở nhiều khía cạnh nhƣ thuật toán khung biến đổi histogram và thích nghi nội dung [2], biến đổi logarit histogram [1], kỹ thuật cân bằng động histogram [5], chuẩn hóa nhiều histogram [17], biến đổi Cosine rời rạc [13], xây dựng toán tử tăng cƣờng mở rộng của toán tử INT của Zadeh để mờ hóa thông tin trong miền không gian [12] v.v Mặc dù vậy có rất ít các nghiên cứu theo phƣơng pháp trực tiếp trong đó biến đổi độ tƣơng phản ảnh dựa trên một độ đo tƣơng phản xác định tại mỗi điểm ảnh, chẳng hạn các nghiên cứu [9, 3, 8, 6, 7]. Trong [9, 3], các kết quả đã chứng tỏ rằng phƣơng pháp trực tiếp có thể tạo ra các kỹ thuật nâng cao độ tƣơng phản hiệu quả. Nhƣ nhận xét ở trên, trong một thời gian dài cho đến nay hầu nhƣ chỉ có các nghiên cứu của Cheng và Xu [6, 7] là đề xuất một phƣơng pháp biến đổi độ tƣơng phản tại mỗi điểm ảnh dựa trên định nghĩa một độ đo tƣơng phản giữa độ sáng điểm ảnh và lân cận xung quanh nó. Độ đo tƣơng phản của [6, 7] đƣợc xây dựng dựa trên các đặc trƣng địa phƣơng nhƣ gradient, entropy, độ lệch chuẩn trung bình và moment bậc 4 tại từng điểm ảnh. Ngay từ đầu, phƣơng pháp nâng cao độ tƣơng phản này chỉ đƣợc thực hiện trong ảnh đa cấp xám. Mở rộng những phƣơng pháp này để nâng cao độ tƣơng phản của ảnh màu không phải là một nhiệm vụ dễ dàng do gặp phải một số yếu tố, chẳng hạn nhƣ sự lựa chọn một mô hình màu thích hợp để biểu diễn và xử lý ảnh, ảnh hƣởng hệ thống thị giác của con ngƣời. Các công trình nghiên cứu phát triển CNTT và Truyền thông Tập V-1, Số 17 (37), tháng 6/2017 - 60 - Việc lựa chọn một mô hình màu là rất quan trọng để cải thiện độ tƣơng phản của ảnh màu. Biểu diễn màu RGB đƣợc sử dụng cho việc hiển thị màu sắc, trong khi biểu diễn màu HSV là cho hệ thống thị giác của con ngƣời. Trong mô hình màu HSV, kênh H biểu diễn màu sắc, kênh S chỉ độ bão hòa, và kênh V là cƣờng độ của màu. Bằng cách bảo toàn kênh H, chỉ thay đổi kênh V hoặc thay đổi cả kênh S và kênh V, chúng ta có thể nâng cao chất lƣợng ảnh màu mà không làm suy giảm chất lƣợng ảnh gốc [12]. Trong khi các thuật toán trong [6, 7] là cơ sở của phép nâng cao độ tƣơng phản các ảnh đa cấp xám, chúng không đảm bảo hiệu quả khi áp dụng trực tiếp cho ảnh màu do một số nguyên nhân sau: (i) Ảnh nâng cao độ tƣơng phản không thay đổi mức độ sáng của màu so với ảnh gốc. Khi áp dụng thuật toán [7] trên kênh V của ảnh màu trong biểu diễn màu HSV, chúng tôi nhận thấy với nhiều ảnh màu, đặc biệt là các ảnh tối, các điểm ảnh nhƣ vậy có thể chiếm rất nhiều. Do đó ảnh đƣợc nâng cao sẽ không thay đổi mức sáng ở những vùng này và không khác biệt với ảnh gốc nếu chỉ dựa trên cảm nhận bằng mắt. Hình 1. Ảnh kết quả khi sử dụng [7] cho ảnh #1 (Xem hình 5) (ii) Chi tiết của ảnh gốc bị suy giảm. Trong [6], các tác giả đề xuất một thuật toán sử dụng hàm S-function có tham số để biến đổi ảnh đa cấp xám I đầu vào sau đó nâng cao độ tƣơng phản của ảnh biến đổi theo phƣơng pháp trực tiếp. ( , ) ( , , ) ( ( , ); , , ) ,opt optI I i j SI a b c S func I i j a b c (1) trong đó a, bopt và c là các tham số đƣợc ƣớc lƣợng tự động khi khảo sát các đỉnh histogram và dựa trên nguyên lý cực đại fuzzy entropy: [ 1, 1] ( ; , , ) ,argmaxopt b a c b H I a b c (2) và H là độ đo fuzzy entropy thông dụng (xem công thức (33), mục IV.3). Hình 2. Ảnh biến đổi sử dụng hàm S-function bị mất chi tiết [6]. Hình 2 chứng tỏ khi áp dụng phép biến đổi dạng S- function ở trên cho từng kênh R, G và B của ảnh #1 chúng ta sẽ nhận đƣợc một ảnh bị mất chi tiết nhƣ đã đƣợc thể hiện ở vùng đánh dấu chữ nhật. Điều này cũng xảy ra khi áp dụng biến đổi này cho kênh V trong biểu diễn màu HSV của ảnh #1. Phần còn lại của bài báo đƣợc tổ chức nhƣ sau: Phần II, trình bày một số nghiên cứu liên quan của thuật toán nâng cao độ tƣơng phản theo hƣớng trực tiếp của Cheng và cộng sự; Phần III là đề xuất thuật toán sử dụng phân cụm mờ để ƣớc lƣợng nhiều khoảng động mức xám, xây dựng hàm biến đổi kênh ảnh trƣớc khi tính độ tƣơng phản điểm ảnh và thuật toán nâng cao độ tƣơng phản ảnh màu trong biểu diễn màu HSV; Các kết quả thực nghiệm trình bày trong phần IV; Kết luận đƣợc đƣa ra ở phần V. II. NGHIÊN CỨU LIÊN QUAN Bảng 1 liệt kê một số kí hiệu đƣợc sử dụng trong bài báo này. Bảng 1. Các ký hiệu và các định nghĩa của nó Ký hiệu Định nghĩa I Ảnh RGB nói chung M, N M x N là kích thƣớc theo pixel của ảnh đầu vào. IR, IG, IB Kênh ảnh R,G và B của ảnh màu trong biểu diễn màu RGB. Các công trình nghiên cứu phát triển CNTT và Truyền thông Tập V-1, Số 17 (37), tháng 6/2017 - 61 - IS, IH, IV Kênh ảnh H,S và V của ảnh màu trong biểu diễn màu HSV Lk, min, Lk, max Miền giá trị mức xám của kênh ảnh thứ k của ảnh đầu vào, thông thƣờng Lk, min = 0, Lk, max = 255. d d x d là kích thƣớc cửa sổ lân cận của điểm ảnh. Eij Các giá trị gradient lấy tại điểm ảnh (i, j) đƣợc chuẩn hóa về miền [0, 1] theo một toán tử tìm kiếm biên chẳng hạn toán tử Sobel. Hij Giá trị entropy địa phƣơng lấy tại điểm ảnh (i, j) đƣợc chuẩn hóa về miền [0, 1]. Vij Độ lệch chuẩn trung bình mức xám lấy tại điểm ảnh (i, j) đƣợc chuẩn hóa về miền [0, 1] R4,ij Giá trị moment bậc 4 lấy tại điểm ảnh (i, j) đƣợc chuẩn hóa về miền [0, 1] HOij Giá trị kết nhập dạng f(Eij, Hij, Vij, R4,ij)[7] ij Giá trị thuần nhất tại điểm ảnh (i, j) ij Giá trị trung bình không thuần nhất tại điểm ảnh (i, j) ξij Số mũ khuếch đại tại (i, j) t t (0,1): Tham số của phép nâng độ khuếch đại f1,f2 f1, f2 (0, 1): Tham số xác định dải động mức xám [7] K Số kênh ảnh cần xử lý của ảnh đầu vào C Số cụm cần phân cụm của tổ hợp kênh ảnh đầu vào. i,j,c Giá trị độ thuộc cụm thứ c của điểm ảnh (i, j), đầu ra của thủ tục phân cụm FCM fcut fcut (0, 1): Tham số xác định C dải động mức xám của một kênh ảnh (mục III) II.1. Độ tƣơng phản trực tiếp tại từng điểm ảnh Thông thƣờng, độ tƣơng phản chỉ sự chênh lệch về độ sáng giữa một đối tƣợng (ký hiệu là f) và vùng xung quanh của nó (ký hiệu là b). Tƣơng tự nhƣ [6, 7], trong bài báo này chúng ta cũng sử dụng độ đo tƣơng phản sau: f b C f b (3) Nâng cao độ tƣơng phản theo phƣơng pháp trực tiếp, theo [6, 7] là việc thực hiện một dãy biến đổi , , ,( , ) f b new new f bf b C C f , 0 ≤ Cf,b ≤ Cnew ≤ 1 và , , 1 , 1 1 , 1 new new new f b new new C b f b C f C b f b C (4) II.2. S-function Trong lý thuyết tập mờ, Zadeh đã định nghĩa một toán tử tăng cƣờng gọi là INT (intensification), và dạng tổng quát của nó đƣợc gọi là S-function [7], đƣợc xác định nhƣ sau: 2 2 0, 0 , ( ; , , ) 1 , 1, x a x a a x b b a c a S x a b c x c b x c c b c a c x (5) Trong [6] Cheng và cộng sự đã sử dụng hàm S- function để chuyển một ảnh xám sang miền fuzzy, sau đó nghiên cứu nâng cao độ tƣơng phản của ảnh trong miền fuzzy. Trong [7] đề xuất xây dựng phép nâng cao độ tƣơng phản trực tiếp của ảnh đa cấp xám dựa trên các đặc trƣng địa phƣơng của điểm ảnh. Đây là phƣơng pháp gốc đƣợc dùng phát triển các thuật toán sẽ đƣợc đề xuất trong phần III. II.3. Ƣớc lƣợng độ sáng nền và độ tƣơng phản điểm ảnh Phép nâng cao độ tƣơng phản trực tiếp của một ảnh xám đƣợc công bố trong [7] có thể đƣợc tóm tắt nhƣ sau: Giả sử gij là mức xám của một điểm ảnh I(i,j) at của ảnh đa cấp xám I kích thƣớc M × N, và Wij cửa sổ lân cận tại (i, j) kích thƣớc d × d. Thực hiện tuần tự các bƣớc sau: Bƣớc 1: Tính các tham số địa phƣơng đƣợc chuẩn hóa giá trị về đoạn [0, 1], gradient Eij, entropy Hij, trung bình độ lệch chuẩn Vij, và moment bậc 4 R4,ij: 1.1: Tính cƣờng độ biên ảnh: e = {eij} là giá trị cƣờng độ biên ảnh xám đầu vào bằng một toán tử xác định ảnh biên nhƣ toán tử Sobel. Các công trình nghiên cứu phát triển CNTT và Truyền thông Tập V-1, Số 17 (37), tháng 6/2017 - 62 - 1.2: Giá trị trung bình, độ lệch chuẩn = {ij}, v = {vij}, trong đó ij là giá trị trung bình mức xám, vij là độ lệch chuẩn mức xám lấy tại lân cận điểm ảnh gij ij( , ) W ij 2 pq p q g d , ij 2 ij ( , ) W ij 2 pq p q g v d (6) 1.3: Tính giá trị entropy địa phƣơng 1 ij log 2log L k k k p p h d , ij , 2 # ( , ) W : p q k p q g k p d (7) 1.4: Tính moment bậc 4 ij 4 ij ( , ) W 4,ij 2 1 pq p q g d (8) 1.5: Chuẩn hóa về miền giá trị là đoạn [0, 1] ij ij ijmax e E e , ij ij ijmax v V v ij ijmax ij h H h , 4,ij 4, 4,ijmax ijR (9) Bƣớc 2: Tính giá trị độ thuần nhất của điểm ảnh và giá trị mức xám không thuần nhất 2.1: Tính giá trị đo độ thuần nhất tại điểm ảnh ij ij ij , max HO HO (10) trong đó ij 4 ij 4, * * * 1 * 1 * 1 * 1 ij ij ij ij ij ij HO E V H R E V H R (11) 2.2: Tính giá trị mức xám không thuần nhất (non- homogeneity gray value [7]) ij ij ( , ) W ij ( , ) W (1 ) (1 ) pq pq p q pq p q g (12) Bƣớc 3: Tính giá trị độ tƣơng phản tại từng điểm ảnh và số mũ khuếch đại 3.1: Giá trị độ tƣơng phản ij ij ij ij ij g C g (13) 3.2: Số mũ khuếch đại ax min ij min ij min ax min * , m m (14) trong đó: 1 min ax 1 k m g g g g , max 1 , gk, g1 (15) là các đỉnh của histogram đƣợc xác định theo [3] 3.3: Nâng độ tƣơng phản ij' ij ij , t C C (16) trong đó tham số t {0.25, 0.5} [7] 3.4: Tính giá trị mức xám mới tại từng điểm ảnh ij ij ij ij ' ij ij ij ij ij ij' ij ij' ij ' ij ij ij ij ij ij' ij ij 1 1 , 1 1 1 1 , 1 1 t t t t C C g C C g C C g C C (17) Thuật toán [6, 7] thỏa mãn điều kiện sau: Tại từng điểm ảnh, độ thuần nhất càng cao thì mức độ nâng tƣơng phản càng thấp. Hình 3. Đồ thị số mũ khuếch đại của [7] (gần tuyến tính) Nhƣ đã đề cập trong phần I, đối với ảnh tối, thuật toán nâng cao độ tƣơng phản trực tiếp trên không thay đổi đƣợc độ sáng của ảnh. Để giải quyết vấn đề thay đổi độ sáng của ảnh sau khi tăng cƣờng độ tƣơng phản (địa phƣơng) chúng tôi đề xuất xây dựng một biến đổi ảnh F của từng kênh ảnh xám của tổ hợp kênh ảnh đầu vào. Khi đó độ tƣơng phản đƣợc tính công thức (13) sẽ đƣợc thay đổi thành: ij ij ij (i, j) ( ) , ( , ) ( ) F F C F i j F (18) ở đây ta đồng nhất biến đổi F với ảnh {F(i, j)}. Các công trình nghiên cứu phát triển CNTT và Truyền thông Tập V-1, Số 17 (37), tháng 6/2017 - 63 - Trong [6], các tác giả cũng đã xây dựng một biến đổi mờ hóa ảnh áp dụng cho quy trình nâng cao độ tƣơng phản trực tiếp. Nhƣ đã phân tích ở phần I, biến đổi ảnh này có thể làm mất chi tiết ảnh. Để chi tiết chúng tôi sẽ tóm lƣợc lại phép mờ hóa kênh ảnh của [7] nhƣ mục sau: II.4. Ƣớc lƣợng dải động mức xám và biến đổi - mờ hóa ảnh sử dụng S-function Dựa trên histogram của ảnh, trong [6, 7] các tác giả đã nhận thấy đỉnh đầu tiên của histogram của ảnh liên quan đến vùng nền và mức xám lớn hơn đỉnh sau cùng có thể là nhiễu. Vì vậy các tác giả đã đề xuất cách xác định một dải động của mức xám nhƣ sau: Đặt ax 1 ax is ( ) is ( ) , k m i i m H g H g k (19) trong đó k là số điểm cực đại địa phƣơng) của histogram, Hismax(g1), , Hismax(gk) là các điểm cực đại địa phƣơng của histogram, g1, gk là điểm cực đại địa phƣơng đầu tiên và sau cùng tƣơng ứng sao cho: Hismax(g1) axis ( ),mH g Hismax(gk) axis ( )mH g (20) Dải động mức xám là đoạn [a, c] ở đó a = min{(1 - f2)(g1 - Lmin) + Lmin, B1} c = max{f2(Lmax - gk) + gk, B2}, (21) trong đó B1, B2 đƣợc xác định : ax1 min min 1is( ) is( ) mLB i L i L H i f H i ax ax 2 min 1is( ) is( ), m mL L i B i L H i f H i (22) và Lmin, Lmax là giá trị mức xám nhỏ nhất và lớn nhất của kênh ảnh, các hằng số f1 = 0.01, f2 = 0.5 đƣợc xác định bằng thực nghiệm. Từ dải động mức xám [a, c] đã ƣớc lƣợng trên, trong [6] đã trình bày một thuật toán để mờ hóa ảnh đầu vào trƣớc khi nâng cao độ tƣơng phản của ảnh đầu vào. III. KỸ THUẬT ĐỀ XUẤT Phần này trình bày kỹ thuật ƣớc lƣợng các dải động của mức xám sử dụng phân cụm mờ FCM, phép biến đổi kênh ảnh và kỹ thuật nâng cao độ tƣơng phản của ảnh màu xét trong biểu diễn màu HSV. III.1. Ƣớc lƣợng nhiều dải động mức xám dựa vào phân cụm mờ FCM Phân cụm mờ c-mean (FCM [4]), đƣợc sử dụng hiệu quả trong một số nghiên cứu về nâng cao độ tƣơng phản của ảnh một kênh. Trong [16] đã trình bày một cách xác định dải động của miền giá trị mức xám bằng cách sử dụng thuật toán phân cụm mờ FCM, khi đó các cụm ảnh có tính chất đều hơn, và do đó việc xác định dải động mức xám là tƣơng đối dễ dàng. Ngoài ra trong [15] các tác giả cũng sử dụng FCM để phân đoạn histogram và nâng cao độ tƣơng phản theo bộ phận của histogram. Để có thể ƣớc lƣợng tự động dải động mức xám cho nhiều loại ảnh khác nhau nhƣ ảnh tối, ảnh sáng, ảnh có độ tƣơng phản thấp và ảnh có độ tƣơng phản cao, chúng tôi đề xuất sử dụng phân cụm mờ để ƣớc lƣợng dải động của mức xám của từng kênh ảnh của ảnh đa kênh. Lƣu ý rằng trong một số biểu diễn màu nhƣ biểu diễn màu RGB, các kênh ảnh là không độc lập mà có độ tƣơng quan cao, vì thế cách làm ƣớc lƣợng dải động của từng kênh ảnh độc lập là không h ... 1 t t t t C I i j C i j C I i j C V,ij V,ij V,ij V,ij V,ij V,ij V V,ij V,ij , V,ij V,ij V V,ij V,ij 1 , ( , ) 1 ( , ) 1 , ( , ) 1 t t t t V new C I i j C I i j C I i j C Bƣớc 4: Chuyển đổi ảnh (IH, IS,new, IV,new) trong biểu diễn màu HSV về biểu diễn màu RGB, ta đƣợc ảnh Inew. Bƣớc 5: Bƣớc tùy chọn, tính các chỉ số CM{R,G,B} cho kênh R, G và B, Eavg và Havg nhƣ sau: 5.1: Tính tham số của [7] cho kênh IR, IG và IB của ảnh gốc I nhƣ đã trình bày trong mục II.3 (xem các công thức tử (6) đến (12) với kích thƣớc cửa sổ dxd, cụ thể là các giá trị mức xám không thuần nhất {δR,ij}, {δG,ij}, và {δB,ij} của các ảnh đa cấp xám IR, IG và IB tƣơng ứng. 5.2: Tính CMR, CMG, CMB theo công thức (31), cụ thể là: , ,ij ij , ,ij ( , ) ( , ) * new R R new R R R I i j I i j CM M N , ,ij ij , ,ij ( , ) ( , ) * new G G new G G G I i j I i j CM M N , ,ij ij , ,ij ( , ) ( , ) * new B B new B B B I i j I i j CM M N 5.3: Tính Eavg = Eavg{Inew,R, Inew,G, Inew,B} theo công thức (32). Tính Havg = Havg{Inew,R, Inew,G, Inew,B} theo công thức (35) Trả về: Inew, và các tùy chọn trả về CMR, CMG, CMB , Eavg , Havg Bảng 2 là giá trị chỉ số của các ảnh #1 - #6, đƣợc tính từ các công thức (31) đến (35). Bảng 2. Giá trị chỉ số ảnh thể hiện. Ảnh CMR CMG CMB Eavg Havg #1 0.1180 0.1914 0.2482 5.9395 0.3456 #2 0.0160 0.0191 0.0314 7.315 0.8216 #3 0.0154 0.0188 0.0548 7.4847 0.8001 #4 0.0256 0.0298 0.0511 7.4536 0.8642 #5 0.0170 0.0293 0.0345 7.3092 0.8504 #6 0.0273 0.0304 0.0364 3.4443 0.2861 Các công trình nghiên cứu phát triển CNTT và Truyền thông Tập V-1, Số 17 (37), tháng 6/2017 - 70 - IV.4. Các kết quả và luận giải Trong phần này chúng tôi trình bày hai kiểm thử, chúng bao gồm: (A) Phép mờ hóa - biến đổi ảnh sử dụng phân cụm mờ cho tổ hợp kênh ảnh (B) Thử nghiệm nâng cao độ tương phản sử dụng biến đổi ảnh trên 2 kênh ảnh (kênh S và kênh V) trong biểu diễn màu HSV. A. Thực nghiệm để kiểm tra hiệu quả của Phép mờ hóa-biến đổi ảnh sử dụng phân cụm mờ cho tổ hợp kênh ảnh so với phép mờ hóa của [7]. Trong thử nghiệm này, trên từng kênh ảnh riêng rẽ R, G và B chúng tôi thực hiện phép mờ hóa bằng biến đổi S-function đƣợc xây dựng trong [6]. Hàm biến đổi S(x; a, b, c) với các tham số a và c đƣợc xác định dựa trên phân tích histogram của kênh ảnh và tham số b đƣợc dò tìm bằng phép cực đại hóa fuzzy entropy. Thuật toán 1 của chúng tôi thực hiện đồng thời cho 3 kênh ảnh R, G và B, tham số f1, f2 để ƣớc lƣợng khoảng động mức xám [B1,c,k B2,c,k] của từng cụm c ứng với kênh R, G và B đƣợc xác định dựa trên thực nghiệm, fcut = 0.005. Thuật toán phân cụm tập vector giá trị điểm ảnh {IR(i, j), IG(i, j), IB(i, j)} sử dụng số cụm C [2,10]. Trong thực nghiệm này chúng tôi chọn C = 5. Bảng 3. So sánh giá trị Havg trên kênh R, G và B của các ảnh là kết quả của phép mờ hóa – biến đổi ảnh Ảnh Havg (sử dụng [7]) Havg (sử dụng thuật toán 1) #1 0.4478 0.4950 #2 0.6931 0.7879 #3 0.5736 0.7200 #4 0.5822 0.7624 #5 0.6227 0.8157 #6 0.3374 0.3512 Bảng 3 cho chúng ta thấy độ không chắc chắn của phép mờ hóa sử dụng nhiều dải động mức xám của thuật toán đề xuất 1 cao hơn so với phƣơng pháp sử dụng một dải động mức xám của [6]. Điều này cũng phù hợp với trực quan khi quan sát các ảnh mờ hóa minh họa của #1 và #2. (a) (b) Hình 9. (a) Ảnh mờ hóa của ảnh #1 sử dụng [6]; (b) Ảnh kết quả sử dụng thuật toán đề xuất 1 Trên hình ảnh mờ hóa của ảnh #1 sử dụng biến đổi của [6], chúng ta thấy rõ chi tiết ảnh ở các vùng đƣợc đánh dấu hình chữ nhật là bị mất, trong khi đó ảnh biến đổi sử dụng nhiều dải động ƣớc lƣợng từ phân cụm FCM cho tổ hợp kênh RGB (thuật toán 1) chi tiết ảnh đƣợc giữ tốt hơn. Quan sát các kênh G và B của ảnh biến đổi của ảnh #2 sau đây ta cũng thấy độ chi tiết của ảnh biến đổi sử dụng [6] cũng bị suy giảm nhiều hơn biến đổi ảnh dựa trên thuật toán 1 đã đề xuất. (a) (b) (c) (d) Hình 10. Kênh G và kênh B của ảnh biến đổi sử dụng [6] (a), (c). Kênh G và kênh B của ảnh biến đổi sử dụng thuật toán 1 (b), (d). Phân tích trên lại cho thấy việc biến đổi của [6] chỉ sử dụng chỉ một bộ tham số {a, bopt, c} liên quan đến dải động mức xám của kênh ảnh cho một dạng hàm biến đổi nhƣ S-function để biến đổi ảnh có thể làm mất chi tiết ảnh. Trái lại, phƣơng pháp sử dụng nhiều dải động của mức xám {B1,c,k, B2,c,k} đƣợc ƣớc lƣợng Các công trình nghiên cứu phát triển CNTT và Truyền thông Tập V-1, Số 17 (37), tháng 6/2017 - 71 - từ histogram mờ, nhƣ của thuật toán 1 đã giữ đƣợc chi tiết ảnh tốt hơn. (a) (b) Hình 11. Sử dụng biến đổi ảnh [6] với một dải động mức xám cho ảnh #3(a), #5 (b) và áp dụng [7]. Trên Hình 11, các ảnh kết quả minh họa bị mất chi tiết ảnh, xem ở các vùng chữ nhật đánh dấu. Điều đó chứng tỏ sự hạn chế của việc chỉ dùng một dải động mức xám cho các biến đổi ảnh. B. Thử nghiệm nâng cao độ tƣơng phản sử dụng thuật toán đề xuất 2 trên hai kênh ảnh S và V trong biểu diễn màu HSV của ảnh đầu vào so với sử dụng thủ tục 1 (dựa vào thuật toán gốc). Trong thử nghiệm này, chúng tôi thực hiện kiểm tra hiệu quả của thuật toán 2 đề xuất sử dụng phép phân cụm FCM để xác định tham số cho phép biến đổi ảnh trong định nghĩa 3.2, công thức (27) so với sử dụng thủ tục 1 trên 2 kênh ảnh S và V riêng rẽ. Các bƣớc đƣợc thực hiện nhƣ sau: Đầu tiên, chuyển biểu diễn màu RGB sang biểu diễn màu HSV của ảnh đầu vào. Phân cụm dữ liệu mức xám tổ hợp kênh S và kênh V với tham số đƣợc chọn nhƣ trong thử nghiệm A (số cụm C = 5 v.v). trên từng kênh ảnh S và kênh V riêng rẽ ƣớc lƣợng {B1,c,k, B2,c,k} (k {S, V}) và thực hiện biến đổi ảnh cho kênh S và kênh V tƣơng ứng sử dụng hàm biến đổi FS, FV (công thức (27)) có tham số của các hàm biến đổi là các dải động mức xám ƣớc lƣợng từ thuật toán 1. Thứ hai, xác định giá trị độ tƣơng phản theo thuật toán 2 và các bƣớc liên quan cho kênh ảnh S và V đã biến đổi ở bƣớc thứ nhất với kích thƣớc cửa sổ 3x3 và tham số t = 0.25 (công thức (16)). Thứ ba, tổng hợp lại các kênh ảnh H gốc, kênh S và kênh V đã nâng cao độ tƣơng phản, sau đó biến đổi ngƣợc từ biểu diễn HSV sang biểu diễn RGB. Cuối cùng, tính giá trị mức xám không thuần nhất tại từng điểm ảnh ứng với các kênh ảnh R, G và B (các giá trị này đƣợc dùng để tính độ đo tƣơng phản trung bình trên từng kênh R, G và B trong bảng 4). Giá trị trung bình độ tƣơng phản trực tiếp CM đƣợc tính trên kênh R, G và B trong biểu diễn màu RGB của ảnh đầu vào đƣợc tính với ảnh giá trị mức xám trung bình không thuần nhất của từng kênh R, G và B của ảnh RGB gốc và ảnh kết quả đầu ra khi sử dụng thủ tục 1 và phƣơng pháp đề xuất (thuật toán 2) đƣợc thể hiện ở Bảng 4. Bảng 4. Kết quả chỉ số ảnh đầu ra của thủ tục 1(gốc), và thuật toán 2 đề xuất trên từng kênh ảnh R, G và B. Ảnh CMR CMG CMB Thủ tục 1 gốc Thuật toán 2 Thủ tục 1 gốc Thuật toán 2 Thủ tục1 gốc Thuật toán 2 #1 0.1244 0.2143 0.1961 0.2575 0.2511 0.3373 #2 0.0157 0.1676 0.0193 0.1685 0.0320 0.1728 #3 0.0155 0.2157 0.0192 0.2166 0.0543 0.2351 #4 0.0284 0.1232 0.0338 0.1254 0.0570 0.1385 #5 0.0170 0.0967 0.0299 0.1003 0.0352 0.1033 #6 0.0275 0.0861 0.0307 0.0879 0.0375 0.0870 Bảng 5. Kết quả chỉ số ảnh đầu ra của thủ tục 1(gốc), và thuật toán 2 đề xuất trên từng kênh ảnh R, G và B. Ảnh Eavg Havg Thủ tục 1 gốc Thuật toán 2 Thủ tục 1 gốc Thuật toán 2 #1 5.8446 6.1855 0.3456 0.3077 #2 6.8158 7.2568 0.8216 0.7004 #3 6.9599 7.0051 0.8001 0.6737 #4 7.2337 7.4179 0.8642 0.7947 #5 7.0103 7.5376 0.8504 0.8233 #6 3.0140 4.0173 0.2868 0.2861 Bảng 4 và 5 của kết quả thực nghiệm của các ảnh #1 - #6 đã thể hiện các chỉ số khách quan độ tƣơng phản trực tiếp trên từng kênh R, G và B khi sử dụng thuật toán 2 đều cho kết quả cao hơn khi sử dụng thuật toán [7]. Chỉ số khách quan Eavg khi áp dụng thuật toán 2 cũng cao hơn so với áp dụng thủ tục 1. Cũng vậy, chỉ số khách quan Havg khi áp dụng thuật toán 2, ngoài ảnh #1, đều có giá trị nhỏ hơn so với chỉ số ảnh kết quả khi áp dụng thủ tục 1. Các công trình nghiên cứu phát triển CNTT và Truyền thông Tập V-1, Số 17 (37), tháng 6/2017 - 72 - (a) (b) (c) (d) (e) (g) (h) (k) (l) (m) (n) (p) Hình 12. Ảnh kết quả (các ảnh cột bên trái ) sử dụng [7] Ảnh kết quả (các ảnh cột bên phải) sử dụng thuật toán 2. V. KẾT LUẬN Trong bài báo này chúng tôi đã đề xuất 3 đóng góp mới cho phƣơng pháp nâng cao độ tƣơng phản ảnh màu theo tiếp cận trực tiếp. Thứ nhất, chúng tôi đề xuất một phƣơng pháp biến đổi ảnh mới sử dụng nhiều hàm S-function đƣợc tham số hóa ứng với từng dải động mức xám. Các dải động mức xám này đƣợc ƣớc lƣợng tự động bằng thuật toán phân cụm FCM. Phƣơng pháp này đƣợc so sánh trực tiếp với phƣơng pháp biến đổi sử dụng một hàm S- function với tham số hóa dựa trên cực đại fuzzy entropy [6]. Thứ hai, chúng tôi cũng đề xuất một thuật toán mới theo phƣơng pháp nâng cao độ tƣơng phản trực tiếp cho ảnh màu dựa trên thuật toán trong [7]. Cuối cùng, là một cải tiến nhỏ để tăng độ trơn của các giá trị độ thuần nhất của điểm ảnh khi thay đổi cách kết nhập các giá trị địa phƣơng (tại từng điểm ảnh) nhƣ gradient, entropy, độ lệch chuẩn trung bình và moment bậc 4 so với cách kết nhập của [7]. Kết qủa thực nghiệm đã chứng tỏ rằng các kỹ thuật đề xuất của chúng tôi làm việc tốt với đa dạng ảnh màu. Ảnh nâng cao độ tƣơng phản trơn và sự thay đổi mức độ sáng trong khi vẫn bảo toàn chi tiết ảnh gốc tốt hơn so với phƣơng pháp đƣợc công bố trong [6, 7]. Độ sáng của các kênh ảnh sau khi nâng cao độ tƣơng phản tƣơng đồng với độ sáng ảnh đầu ra của các phƣơng pháp gián tiếp. Trong các nghiên cứu tiếp theo, chúng tôi sẽ tiếp tục nghiên cứu các dạng kết nhập khác của các đặc trƣng địa phƣơng nhƣ gradient, entropy, độ lệch trung bình và moment bậc 4 dạng HOij = f(Eij, Hij, Vij, R4,ij) khi tính độ thuần nhất tại từng điểm ảnh. TÀI LIỆU THAM KHẢO [1] S. S. Agaian, S. Blair and K. A. Panetta, “Transform coefficient histogram-based image enhancement algorithms using contrast entropy”, IEEE Trans. Image Processing, vol. 16, no. 3, (2007): 741-758. [2] Arici T., Dikbas S., and Altunbasak Y., “A Histogram Modification Framework and Its Application for Image Contrast Enhancement,” IEEE Transactions on Image Processing, vol. 18, no. 9, (2009):1921-1935. Các công trình nghiên cứu phát triển CNTT và Truyền thông Tập V-1, Số 17 (37), tháng 6/2017 - 73 - [3] A. Beghdadi, A.L. Negrate, “Contrast enhancement technique based on local detection of edges”, Comput. Vision Graphics Image Process. 46 (1989):162–174. [4] Bezdek, James C. Pattern recognition with fuzzy objective function algorithms. Springer Science & Business Media, (2013). [5] A.O. Boudraa and E. H. S. Diop, “Image contrast enhancement based on 2D teager-kaiser operator”, Proc. of the IEEE International Conference on Image Processing, (2008.): 3180-3183. [6] Cheng H.D, Huijuan Xu, “A novel fuzzy logic approach to contrast enhancement”, Pattern Recognition 33 (2000):809-819. [7] Cheng H.D., Mei Xue, Shi X,J., “Contrast enhancement based on a novel homogeneity measurement”, Pattern Recognition 36 (2003):2687 – 2697. [8] L.Dash, B.N. Chatterji, “Adaptive contrast enhancement and de-enhancement” , Pattern Recognition 24 (1991) :289–302. [9] A.P. Dhnawan, G. Buelloni, R. Gordon, Enhancement of mammographic features by optimal adaptive neighborhood image processing, IEEE Trans. Med. Imaging 5 (1986):8–15. [10] M. M. Gupta, J. Qi, “Theory of T-norms and fuzzy inference methods”, Fuzzy Sets and Systems 40, (1991):431-450. [11] Hanmandlu M., Devendra Jha, Rochak, “Color image enhancement by fuzzy intensification”, Pattern Recognition Letters 24 (2003):81–87. [12] Hanmandlu M, Devendra Jha, “An Optimal Fuzzy System for Color Image Enhancement”, IEEE Transactiong on Image Processiong, Vol. 15, No.10 (2006): 2956-2966. [13] S. Lee, “An efficient content-based image enhancement in the compressed domain using Retinex theory”, IEEE Trans. Circuits and Systems for Video Technology, vol. 17, no. 2, pp. (2007):199-213. [14] Ponomarenko N. Ponomarenko, L. Jin, O. Ieremeiev, V. Lukin, K. Egiazarian, J. Astola, B. Vozel, K. Chehdi, M. Carli, F.Battisti, C.-C. Jay Kuo, “Image database TID2013: Peculiarities, results and perspectives, Signal Processing”, Imag Communication, vol. 30, Jan. (2015):57-77. [15] M. Shakeri, M.H. Dezfoulian, H. Khotanlou, A.H. Barati, Y. Masoumi, Image contrast enhancement using fuzzy clustering with adaptive cluster parameter and sub-histogram equalization, Digital Signal Processing 62, (2017) :224–237. [16] Shen-Chuan Tai, Ting-Chou Tsai, Yi-Ying Chang, Wei-Ting Tsai and Kuang-Hui Tang, “Contrast Enhancement through Clustered Histogram Equalization”, Research Journal of Applied Sciences, Engineering and Technology 4(20), (2012):3965-3968, ISSN: 2040-7467. [17] M. J. Soha and A. A. Schwartz, “Multi- dimensional histogram normalization contrast enhancement,” in Proc. 5th Canad. Symp.. Remote Sensing, (1978):86–93. Nhận bài ngày: 12/01/2017 Các công trình nghiên cứu phát triển CNTT và Truyền thông Tập V-1, Số 17 (37), tháng 6/2017 - 74 - SƠ LƢỢC VỀ TÁC GIẢ NGUYỄN VĂN QUYỀN Sinh năm 1979 tại Hải Phòng. Nhận bằng thạc sĩ chuyên ngành Khoa học máy tính tại trƣờng ĐH Sƣ phạm Hà Nội, năm 2008 Đang là NCS tại Viện CNTT – Viện Hàn lâm KH&CN Việt Nam Hiện công tác tại Phòng QLSĐH, trƣờng ĐH Hải Phòng Lĩnh vực nghiên cứu: Xử lý ảnh, khai phá dữ liệu, tính toán mềm Điện thoại: 0904.815.444 Email: quyenqlkh.dhhp@gmail.com TRẦN THÁI SƠN Sinh năm 1955, tại Nghệ An Nhận học vị tiến sĩ năm 1990, tại Viện hàn lâm Khoa học Liên Xô Hiện công tác tại Viện CNTT, Viện Hàn lâm KH&CN Việt Nam Lĩnh vực nghiên cứu: Lập luận xấp xỉ, tính toán mềm Điện thoại: 0903409894 Mail: ttson@ioit.ac.vn NGUYỄN TÂN ÂN Sinh năm 1953 tại Hà Nội. Nhận bằng tiến sĩ năm 2002, tại trƣờng ĐH Năng lƣợng Maxcơva; nhận học hàm PGS năm 2012 tại Viêt Nam. Hiện công tác tại Khoa CNTT, Học viện Quản lý Giáo dục. Lĩnh vực nghiên: Trí tuệ nhân tạo, Mạng nơron nhân tạo, Tính toán mềm, Giáo dục tin học Điện thoại: 0912 321 559 Email: nguyentanan@yahoo.com NGÔ HOÀNG HUY Sinh năm 1969 tại Hà Nội. Tốt nghiệp chuyên ngành Toán tin tại trƣờng ĐH Sƣ phạm Hà Nội năm 1990. Hiện công tác tại Viện CNTT, Viện Hàn lâm KH&CN Việt Nam Lĩnh vực nghiên cứu: Xử lý ảnh, Xử lý tiếng nói, Trí tuệ nhân tạo, Khai phá dữ liệu, Hệ thống nhúng. Điện thoại: 0904140022 Email: huyngo3i@gmail.com ĐẶNG DUY AN Sinh năm 1974 tại Thái Nguyên. Nhận bằng thạc sĩ tại Đại học Thái Nguyên, năm 2014. Hiện công tác tại Công ty tập đoàn CDC CORP - Viện máy và Dụng cụ Công nghiệp - Bộ Công Thƣơng Lĩnh vực nghiên cứu: Trí tuệ nhân tạo, khai phá dữ liệu, hệ thống nhúng Điện thoại: 0913215111 Mail: duyanimi@gmail.com
File đính kèm:
- mot_phuong_phap_moi_nang_cao_do_tuong_phan_anh_mau_theo_huon.pdf