Giáo trình Xử lý ảnh - Chương 19: Nhận dạng mẫu. Kích thước đối tượng

Diện tích và chu vi

Diện tích của một đối tượng nói chung là một phép đo kích thước đối tượng thích

hợp. Tuỳ thuộc vào đường bao của đối tượng mà một phép đo diện tích thường

không để ý đến những thay đổi mức xám bên trong. Chu vi của một đối tượng rất

hữu dụng trong việc phân biệt hình dạng đơn giản và phức tạp giữa các đối tượng.

Một đối tượng có hình dạng đơn giản sử dụng chu vi nhỏ hơn để bao quanh diện tích

của nó. Các phép đo diện tích và chu vi được tính toán dễ dàng trong suốt quá trình

trích một đối tượng từ một ảnh phân đoạn.

Định nghĩa đường bao. Trước khi chúng ta có thể chỉ rõ một thuật giải để đo

lường diện tích hay chu vi một đối tượng, chúng ta phải thiết lập một định nghĩa về

đường bao đối tượng. Đặc biệt, chúng ta phải đảm bảo rằng chúng ta sẽ không đo

lường chu vi một đa giác này và diện tích của đa giác khác. Vấn đề cần phải giải

quyết là, các điểm ảnh bao quanh hoàn toàn hay chỉ bao quanh từng phần của đối

tượng? Nói cách khác, đường bao thực sự của một đối tượng nối liền tâm các điểm

ảnh hay bao quanh các biên bên ngoài của chúng?

Diện tích tổng số điểm ảnh. Phép đo diện tích đơn giản nhất là đếm số lượng

điểm ảnh bên trong (và kể cả) đường bao. Chu vi tương ứng với định nghĩa này là381

khoảng cách xung quanh phía ngoài tất cả các điểm ảnh. Bình thường, phép đo

khoảng cách này bao gồm một lượng lớn các chỗ rẽ ngoặt 900, do đó tạo ra một giá

trị chu vi quá mức.

pdf 21 trang kimcuc 2941
Bạn đang xem 20 trang mẫu của tài liệu "Giáo trình Xử lý ảnh - Chương 19: Nhận dạng mẫu. Kích thước đối tượng", để tải tài liệu gốc về máy hãy click vào nút Download ở trên

Tóm tắt nội dung tài liệu: Giáo trình Xử lý ảnh - Chương 19: Nhận dạng mẫu. Kích thước đối tượng

Giáo trình Xử lý ảnh - Chương 19: Nhận dạng mẫu. Kích thước đối tượng
 380 
Ch­¬ng 19 
NHẬN DẠNG MẪU: 
KÍCH THƯỚC ĐỐI TƯỢNG 
19.1. GIỚI THIỆU 
Trong chương 18, chúng ta đã giới thiệu về nhận dạng mẫu và đã đề cập đến sự 
tách và trích các đối tượng từ một cảnh phức tạp. Trong chương này, chúng ta sẽ chỉ 
ra những vấn đề về đo lường các đối tượng, để có thể nhận biết chúng thông qua các 
số đo của chúng. Vấn đề này đã tốn rất nhiều giấy mực và ở đây chúng ta chỉ có thể 
giới thiệu các khái niệm cơ bản mà thôi. Để nghiên cứu chi tiết hơn, độc giả nên 
tham khảo tài liệu về phân tích ảnh. (Phụ lục 2) 
19.2. ĐO LƯỜNG KÍCH THƯỚC 
Trong phần này, chúng ta sẽ xem xét một vài đặc tính hữu dụng phản ảnh kích 
thước một đối tượng. Những đặc tính này đã trở nên phổ biến vì chúng quan trọng 
trong các bài toán nhận dạng mẫu khác nhau và chúng rất thích hợp cho phân tích 
ảnh số. 
Thứ nhất nó rất thuận tiện để tính giới hạn không gian dưới dạng các điểm ảnh và 
giới hạn quang trắc (photometric) dưới dạng mức xám. Sau đó, chiều dài diện tích có 
thể được xác định bằng cách nhân chúng với khoảng cách điểm ảnh hay diện tích 
một điểm ảnh thích hợp. Đường cong xác định quang trắc của bộ số hoá có tác dụng 
như một phương tiện chuyển đổi mức xám thành đơn vị quang trắc. Thường thì đây 
là một biểu thức tuyến tính đơn giản. Các phép toán điểm bất kỳ (chương 6) được 
thực hiện trên ảnh cũng phải được sáng tỏ trong sự xác định quang trắc. 
19.2.1. Diện tích và chu vi 
Diện tích của một đối tượng nói chung là một phép đo kích thước đối tượng thích 
hợp. Tuỳ thuộc vào đường bao của đối tượng mà một phép đo diện tích thường 
không để ý đến những thay đổi mức xám bên trong. Chu vi của một đối tượng rất 
hữu dụng trong việc phân biệt hình dạng đơn giản và phức tạp giữa các đối tượng. 
Một đối tượng có hình dạng đơn giản sử dụng chu vi nhỏ hơn để bao quanh diện tích 
của nó. Các phép đo diện tích và chu vi được tính toán dễ dàng trong suốt quá trình 
trích một đối tượng từ một ảnh phân đoạn. 
Định nghĩa đường bao. Trước khi chúng ta có thể chỉ rõ một thuật giải để đo 
lường diện tích hay chu vi một đối tượng, chúng ta phải thiết lập một định nghĩa về 
đường bao đối tượng. Đặc biệt, chúng ta phải đảm bảo rằng chúng ta sẽ không đo 
lường chu vi một đa giác này và diện tích của đa giác khác. Vấn đề cần phải giải 
quyết là, các điểm ảnh bao quanh hoàn toàn hay chỉ bao quanh từng phần của đối 
tượng? Nói cách khác, đường bao thực sự của một đối tượng nối liền tâm các điểm 
ảnh hay bao quanh các biên bên ngoài của chúng? 
Diện tích tổng số điểm ảnh. Phép đo diện tích đơn giản nhất là đếm số lượng 
điểm ảnh bên trong (và kể cả) đường bao. Chu vi tương ứng với định nghĩa này là 
 381 
khoảng cách xung quanh phía ngoài tất cả các điểm ảnh. Bình thường, phép đo 
khoảng cách này bao gồm một lượng lớn các chỗ rẽ ngoặt 900, do đó tạo ra một giá 
trị chu vi quá mức. 
Chu vi đa giác. Có lẽ một phương pháp tiếp cận thích hợp hơn để đo chu vi một 
đối tượng là thiết lập đường bao đối tượng đa giác có đỉnh nằm tại tâm của từng điểm 
ảnh bao quanh. Chu vi là tổng của các đoạn bên ( p = 1) và các đoạn chéo 
( 2 p ). Tổng này có thể được tích luỹ trong khi trích đối tượng bằng cách mã 
hoá phân doạn dòng (Xem phần 18.8.3) hay đi qua vòng quanh đường bao trong khi 
xây dựng mã chuỗi (Xem phần 18.8.2). chu vi của một đối tượng là 
 oe NNp 2 (1) 
trong đó Ne là số các đoạn chẵn và No là số các đoạn lẻ trong chuỗi mã đường bao 
khi sử dụng quy ước của hình 18-30. Chu vi cũng được tính đơn giản từ các tệp phân 
đoạn đối tượng bằng tổng khoảng cách tâm đến tâm các điểm ảnh liên tiếp nhau trên 
đường bao. 
Diện tích đa giác. Diện tích đa giác được định nghĩa theo tam điểm ảnh là tổng 
số điểm ảnh trừ đimột nửa lượng điểm ảnh đường bao cộng thêm một; tức là 
 1
2
b
o
N
NA (2) 
trong đó No và Nb là số lượng các điểm ảnh tương ứng thuộc đối tượng (bao gồm 
cả các điểm ảnh bao) và trên đường bao. Chỗ đúng này của diện tích tổng số điểm 
ảnh thừa nhận, tính trung bình, một nửa điểm ảnh bao nằm trong, một nửa ngoài đối 
tượng. Hơn thế nữa, khi một đường cong kín quay bị ngang, một giá trị nữa của điểm 
ảnh thuộc vùng nằm bên ngoài, là do độ lồi thực của đối tượng. Người ta có thể hiệu 
chỉnh phép đo diện tích gần đúng xuất phát từ tổng số điểm ảnh bằng cách trừ đi một 
nửa chu vi. 
19.2.1.1. Tính diện tích và chu vi 
Có một phương pháp đơn giản để tính diện tích và chu vi một đa giác theo một 
đường đi của đa giác. Hình 19-1 minh hoạ trường hợp diện tích đa giác là tổng của 
diện tích tất cả các tam giác do các đường nối các đỉnh với điểm (x0, y0) tuỳ ý tạo ra. 
Không mất tính tổng quát, chúng ta có thể chọn điểm (x0, y0) là gốc hệ toạ độ của 
ảnh. 
Hình 19-2 giúp chúng ta có được một biểu thức diện tích một tam giác có một 
đỉnh nằm tại gốc toạ độ. Các đường ngang và dọc chia khu vực thành những hình 
chữ nhật. Một số hình nhận có đường chéo là các cạnh của tam giác. Vì thế, nửa diện 
tích của mối hình chữ nhật như vậy nằm ngoài tam giác. Nhìn vào hình, ta có thể viết 
 2112221112 2
1
2
1
2
1 yyxxyxyxyxdA (3) 
 382 
HÌNH 19-1 
Hình 19-1 Tính diện tích đa giác 
HÌNH 19-2 
Hình 19-2 Tính diện tích tam giác 
Khai triển và nhóm các số hạn, biểu thức này được đơn giản hoá thành 
 12212
1 yxyxdA (4) 
Và diện tích tổng cộng trở thành 
  
bN
i
iiii yxyxA
1
112
1 (5) 
Trong đó Nb là số lượng các điểm biên. 
Lưu ý rằng, nếu gốc toạ độ nằm ngoài đối tượng thì một tam giác đặc biệt nào đó 
bao gồm cả một số vùng không thuộc đa giác. Cũng cần lưu ý rằng diện tích của mọt 
tam giác đặc biệt có thể dương hay âm, tuỳ thuộc vào chiều đi của đường bao. Khi 
một vòng kín bao quanh đường bao được tạo ra, tất cả những vùng nằm ngoài đối 
tượng đều bị loại trừ ra. 
Một tiếp cận đơn giản hơn cũng mang lại kết quả như vậy chính là nhờ định lý 
Green. Định lý này xuất phát từ phép tính tích phân và phát biểu rằng diện tích được 
bao bởi một đường cong kín trong mặt phẳng x, y được cho bởi tích phân kín 
 ydxxdyA 2
1 (6) 
Trong đó tích phân được lấy theo đường cong kín. đối với các đoạn rời, biểu thức 
(6) trở thành 
 383 
  
bN
i
iiiiii xxyyyxA
1
112
1 (7) 
Biểu thức này có dạng của biểu thức (5). 
Chu vi tương ứng là tổng chiều dài các cạnh của đa giác. Nếu tất cả các điểm biên 
của đa giác được coi như là các đỉnh, thì chu vi sẽ là tổng tất cả các số đo bên và 
chéo. 
19.2.1.2. Làm trơn đường bao 
Thường thường, số đo chu vi cao một cách giả tạo vì nhiễu và vì các điểm biên bị 
lưới lấy mẫu hình chữ nhật hạn chế. Làm trơn đường bao bằng xử lý ảnh nhị phân 
(Phần 18.7) có thể giảm nhiễu, nhưng không thể làm giảm bớt những đường bọc 
quanh mẫu. 
Tuy nhiên, làm trơn đường bao có thể được xây dựng thêm thành phép đo diện 
tích và chu vi bằng cách chỉ sử dụng một tập con các điểm ảnh bao như các đỉnh. 
Đặc biệt trong các vùng có độ cong ít, ta có thể bỏ qua các điểm ảnh bao. Tuy nhiên, 
có quá nhiều vùng như vậy có thể làm mất đi hình dạng thật sự của đối tượng và làm 
giảm độ chính xác của phép đo. 
Làm trơn đường bao cũng có thể bị tác động bởi việc biểu diễn đường bao theo 
tham số. Nếu đối tượng có dạng lồi thì đường bao có thể được biểu diễn trong toạ độ 
cực xung quanh một điểm nào đó trong đối tượng (hình 19-3a). Trong trường hợp 
này, đường bao được chỉ rõ bằng một hàm dạng (). Yêu cầu duy nhất là chỉ có 
một giá trị với mọi . 
HÌNH 19-3 
Hình 19-3 Biểu diễn đường bao tham số: (a) hàm đường bao cực; (b) hàm đường 
bao phức 
Nếu hình dạng phức tạp đến nỗi không tồn tại một điểm nào như vậy, thì đường 
bao có thể được biểu diễn bởi một hàm đường bao phức tổng quát hơn 
 iii jyxpB (8) 
Trong đó pi là quãng đường dọc theo đường bao từ một điểm tuỳ ý đến điểm biên 
thứ i và i = 1, , Nb là chỉ số của các điểm biên (hình 19-3b). 
Trong cả hai trường hợp, hàm đường bao tham số đều tuần hoàn. Trong một chu 
kỳ, nó có thể được lọc thông thấp trong miền tần số bằng (1) một biến đổi Fourier, 
(2) bằng cách nhân với một hàm truyền đạt thông thấp không pha (chẵn hoặc lẻ) và 
(3) bằng một biến đổi Fourier ngược. 
 384 
Các điểm thuộc hàm đường bao đã làm trơn không bị lưới lấy mẫu hạn chế nữa. 
có thể sử dụng tất cả hoặc một tập con các điểm nói trên như các đỉnh trong các phép 
tính diện tích và chu vi. Ngoài ra, ta phải sử dụng các đỉnh đã chọn trên đường bao 
để đảo ngược độ cong. 
19.2.2. Mật độ trung bình và mật độ tích hợp 
IOD (Integrated Optical Density) là tổng mức xám của tất cả các điểm ảnh trong 
đối tượng. Nó phản ánh “khối lượng” hay “trọng lượng” đối tượng và về mặt số 
lượng, nó bằng diện tích nhân với mức xám bên trong đối tượng. Sự tính toán IOD 
đã được trình bày trong chương 5. mật độ trung bình đơn thuần chỉ là IOD chia cho 
diện tích. 
19.2.3. Chiều dài và chiều rộng 
Đây là phương pháp dễd dàng để tính phạm vi chiều ngang và chiều dọc một đối 
tượng trích ra từ một ảnh. Chỉ cần chỉ số hàng nhỏ nhất và lớn nhất, cũng như chỉ số 
cột nhỏ nhất và lớn nhất cho phép tính này. Tuy nhiên, đối với những đối tượng có 
hướng ngẫu nhiên, thì chiều ngang và chiều dọc không thể là các chiều để xem xét. 
Trong trường hợp này, cần phải định vị trục chính của đối tượng và đo lường chiều 
dài và chiều rộng liên quan đến nó. 
Có nhiều cách thiết lập trục chính cho một đối tượng một khi đã biết được đường 
bao của nó. Ta có thể tính đường thẳng (hay cong) đúng nhất thông qua các điểm 
trên đối tượng. Trục chính cũng có thể được tính từ các mô men, như đề cập ở phần 
tiếp theo. Cách thứ ba sử dụng hình chữ nhật bao quanh tối thiểu (Minimum Enclose 
Rectangle-MER) bọc lấy đối tượng. 
Với kỹ thuật MER, đường bao của đối tượng được quay 900 theo nhiều bước, mỗi 
bước 30 một. Sau mỗi phép quay tăng dần, MER nằm ngang sẽ phù hợp với đường 
bao. Về phương diện tính toán, điều này chỉ đơn giản là giữ lại vết các giá trị x và y 
của các điểm trên đường bao đã quay nhỏ nhất và lớn nhất. Kỹ thuật này đặc biệt có 
lợi cho các đối tượng hình chữ nhật, nhưng nó cũng sinh ra các kết quả vừa ý đối với 
các hình dạng tổng quát hơn. 
19.3. PHÂN TÍCH HÌNH DẠNG 
Thường thường, có thể phân biệt các đối tượng trong một lớp với các đối tượng 
khác bằng hình dạng của chúng. Các đặc trưng hình dạng có thể sử dụng độc lập với, 
hay kết hợp với các số đo kích thước. Trong phần này, chúng ta sẽ xem xét một vài 
tham số hình dạng thường dùng. 
19.3.1. Tính hình chữ nhật 
Một số đo phản ảnh tính hình chữ nhật của một đối tượng là hệ số khít hình chữ 
nhật 
R
o
A
AR (9) 
Trong đó Ao là diện tích đối tượng và AR là diện tích MER của đối tượng. R thể 
hiện mức độ đầy một đối tượng điền vào MER của nó. Nó có giá trị cực đại là 1.0 
đối với các đối tượng hình chữ nhật, nhận giá trị /4 đối với đối tượng hình tròn và 
càng nhỏ hơn đối với các đối tượng cong, mảnh. Hệ số khít hình chữ nhật nằm giữa 0 
và 1. 
 385 
Một đặc tíh hình dạng có liên quan khác là tỷ lệ co 
L
WA (10) 
Là tỷ lệ giữa chiều rộng và chiều dài của MER. Đặc tính này có thể phân biệt các 
đối tượng mảnh với các đối tượng hình vuông hay hình tròn. 
19.3.2. Tính tròn 
Một nhóm các đặc tính hình dạng được gọi là các tiêu chuẩn tính tròn bởi vì 
chúng được tối thiểu hoá theo dạng hình tròn. Độ lớn của chúng có xu hướng phản 
ánh sự phức tạp của đường bao đang được đánh giá. Tiêu chuẩn tính tròn được dùng 
phổ biến nhất là 
A
PC
2
 (11) 
Là tỷ lệ giữa bình phương chu vi và diện tích. Đặc tính này nhận giá trị nhỏ nhất 
là 4 đối với dạng hình tròn. Các dạng phức tạp hơn nhận các giá trị cao hơn. Số đo 
tính tròn C có liên quan đến khái niệm chủ quan về sự phức tạp của đường bao. 
Một phép số đo tính tròn liên quan là năng lượng đường bao (boundary energy). 
Giả sử một đối tượng có chu vi là P và chúng ta xác định quãng đường vòng quanh 
đường bao từ điểm xuất phát nào đó với biến p. Tại một điểm bất kỳ, đường bao có 
một bán kính cong tức thời r(p). Đó là bán kính của đường tròn tiếp xúc đường bao 
tại điểm đó (hình 14-9). Hàm độ cong tại p là 
 pr
pK 1 (12) 
Hàm K(p) tuần hoàn với chu kỳ P. Ta có thể tính năng lượng trung bình trên một 
đơn vị chiều dài của đường bao như sau 
P
dppK
P
E
0
21 (13) 
đối với vùng cố định, đường tròn có năng lượng đường bao nhỏ nhất là 
22
0
12
RP
E (14) 
trong đó R là bán kính đường tròn. Do đó, độ cong và năng lượng đường bao 
được tính dễ dàng từ chuỗi mã. Young đã chứng minh rằng năng lượng đường bao 
phản ánh khái niệm về sự phức tạp theo cảm giác tốt hơn tiêu chuẩn tính tròn của 
biểu thức (11). 
Tiêu chuẩn tính tròn thứ ba thực hiện công dụng của khoảng cách trung bình từ 
một điểm bên trong đến đường bao đối tượng. Khoảng cách này là 
 
N
i
ixN
d
1
1 (15) 
Trong đó xi là khoảng cách từ điểm ảnh thứ i đến điểm biên gần nhất trong một 
đối tượng có N điểm. Tiêu chuẩn hình dạng là 
 386 

N
i
xLi
N
d
Ag
1
3
2 (16) 
Tổng trong mẫu số của biểu thức (16) là IOD của ảnh đã biến đổi khoảng cách. 
Phép biến đổi khoảng cách đã được trình bày trong phần 18.7.5. Giá trị mức xám của 
một điểm ảnh trong một ảnh biến đổi khoảng cách phản ánh khoảng cách từ điểm 
ảnh đó đến đường bao gần nhất. Hình 19-5 trình bày một ảnh nhị phân và biến đổi 
khoảng cách của nó. 
HÌNH 19-5 
Hình 19-5 Biến đổi khoảng cách 
Đối với các hình tròn và các đa giác cân đối, biểu thức (16) cho cùng một giá trị 
như biểu thức (11); tuy nhiên, khả năng phân biệt của biểu thức (16) có thể tốt hơn 
đối với các hình dạng phức tạp hơn. 
19.3.3. Mô men bất biến 
Các mô men của một hàm thường được dùng trong lý thuyết xác suất. Tuy nhiên, 
một vài tính chất khác xuất phát từ các mô men cũng có thể áp dụng để phân tích 
hình dạng. 
Định nghĩa. Tập các mô men của một hàm đường bao f(x, y) hai biến được định 
nghĩa bởi 
 dxdyyxfyxM kjjk , (17) 
Trong đó j và k nhận các giá trị không âm bất kỳ. Mô men của các PDF được sử 
dụng rộng rãi trong lý thuyết xác suất. 
Khi j và k nhận các giá trị không âm, chúng sinh ra một tập vô hạn các mô men. 
Hơn nữa, tập này có khả năng xác định hàm f(x, y) một cách đầy đủ. Nói cách khác, 
tập {Mjk}là duy nhất đối với hàm f(x, y) và chỉ hàm f(x, y) có tập mô men riêng biệt 
đó mà thôi. 
Với mục đích miêu tả hình dạng, giả sử f(x, y) nhận giá trị 1 trong đối tượng và 
giá trị 0 ngoài đối tượng. Hàm hình chiếu này chỉ phản ánh hình dạng đối tượng và 
bỏ qua chi tiết mức xám bên trong. Mỗi hình dạng duy nhất tương ứng với một hình 
chiếu duy nhất và, hơn thế nữa, với một tập mô men duy nhất. 
Tham số j + k gọi là bậc của mô men. Chỉ có duy nhất một mô men bậc 0, 
 387 
 dxdyyxfM ,00 (18) 
Và rõ ràng đây là diện tích của đối tượng. Có hai mô men bậc nhất và cứ như vậy, 
có nhiều mô men bậc cao hơn. Ta có thể khiến cho tất cả các mô men bậc nhất và 
bậc cao hơn bất biến mà không ảnh hưởng đến kích thước đối tượng bằng cách chia 
chúng cho M00. 
19.3.3.1. Mô men trung tâm 
Các toạ độ trọng tâm của đối tượng là 
00
01
00
10 
M
My
M
Mx (19) 
Cái gọi là mô men trung tâm được tính bằng cách sử dụng trọng tâm như ban đầu 
 dxdyyxfyyxxM
kj
jk , (20) 
Các mô men trung tâm không thay đổi vị trí. 
19.3.3.2. Trục chính 
Góc quay  làm cho mô men trung tâm bậc hai 11 triệt tiêu có thể thu được từ 
0220
1122tan



 (21) 
Các trục toạ độ x’, y’ nằm lệch một góc  so với các trục x, y gọi là trục chính của 
 ... iếp (chứng tỏ nó không duy nhất). Trong trường hợp này, biểu thức 
(32) rút gọn còn lại 
 YBC 1 (33) 
Và chúng ta phải giải bài toán quen thuộc về tập các biểu thức tuyến tính nhiều 
ẩn. 
19.5.3. Điều chỉnh parabol một chiều 
Chúng ta coi việc điều chỉnh một parabol nhờ một tập năm điểm, như một ví dụ 
cụ thể. Các giá trị là 
 394 
2551
1641
931
84.42.21
81.09.01
2
3
5.2
3
8.1
5
4
3
2.2
9.0
BYX (34) 
Và hình 19-8 cho thấy cụm các điểm và parabol phù hợp nhất, được xác định 
bằng phương pháp này. Các phép tính tạo ra 
230.
415.1
747.0
5.136
7.37
3.12
98622756
2275615
56155
CYBBB TT vµ (35) 
Chúng ta có thể so sánh những giá trị đã tính với dữ liệu và vec tơ sai số quan sát: 
07.
27.
42.
25.
03.
07.2
73.2
92.2
75.2
83.1
2
3
5.2
3
8.1
EBCY (36) 
Ví dụ, nếu đây là một ứng dụng tìm đỉnh parabol, đặt đạo hàm của biểu thức (28) 
bằng 0 cho phép ta giải với 
 923.2
2 max3
2
max xfc
-cx vµ 3.076 (37) 
Nếu các nghiệm là các mức xám thuộc một dòng quét thì các xi’ được đặt cách 
những khoảng bằng nhau, nhưng nói chung không có hạn chế về sự sắp xếp các 
điểm. Chúng có thể là một cụm điểm rải rác bất kỳ. Thực tế, có một sự hạn chế duy 
nhất đó là f(x) là hàm của x và vì thế nó có giá trị duy nhất với mọi x. Tức là, f() 
không thể chống lại chính nó để điều chỉnh dữ liệu. 
Thừa số thứ nhất của vế phải biểu thức (32) biểu diễn một phép nghịch đảo ma 
trận và đây là một chướng ngại vật trong tính toán. Tuy nhiên, ma trận này chỉ là 
3 3, cho nên vấn đề có bao nhiêu điểm được dùng để điều chỉnh không quan trọng 
lắm. Vì thế, sự phức tạp về tính toán không quá mức nặng nề. 
HÌNH 19-8 
 395 
Hình 19-8 Điều chỉnh một parabol bằng 5 điểm dữ liệu 
19.5.4. Điều chỉnh đường bậc ba hai chiều 
Ta có thể tổng quát hoá kỹ thuật trước đây cho các đa thức có bậc lớn hơn hai 
cũng như các hàm hai chiều. 
Một kỹ thuật san phẳng nền hiệu quả có được từ việc điều chỉnh đa thức hai chiều 
nhờ vào sự tập hợp các điểm nền có mức xám thấp đã được chọn. Sau đó đem ảnh 
trừ đi hàm kết quả để san phẳng nền. 
chúng ta minh hoạ kỹ thuật này bằng trường hợp điều chỉnh đường bậc ba hai 
chiều. Hàm có 10 số hạng: 
 3938272625243210, ycxcxycyxcycxcxycycxccyxf (38) 
Ma trận B là N 10: 

3
1
3
1
2
111
2
1
2
1
2
111111 yxyxyxyxyxyxB (39) 
Do đó, phép nghịch đảo ma trận 10 10 cần cho biểu thức (32). Hình 19-9 trình 
bày một ví dụ trừ nền sử dụng điều chỉnh đường bậc ba hai chiều. 
HÌNH 19-9 
Hình 19-9 Điều chỉnh đường bậc ba hai chiểu thông qua nền của một ảnh: (a) ảnh 
chứa một vệt nhiễu, nền nhạt hơn; (b) đường bậc ba điều chỉnh bằng các điểm nền; 
(c) ảnh sau khi trừ nền 
19.5.5. Điều chỉnh Gauss hai chiều 
Người ta có thể đo đối tượng hình tròn hay hình elip trong một ảnh bằng cách điều 
chỉnh một bề mặt Gauss hai chiều khắp ảnh. Biểu thức Gauss hai chiều là 
2
2
2
2
22 y
oi
x
oi yyxx
t Aez
 (40) 
Trong đó A là biên độ, (x0, y0) là vị trí còn x và y là các độ lệch tiêu chuẩn (các 
bán kính) hai chiều. 
Nếu lấy logarit hai vế, khai triển bình phương và nhóm số hạng, ta được một 
phương trình bậc hai theo x và y. Nhân cả hai vế với z1, ta được 
 396 
        ii
y
ii
x
ii
y
o
ii
x
o
i
y
o
x
o
ii zyzxzy
yzxxzyxAzz 22
2
2222
2
2
2
2
1
2
1
22
lnln

 (41) 
Nó được viết dưới dạng ma trận như sau 
 CBQ (42) 
Trong đó Q là véc tơ N 1 với các phần tử 
 iii zzq ln (43) 
C là một vec tơ 5 phần tử gồm toàn bộ các tham số Gauss 
 22222
2
2
2
2
1
2
1
22
ln
yxy
o
x
o
y
o
x
oT yxyxAC

 (44) 
Và B là ma trận N 5 có hàng thứ i 
    22 iiiiiiiiii yzxzyzxzzb (45) 
Ma trận C được tính bằng biểu thức (32) như trước đây, từ đó ta có thể khôi phục 
các tham số Gauss bằng 
2
3
2
2
5
2
4
2
2
1
2
1
yoxo
yx
cycx
cc


 (46) 
Và 
221 22 y
o
x
o yxc
eA  (47) 
Chỉ ma trận 5 5 phải lấy nghịch đảo, bất chấp N, số điểm sử dụng điều chỉnh. 
Hình 19-10a cho thấy một hàm Gaus đã được điều chỉnh với một đỉnh nhiễu bằng 
phương pháp này. Ảnh thô là một hàm Gauss được tính bằng nhiễu cộng ngẫu nhiên. 
Bảng 19-1 so sánh các tham số có được sau điều chỉnh với những tham số tạo ra ảnh. 
Không thể khôi phục chính xác hàm Gauss ban đầu do nhiễu. Tuy nhiên, các tham số 
trong bảng được đáng giá là khá tốt, hình 19-10b là một bản sao có thể chấp nhận 
dạng không nhiễu của nó. 
HÌNH 19-10 
 397 
Hình 19-10 Điều chỉnh Gauss hai chiều với mộ đỉnh nhiễu: (a) ảnh thô; (b) điều 
chỉnh Gauss. Sai số RMS là 6% so với biên độ đỉnh 
BẢNG 19-1 CÁC THAM SỐ GAUSS THỰC TẾ VÀ ĐÃ ĐIỀU CHỈNH 
BẢNG 19-1 
19.5.6. Điều chỉnh Elip 
Trong nhiều loại ảnh, các đối tượng quan tâm là hình tròn, hay ít ra cũng là hình 
elip. Vì thế, đây là cách rất có ích để có thể điều chỉnh một elip có kích thước, hình 
dạng và hướng tuỳ ý thành tập hợp các điểm biên. 
Biểu thức tổng quát cho phần hình nón là 
 022 feydxcybxyax (49) 
Và nó sẽ là elip nếu 
 042 acb (50) 
Một elip được xác định bằng 5 tham số: toạ độ tâm x, y của nó, chiều dài các bán 
trục lớn và bán trục nhỏ và góc giữa trục chính của nó tạo thành với trục ngang. Ta 
có thể điều chỉnh một elip qua 5 điểm bằng cách thay thế toạ độ của chúng vào biểu 
thức (49) và giải năm phương trình cùng một lúc. Ta có thể nhận được một cách điều 
chỉnh tốt nhất qua nhiều điểm hơn bằng cách điều chỉnh các elip qua các tập con năm 
điểm và lấy trung bình (hay lấy giá trị nằm giữa) các tham số của chúng. 
Không mất tính tổng quát, chúng ta có thể đơn giản hoá biểu thức (49) bằng cách 
đặt a = 1. Sau đó, viết lại tổng các sai số bình phương như sau 
  
i
iiyiii feydxcyybxx
2222 (51) 
Nếu ta đạo hàm từng phần biểu thức (51) theo các hệ số a, b, c, d và đặt từng hệ 
số bằng 0, ta sẽ thu được năm biểu thức dạng tổng của các luỹ thừa và các tích theo xi 
và yi mà có thể giải đồng thời với các hệ số này. Thủ tục có thể được thực hiện bằng 
phép nghịch đảo ma trận 5 5 như trước đây. 
19.5.7. Nghiên cứu thực tiễn 
Nếu ta điều chỉnh các đa thức lặp đi lặp lại với các dòng quát liên tiếp trong một 
ảnh, thì ma trận B sẽ không thay đổi từ dòng này sang dòng khác và việc lấy nghịch 
đảo ma trận chỉ cần thực hiện một lần. 
Đây là vấn đề qua trọng để lựa chọn các điểm sử dụng trong thủ tục điều chỉnh 
sao cho chúng có thể khôi phục toàn bộ vùng mà ta quan tâm. Hành vi của hàm bên 
ngoài vùng, mà trên đó nó bị ép buộc để điều chỉnh dữ liệu thực tế, có thể rất khó 
đoán trước. Khi điều chỉnh một ảnh, đó cũng là một điều quan trọng để khôi phục 
toàn bộ ảnh bằng các điểm mẫu, thậm chí cả khi thưa thớt (N nhỏ). 
Nếu N là nhỏ và các điểm dữ liệu không bị rải rác nhiều trên toàn bộ ảnh, thì ta có 
thể bắt gặp những vấn đề trong tình trạng tồi tệ trong khi nghịch đảo ma trận. Số các 
điểm ít nhất phải bằng số cột trong ma trận B và tốt nhất là gấp hai đến ba lần số cột. 
Ta có thể điều chỉnh một đường cong bằng một nhóm điểm trong không gian hai 
chiều. Một ví dụ về điều chỉnh trục bằng khung làm mảnh của một đối tượng cong 
 398 
tuyến tính. Tuy nhiên, trong thực tế sự điều chỉnh bị giới hạn do f(x) chỉ có một giá 
trị đơn với mọi x. Điều này có thể ngăn cản đường cong được chấp nhận thông qua 
nhóm điểm. Ví dụ. nếu các điểm được sắp xếp thẳng hay không thẳng hơn thì sẽ 
không thích hợp để có được một sự điều chỉnh có thể chấp nhận với y = f(x). Trong 
trường hợp đó, tốt hơn là nên điều chỉnh x = f(y) đối với dữ liệu. 
Nói chung, đó có thể là một điều đáng giá để xác định trục chính của một nhóm 
điểm dữ liệu và quay chúng sao cho trục nằm ngang trước khi áp dụng thủ tục điều 
chỉnh đường cong. Người ta có thể lựa chọn việc điều chỉnh các điểm dữ liệu với một 
hàm đã định nghĩa theo một hệ toạ độ quay. 
Với điều chỉnh Gauss hai chiều, điều cần thiết là các điểm mẫu phải nằm tản ra 
xung quanh đỉnh. Việc cố gắng điều chỉnh một hàm Gauss hai chiều vào một mặt của 
đỉnh chỉ chuốc lấy tai hoạ. Nếu các điểm dữ liệu xác định một độ dốc, thay vì một 
đỉnh, thì hàm Gauss được điều chỉnh là bề mặt bên dưới, c4 và c5 là dương, và độ 
lệch tiêu chuẩn (biểu thức (46)) là ảo. Tình huống này có thể xảy ra bất ngờ khi hàm 
được điều chỉnh với các điểm dữ liệu không phân bó đều ra xung quanh tất cả các 
mặt của đỉnh. 
Khi điều chỉnh một elip năm điểm, ta có thể thấy rằng các điểm dữ liệu điều chỉnh 
một parabol hay một hypecbol thay vì elip. Vì thế, đó là điều quan trọng để tác động 
tính logic vào bài tập điều chỉnh. 
19.6. TỔNG KẾT NHỮNG ĐIỂM QUAN TRỌNG 
1. Kích thước đối tượng được phản ánh trong các số đo diện tích, IOD, chiều dài, 
chiều rộng và chu vi trong số các đặc trưng khác. 
2. Hình dạng đối tượng được phản ánh trong các số đo của hình chữ nhật điều 
chỉnh và tính hình tròn và trong các mô men bất biến. 
3. Có thể mã hoá hình dạng đối tượng theo chuỗi mã, hàm đường bao cực, hàm 
đường bao phức và biến đổi trục trung vị. 
4. Kết cấu có thể xác định được bằng các tiêu chuẩn thống kê, bằng các đặc trưng 
tính từ ma trận đồng thời xuất hiện và bằng các phương pháp tiếp cận cấu trúc 
và phổ. 
5. Có thể việc điều chỉnh đường cong để đánh giá hàm cơ sở cho quan sát nhiễu, 
chứng tỏ rằng dạng hàm là đã biết hay đã được cho trước. 
6. Một đa thức hay một hàm Gauss có thể được điều chỉnh với dữ liệu một hoặc 
hai chiều. Một ma trận nghịch đảo thường có kích thước tương đối nhỏ và hoạt 
động khá hiệu quả. 
7. Khi điều chỉnh một đường cong hay một bề mặt, cần thiết phải sử dụng một 
tập các điểm dữ liệu nối toàn bộ vùng quan tâm. 
8. Việc điều chỉnh bề mặt có thể được sử dụng để trích chọn một đối tượng quan 
tâm từ một ảnh hay để đánh giá biên độ, kích thước và các tham số hình dạng 
của đối tượng. Việc điều chỉnh bề mặt cũng có thể đánh giá một thành phần 
không cần thiết, ví dụ như sắc thái nền để có thể trừ nó ra. 
BÀI TẬP 
1. Chứng minh rằng biểu thức (7) dẫn đến biểu thức (5). 
2. Chứng minh rằng biểu thức (3) dẫn đến biểu thức (4). 
3. Dưới đây là các toạ độ điểm biên của một đối tượng. Tính p2/A để xác định đối 
tượng có phải là hình tròn hay hình vuông không. 
x: [97 85 66 42 22 10 9 21 40 64 84 96] 
y: [78 98 110 111 99 80 56 36 24 23 35 54] 
 399 
4. Dưới đây là các toạ độ điểm biên của một đối tượng. Tính p2/A để xác định đối 
tượng có phải là hình tròn hay hình vuông không. 
x: [460 580 560 540 520 380 240 100 120 140 160 300] 
y: [160 180 320 480 600 580 560 540 400 260 120 140] 
5. Điều chỉnh một đường thẳng qua tập các điểm dưới đây và xác định giá trị x 
của chéo 0. Vẽ các điểm và đường đã điều chỉnh. 
 x = [0 1 2 3] 
 y = [.5 .8 2.2 2.8 ] 
6. Dưới đây là các giá trị tham số tiêu điểm tại một vài vị trí trục z khác nhau. 
(Xem chương 15) Điều chỉnh một parabol qua các điểm và xác định vị trí trục 
z của tiêu điểm chính. Vẽ các điểm và phác hoạ parabol đã điều chỉnh. 
 z = [0 2 3 5 7] 
 f = [445 620 710 580 390] 
7. Dưới đây là các giá trị tham số tiêu điểm tại một vài vị trí trục z khác nhau. 
(Xem chương 15) Điều chỉnh một hàm Gauss qua các điểm và xác định vị trí 
trục z của tiêu điểm chính. Vẽ các điểm và phác hoạ parabol đã điều chỉnh. 
 z = [-8 –3 2 6 12] 
 f = [41 62 58 60 38] 
8. Dưới đây là một vài điểm nền từ một ảnh f(x, y) 480 512 có vấn đề về sắc 
thái. điều chỉnh một mặt phẳng qua các điểm, trừ nó từ các điểm đó và tính giá 
trị RMS của nhiễu còn lại. (Tuỳ chọn: Vẽ các điểm bag bề mặt đã điều chỉnh) 
 x: [1 100 200 300 1 100 200 300 1 100 200 300 1 100 200 300] 
 y: [1 1 1 1 100 100 100 100 200 200 200 200 300 300 300 300] 
 f: [18 26 39 47 37 36 39 40 58 48 43 44 75 63 53 39] 
9. Làm lại bài 8, sử dụng mặt bậc hai (song tuyến) 
 g(x, y) = c0 + c1x + c2y + c3xy 
Nhiễu RMS giảm bao nhiêu với việc điều chỉnh mặt phẳng? Nếu vậy, theo hệ 
số bao nhiêu? (Tuỳ chọn: Vẽ các điểm và mặt đã điều chỉnh) 
10. Dưới đây là mức xám tại một số điểm ảnh trên một dòng quét đơn (dòng 
ngang) trong một ảnh chụp bằng camera có vấn đề sắc thái từ trái sang phải. 
Điều chỉnh đường thẳng qua các điểm và vẽ các điểm cùng với đường đã điều 
chỉnh. Lấy các điểm đó trừ đi đường đã điều chỉnh và tính giá trị RMS của 
nhiễu còn lại. Kỹ thuật này đáng giá bao nhiêu trong phần mềm số hoá ảnh 
của bạn? Giả sử rằng sẽ phức tạp thêm chỉ khi nhiễu nền RMS có thể loại bỏ 
đi một nửa hay nhiều hơn. 
 x = [1 100 200 300 400 500] 
 f = [27 46 63 69 68 63] 
11. Làm lại bài 10, sử dụng điều chỉnh bậc hai (parabol). Kỹ thuật này đáng giá 
bao nhiêu trong phần mềm số hoá ảnh của bạn? Giả sử rằng sẽ phức tạp thêm 
(xung quanh điều chỉnh tuyến tính) chỉ khi nhiễu nền RMS có thể loại bỏ đi 
một nửa hay nhiều hơn. 
12. Làm lại bài 11, sử dụng điều chỉnh bậc ba (cubic). Kỹ thuật này đáng giá bao 
nhiêu trong phần mềm số hoá ảnh của bạn? Giả sử rằng sẽ phức tạp thêm 
(xung quanh điều chỉnh parabol) chỉ khi nhiễu nền RMS có thể loại bỏ đi một 
nửa hay nhiều hơn. Có phát sinh thêm các thủ tục điều chỉnh bậc cao hơn 
không? Tại sao có và tại sao không? 
13. Làm lại bài 10, sử dụng các dữ liệu dưới đây: 
x = [1 100 200 300 400 500] 
 f = [24 39 32 18 15 27] 
 400 
14. Làm lại bài 11 sử dụng dữ liệu đã cho trong bài 13. 
15. Làm lại bài 12 sử dụng dữ liệu đã cho trong bài 13. 
16. Điều chỉnh một phần hình nón với 6 điểm dưới đây. Phác hoạ đường cong, nó 
là một parabol, hypecbol hay elip? 
 x = [32 60 78 99 71 42]; y = [12 18 23 41 55 62] 
17. Điều chỉnh một phần hình nón với 6 điểm dưới đây. Phác hoạ đường cong, nó 
là một parabol, hypecbol hay elip? 
 x = [28 41 55 61 46 33]; y = [23 31 30 40 41 33] 
18. Điều chỉnh một phần hình nón với 6 điểm dưới đây. Phác hoạ đường cong, nó 
là một parabol, hypecbol hay elip? 
 x = [102 111 125 128 116 103]; y = [73 68 80 101 108 89] 
DỰ ÁN 
1. Phát triển một chương trình mà có thể đo lường diện tích và chu vi các đối 
tượng. Sử dụng các đối tượng hình tròn đã biết đường kính để kiểm tra chương 
trình với các khoảng cách điểm ảnh khác nhau. Nêu rõ sự chính xác của nó. 
2. Phát triển một chương trình mà có thể xác định mật độ trung bình hay độ sáng 
của đối tượng. Sử dụng các đối tượng đã biết mật độ hay độ sáng để kiểm tra 
chương trình với các khoảng cách điểm ảnh khác nhau. Nêu rõ sự chính xác 
của nó. 
3. Phát triển một chương trình mà có thể xác định hình dạng đối tượng. Sử dụng 
các đối tượng hình tròn, hình vuông, tam giác và hình chữ nhật đã biết hướng 
để kiểm tra chương trình với các khoảng cách điểm ảnh khác nhau. Nêu rõ sự 
chính xác của nó. 
4. Phát triển một chương trình có thể điều chỉnh một đường bậc ba hai chiều với 
nền của một ảnh, tính hàm kết quả và loại trừ nó ra khỏi ảnh. 
5. Phát triển một chương trình có thể định vị các ngôi sao trong một ảnh thiên 
văn, điều chỉnh một parabol hay một hàm Gauss với mỗi ngôi sao và liệt kê vị 
trí, đường kính và độ sáng của từng ngôi sao. Kiểm tra chương trình trên ảnh 
chụp từ vũ trụ đã số hoá. 
6. Thực hiện một chương trình tính tham số tiêu điểm, điều chỉnh một parabol 
hay hàm Gauss với đường cong thu được và hiển thị các vị trí của tiêu điểm 
tối ưu. 
7. Phát triển một chương trình điều chỉnh một elip với tập hợp các điểm (x, y). 
Kiểm tra chương trình trên ảnh các đồng tiền và các phần mỏng của các đối 
tượng hình trụ cắt tại nhiều góc độ khác nhau. Nêu rõ sự chính xác của nó và 
bất kỳ vấn đề nào vấp phải khi điều chỉnh. 

File đính kèm:

  • pdfgiao_trinh_xu_ly_anh_chuong_19_nhan_dang_mau_kich_thuoc_doi.pdf