Phân loại phương tiện giao thông trong video dựa trên đặc trưng hình dạng

Bài toán phân loại phương tiện giao thông

trong video có nhiều ý nghĩa trong thực tế

quản lý giao thông, như xác định chứng cứ vi

phạm luật giao thông, điều khiển giao thông,

giải quyết tranh chấp trong hiện trường tai

nạn. Để đáp ứng điều kiện giao thông Việt

Nam, khi mà giao thông đông đúc, đa dạng

thì việc lựa chọn những kỹ thuật, phương

pháp biểu diễn mô hình phương tiện là hết

sức quan trọng cho giải quyết bài toán phân

loại phương tiện giao thông từ video.

Các đặc trưng của phương tiện chuyển động

trong video được chia thành 2 mức tiếp cận:

mức cục bộ và mức toàn cục.

Đặc trưng tiếp cận ở mức toàn cục: Vùng

quan tâm; Video và frame; Đối tượng chuyển

động và nền; Khối chuyển động; Đốm sáng;

Đặc trưng tiếp cận ở mức cục bộ: Đối tượng

chuyển động và bóng của nó; Độ dài ảnh;

Hình dạng đối tượng; Mức xám khu vực đèn

trước/sau xe; Mức xám và đặc điểm khu vực

biển số xe; Các đường biên ngang trên xe;

pdf 5 trang kimcuc 17401
Bạn đang xem tài liệu "Phân loại phương tiện giao thông trong video dựa trên đặc trưng hình dạng", để tải tài liệu gốc về máy hãy click vào nút Download ở trên

Tóm tắt nội dung tài liệu: Phân loại phương tiện giao thông trong video dựa trên đặc trưng hình dạng

Phân loại phương tiện giao thông trong video dựa trên đặc trưng hình dạng
Nguyễn Văn Căn Tạp chí KHOA HỌC & CÔNG NGHỆ 128(14): 113 - 117 
113 
PHÂN LOẠI PHƯƠNG TIỆN GIAO THÔNG TRONG VIDEO 
DỰA TRÊN ĐẶC TRƯNG HÌNH DẠNG 
Nguyễn Văn Căn* 
Trường Đại học Kỹ thuật – Hậu cần CAND 
TÓM TẮT 
Bài viết này là trình bày một số phương pháp biểu diễn đặc trưng ảnh phục vụ cho phát hiện và 
phân loại phương tiện giao thông từ video: trích chọn đối tượng chuyển động bằng phương pháp 
luồng quang học; biểu diễn hình dạng đối tượng; biểu diễn đường viền trên trường số phức, biểu 
diễn đường viền theo đỉnh hình dạng. Đề xuất một khung làm việc chung cho hệ thống phân loại 
và xác định mật độ phương tiện giao thông từ video trong vùng quan sát. 
Từ khóa: luồng quang học, phân tích đường viền, phân loại phương tiện, xác định hình dạng 
GIỚI THIỆU* 
Bài toán phân loại phương tiện giao thông 
trong video có nhiều ý nghĩa trong thực tế 
quản lý giao thông, như xác định chứng cứ vi 
phạm luật giao thông, điều khiển giao thông, 
giải quyết tranh chấp trong hiện trường tai 
nạn... Để đáp ứng điều kiện giao thông Việt 
Nam, khi mà giao thông đông đúc, đa dạng 
thì việc lựa chọn những kỹ thuật, phương 
pháp biểu diễn mô hình phương tiện là hết 
sức quan trọng cho giải quyết bài toán phân 
loại phương tiện giao thông từ video. 
Các đặc trưng của phương tiện chuyển động 
trong video được chia thành 2 mức tiếp cận: 
mức cục bộ và mức toàn cục. 
Đặc trưng tiếp cận ở mức toàn cục: Vùng 
quan tâm; Video và frame; Đối tượng chuyển 
động và nền; Khối chuyển động; Đốm sáng; 
Đặc trưng tiếp cận ở mức cục bộ: Đối tượng 
chuyển động và bóng của nó; Độ dài ảnh; 
Hình dạng đối tượng; Mức xám khu vực đèn 
trước/sau xe; Mức xám và đặc điểm khu vực 
biển số xe; Các đường biên ngang trên xe; 
Trên thế giới, nhiều công trình nghiên cứu đã 
quan tâm đến vấn đề này. Năm 2004, 
Yigithan Dedeoglu và cộng sự [3] nghiên cứu 
một hệ thống giám sát phân loại đối tượng 
chuyển động. Hệ thống cho kết quả phân loại: 
người, nhóm người và phương tiện giao thông 
tương ứng là 84%, 66%, 79%.Năm 2007, 
Guohui Zhang và cộng sự nghiên cứu hệ 
* Tel: 0986 919333 
thống phát hiện và phân loại xe dựa trên 
video (VVDC) [6] được phát triển cho hệ 
thống camera giám sát tầm rộng nhằm mục 
đích thu thập thông tin các xe tải. Kết quả thu 
được là độ chính xác để phát hiện ra xe lên 
đến trên 97%, và tỷ lệ lỗi khi đếm xe tải thấp 
hơn 9% trong cả ba lần thử nghiệm. Tiếp cận 
theo hướng này, chủ yếu là phát hiện được xe 
tải, xác định và phân hoạch được sự khác biệt 
giữa 2-3 xe con nối tiếp nhau và xe tải dài... 
Chưa tiếp cận và nói đến việc nhận dạng và 
đếm số lượng xe máy, xe thô sơ và người đi 
bộ. Năm 2009, Umesh Narayanan [5]đã phát 
triển một hệ thống phân loại và đếm số lượng 
phương tiện dựa trên thị giác máy tính thông 
qua camera giám sát. Phân loại từng xe qua 
sử dụng kích thước xe. Độ chính xác thực 
nghiệm chứng minh khoảng 90%.Năm 2010, 
Chung-Cheng Chiu và cộng sự [4], phát triển 
một hệ thống giám sát giao thông thời gian 
thực, bao gồm phát hiện, nhận dạng và theo dõi 
các phương tiện từ các ảnh chụp trên đường. 
Tiếp theo, các phương pháp biểu diễn hình 
dạng, biểu diễn đường viền, độ dài ảnh được 
trình bày trong mục II; một số kết quả áp 
dụng thực nghiệm được trình bày trong mục 
III, kết luận và hướng phát triển trình bày 
trong mục IV. 
PHƯƠNG PHÁP 
Tính độ dài thực của đối tượng từ ảnh 
Các tham số về kích thước của ô tô rất quan 
trọng để nhận ra các loại xe khác nhau.Chiều 
dài, chiều rộng ảnh của mỗi kiểu xe để tiếp 
Nguyễn Văn Căn Tạp chí KHOA HỌC & CÔNG NGHỆ 128(14): 113 - 117 
114 
cận với chiều dài và chiều rộng thực tế của xe; 
và tất nhiên đề xuất phương pháp nhận dạng ô 
tô dựa trên chiều dài và chiều rộng ảnh. 
Hình 1 mô tả việc sử dụng quang hình học để 
tìm mối quan hệ giữa chiều dài pixel R trong 
ảnh phẳng với chiều dài ảnh Dh1 trên đường. 
Đường đứt nét F là đường tâm của camera, 
Dh1 là chiều dài thị giác của phương tiện phía 
trên đường đứt nét F. R2 và R1 là các chiều 
dài pixel trong ảnh phẳng, Rp là kích thước 
điểm ảnh của camera. H là độ cao của 
camera, f là tiêu điểm của ống kính, θ là góc 
của camera với mặt đường. Ta có: 
 (1) 
Hình 1. Chiều dài giữa ảnh và đối tượng 
chuyển động 
Chiều dài ảnh Dh1: 
 cossincossinsin
1
1
1
2
2
12
pp
p
RRf
R
RRf
RHR
DDDh
 (2) 
Chiều dài ảnh: 
 cossin
3
cossinsin
2
34
4
34
pp
p
RRf
R
RRf
RHR
DDDh
 (3) 
Chiều rộng ảnh: 
f
D
H
R
Dw
f
DhF
Rw
Dw w


cos
sin
1
cos1 1
 (4) 
f
D
H
R
Dw
f
DhF
Rw
Dw w


cos
sin
2
cos22 3
 (5) 
Tính được các chiều dài và chiều rộng ảnh 
trung bình của các xe khác nhau bằng các 
kiểm thử liên tiếp. Mặc dù chiều cao của xe 
gây ra sai số không đáng kể trong việc ước 
lượng chiều dài, nhưng vẫn có thể xác định 
chính xác loại xe trên đường nhờ sử dụng các 
tham số của nhà sản xuất. 
Véc tơ hóa hình dạng đối tượng 
Cho một bức hình chứa một đối tượng, với bố 
cục nền không phức tạp, dễ dàng phát hiện 
được biên đối tượng, và trích chọn nội dung 
đối tượng để làm đặc trưng cho bức ảnh. 
Phương pháp biểu diễn hình ảnh thông qua 
lược đồ khoảng cách thực hiện dựa trên các 
hình đa giác và trọng tâm của đa giác, trước 
khi đối tượng được biểu diễn thực hiện tìm 
xấp xỉ của hình dạng đó (thuộc tính hình học). 
a) Đường tròn gốc 
b) Với 8điểm cơ bản 
Hình 2. Mô tả hình dạng hình tròn 
Hình 2 cho thấy, khi số lượng điểm cơ bản 
trên biên của hình tròn càng tăng thì hình mô 
tả sẽ gần giống hơn đối với hình ảnh gốc, và 
các điểm biên cơ bản này luôn được căng đều 
trên biên, đồng thời dây cung nối giữa các 
điểm này sẽ tạo lên đường mô phỏng hình 
dạng gốc. 
Công việc xác định điểm cơ bản được thực 
hiện bằng cách, duyệt lần lượt các điểm ảnh 
biên theo thứ tự ngược chiều kim đồng hồ 
hoặc xuôi chiều kim đồng hồ. Thu được tổng 
số điểm ảnh trên biên của đối tượng, sau đó 
chia đều theo số điểm cơ bản cho trước theo 
công thức sau: 
 (6) 
với Lrounded là khoảng cách giữa các điểm cơ 
bản trên biên đã được làm tròn, Lsum là tổng 
chiều dài của biên ảnh, và N là số lượng điểm 
cơ bản cho trước. 
Trọng tâm của đa giác.Cho hình đa giác bất 
kỳ, có các đỉnh (xi,yi) với i = 0,1,2,n, 
x0=xn,y0=yn. 
Hình 3. Đa giác có n cạnh 
Nguyễn Văn Căn Tạp chí KHOA HỌC & CÔNG NGHỆ 128(14): 113 - 117 
115 
Diện tích của đa giác: 
 (7) 
Áp dụng định lý Green trên mặt phẳng, xác 
định tọa độ trọng tâm của đa giác: 
 (8) 
Khoảngcách giữa điểm mẫu và trọng tâm. 
Nếu một đa giác có chiều dài một biên là Li, 
tổng chiều dài của tất cả biên là Lsum và số 
lượng điểm mẫu là N thì số lượng điểm mẫu 
sẽ là Ni: 
 N (9) 
Khoảng cách từ điểm mẫu có tọa độ si = 
(xi,yi) và trung tâm đa giác có tọa độ 
c=(xc,yc), được tính theo công thức Ơclit: 
 (10) 
Lược đồ khoảng cách. Lược đồ là một công 
cụ miêu tả các thuộc tính của dữ liệu. Các 
điểm mẫu sẽ được đặt cách đều nhau trên biên 
của đa giác, đặt khoảng cách giữa hai điểm 
mẫu kề nhau là D, và tổng độ dài của biên sẽ 
là Dmax, phân tách D thành nhiều phần thông 
qua các điểm mẫu. 
Chuẩn hóa. Gọi D[i] là tập giá trị khoảng 
cách từ tâm C đến các điểm mẫu trên biên. Ta 
có tập DS (chuẩn hóa) được chuẩn hóa: 
 (11) 
Sau quá trình chuẩn hóa, tất cả khoảng cách 
chuẩn hóa thu được sẽ nằm trong khoảng 
[0,1]. Bởi vì việc gán điểm mẫu dựa trên 
chiều dài của biên, và căng đều chúng trên 
biên, hai đa giác có kích thước khác nhau nhưng 
hình dạng giống nhau sẽ sinh ra giá trị khoảng 
cách chuẩn hóa. Do đó, phương pháp này là bất 
biến đối với tỷ lệ sau khi chuẩn hóa. 
Đo độ tương tự. Lược đồ khoảng cách của 
một đa giác có thể được mô tả bằng: 
(d0,d1,d2,d3,dn), n là số lượng khoảng cách 
trong lược đồ và di, i [0,n-1] là số khoảng 
cách trong vùng khoảng cách này. Theo đó 
cho hai đa giác D1 và D2 với lược đồ khoảng 
cách tương ứng là D1: (d11,d12,d13,,D1n) Và 
D2: (d21,d22,d23,,d2n), có độ tương tự được 
tính theo khoảng cách ơ-clit: 
 (12) 
Biểu diễn hình dạng đối tượng theo trọng tâm 
và khoảng cách từ tâm đến biên đối tượng, áp 
dụng các tính chất bất biến quay, bất biến tỷ 
lệ của mô-men mang đến khả năng nhận dạng 
và phân loại đối tượng theo hình dạng. Điều 
này có thể áp dụng phân loại phương tiện giao 
thông trên đường trong trường hợp đông đúc, 
có sự chồng lấp lên nhau về hình dạng sau khi 
thực hiện phát hiện khối chuyển động. Trong 
điều kiện giao thông đô thị đông đúc, các xe ô 
tô, xe máy, người đi bộ có thể đi sát nhau và 
tạo thành các khối chuyển động có hình dạng 
phức tạp và khó có thể phân định được bằng 
các phương pháp thông thường. Để thực hiện 
nhận dạng và xác định số lượng đối tượng có 
thể áp dụng thuật toán máy học. Tạo ra một 
tập huấn luyện các khả năng có thể, sau đó 
đối sánh và kết luận về số lượng phương tiện 
chuyển động. 
 Biểu diễn đường viền theo véc tơ số phức 
Đường viền là đường bao của đối tượng, 
thường là các điểm ảnh, phân tách đối tượng 
với nền. Phân tích đường viền (Contour 
Analysis - CA) cho phép mô tả, lưu trữ, so 
sánh và tìm ra các đối tượng biểu diễn dưới 
dạng đường viền.CA cho phép giải quyết hiệu 
quả các bài toán cơ bản của nhận dạng mẫu – 
biến đổi, quay và tỷ lệ của ảnh đối tượng. 
Phương pháp CA là bất biến đối với phép 
biến đổi[7]. 
Trong CA đường viền được biểu diễn bằng 
một dãy các số phức. Trên một đường viền, 
điểm bắt đầu cần được xác định. Tiếp theo, 
đường viền sẽ được quét (xoay theo chiều 
kim đồng hồ), và mỗi véc tơ được biểu diễn 
bằng một số phức a+ib. Với a là điểm trên 
trục x, b là điểm trên trục y. Các điểm được 
biểu diễn kế tiếp nhau. 
Do tính chất vật lý của các đối tượng ba 
chiều, đường viềncủa chúng luôn khép kín và 
Nguyễn Văn Căn Tạp chí KHOA HỌC & CÔNG NGHỆ 128(14): 113 - 117 
116 
không tự giao nhau. Nó cho phép xác định rõ 
ràng một duyệt qua một đường viền. Vector 
cuối cùng của một đường viền luôn luôn dẫn 
đến điểm khởi đầu. 
Mỗi vector của một đường viền chúng ta sẽ 
đặt tên vector cơ sở (EV). Và chuỗi giá trị các 
số phức gọi là vectorđường viền (VC). 
Vectorđường viền, ký hiệu bằng chữ cái Γ, và 
vector cơ sở ký hiệu là . Như vậy, vector 
đường viền Γ có độ dài k có thể được xác 
định là: 
 (13) 
Hình 4. Biểu diễn đường viền bằng véc tơ số phức 
Thao tác trên đường viền như là thao tác trên 
véc tơ số phức có chứa nhiều đặc tính toán 
học hơn là các mã biểu diễn khác. Về cơ bản, 
mã số phức là gần với mã hai chiều khi mà 
đường viền được định nghĩa phổ biến bằng 
véc tơ cơ bản trong tọa độ 2 chiều. 
Đường viền có một số đặc tính như: Tổng các 
EV của một đường viền kín bằng 0; không 
phụ thuộc vào phép chuyển vị song song của 
ảnh nguồn; Quay ảnh theo một góc độ nào đó 
tương đương với quay mỗi EV của đường 
viền trên cùng góc độ đó. 
Tích vô hướng của đường viền 
Hai số phức của 2 đường viền Γ và N, tích vô 
hướng của nó là 
 (14) 
với k – kích thước của VC, γn là véc tơ cơ sở 
của đường viền Γ, νn là véc tơ cơ sở của 
đường viền N. 
Nếu tích càng lớn, góc càng nhỏ giữa các 
vector, thì các vector này sẽ càng gần nhau. 
Với những vector vuông góc, tích này bằng 
0, và hơn nữa có thể nhận giá trị âm cho 
những vector có hướng khác nhau theo cách 
này. Tích vô hướng chuẩn hóa (NSP): 
 (15) 
|Γ| và |N| - Tiêu chuẩn (chiều dài) của 
đường viền được tính bằng công thức: 
 (16) 
NSP trong không gian phức cũng là một số 
phức.Do vậy, tính đồng nhất là giá trị lớn nhất 
có thể của chuẩn NSP và chỉ có thể đạt được 
giá trị này khi và chỉ khi: 
 (17) 
Với μ – Là một số phức tùy chọn. 
Đường viền μN giống với đường viền N, 
ngoại trừ xoay và tỉ lệ. Tỉ lệ và hướng xoay 
được định nghĩa bởi một số phức μ. 
Dạng chuẩn của NSP đạt giá trị max, chỉ khi 
đường viền Γ giống với đường viền N, nhưng 
xoay theo một số góc và tỉ lệj bởi một hệ số 
xác định. 
Hình 5. Tích vô hướng chuẩn trên đường viền 
Chuẩn NSP là bất biến trong phép chuyển 
dịch, xoay và tỉ lệ của đường viền. Nếu 2 
đường viền tương đồng nhau, NSP của chúng 
sẽ luôn cho giá trị đồng nhất, không phụ 
thuộc vào vị trí của đường viền, hay độ xoay 
của góc và tỉ lệ của chúng. Tương tự, nếu các 
đường viền khác nhau, NSP sẽ bị giới hạn 
nhỏ hơn 1, và độc lập trong không gian, độ 
xoay và tỉ lệ.Chuẩn đưa ra giá trị đo của một 
đường viền và tham số của một NSP – đưa ra 
một góc xoay của đường viền 
THỰC NGHIỆM VÀ BÀN LUẬN 
Thực nghiệm phương pháp phân loại xe ô tô 
theo độ dài ảnh. Hệ thống được cài đặt thử 
nghiệm và cho kết quả khá tốt về độ chính 
xác, phản ứng tốt với các điều kiện thời tiết, 
không gian, thời gian. Tham số chiều rộng, 
Nguyễn Văn Căn Tạp chí KHOA HỌC & CÔNG NGHỆ 128(14): 113 - 117 
117 
chiều dài trung bình một số loại xe của nhà 
sản xuất. 
Kết quả phát hiện ô tô của hệ thống dưới 
nhiều điều kiện thời tiết khác nhau, với điều 
kiện trời nắng và ban ngày cho độ chính xác 
tốt nhất. 
KẾT LUẬN VÀ BÀN LUẬN 
Bài báo đã trình bày tổng quan về một số 
phương pháp phân loại phương tiện dựa trên 
đặc trưng hình dạng. Đề xuất một số phương 
pháp biểu diễn đặc trưng. Bao gồm: 
1. Phương pháp biểu diễn hình dạng, đường 
viền của phương tiện hoặc một tập các 
phương tiện dính liền nhau thành một khối có 
thể phân giải và phân loại. 
2. Tham số độ dài ảnh kết hợp với các tham số 
độ dài thực đối tượng có thể phân loại nhanh 
loại đối tượng, hoặc phân giải loại đối tượng. 
3. Áp dụng một số phương pháp biểu diễn 
phương tiện đã trình bày cho một số hệ thống 
nhận dạng và phân loại phương tiện trong 
video giao thông. 
Mặc dù, tất cả các đề xuất trong nghiên cứu 
này có thể làm việc tốt trong một số trường 
hợp, các mô hình vẫn còn dễ bị lỗi và tốn thời 
gian. Chúng tôi tin rằng nghiên cứu sẽ tiếp tục 
cải thiện hiệu suất xác định mật độ phương 
tiện dựa trên hệ thống thị giác máy tính trong 
khi giảm tỷ lệ sai số. 
TÀI LIỆU THAM KHẢO 
1. Trần Thanh Việt, Trần Công Chiến, Huỳnh Cao 
Tuấn, Nguyễn Hữu Nam, Đỗ Năng Toàn, Trần 
Hành (2011), “Một kỹ thuật bám đối tượng và ứng 
dụng”. Hội thảo quốc gia lần thứ 14, Cần Thơ. 
2. Nguyễn Quang Quý (2012), Phát hiện đối 
tượng đột nhập bằng camera theo dõi, Đại học 
Thái Nguyên. 
3. Xue Mei (2007), “Integrated Detection, 
Tracking and Recognition for IR Video-based 
Vehicle Classification”, Journal of computers 
(Vol.2, No.6). 
4. Chung-Cheng Chiu(2010), Automatic Traffic 
Surveillance System for Vision-Based Vehicle 
Recognition and Tracking. Chung Cheng Institute 
of Technology National, Defense University 
Taoyuan, Taiwan. 
5. G. S. K. Fung, (2003), “Close range Camera 
calibration” Opt. Eng. SPIE, vol. 42, no. 10, pp. 
2967–2977. 
6. C. C. C. Pang (2004), “A novel method for 
resolving vehicle occlusion in a monocular traffic-
image sequence” IEEE Trans. Intell. Transp. Syst., 
vol. 5, no. 3, pp. 129–141. 
7. Nguyễn Văn Căn, Nguyễn Đăng Tiến, Phạm 
Việt Trung. “Phương pháp biểu diễn đường viền 
trên trường số phức, áp dụng cho bài toán phân 
loại phương tiện giao thông”. Tạp chí Khoa học 
và Công nghệ quân sự. (Tháng 08/2014)
SUMMARY 
VEHICLE CATEGORY BASED VIDEO FEATURED IN SHAPE 
Nguyen Van Can* 
College of Engineering - Logistics People's Police 
The purpose of this paper is to present some methods of performing imaging characteristics serve 
to detect and classify vehicles from video: select extract moving objects with optical flow method; 
Performing object shape; performing contour on the complex numbers, the top performers 
according to the shape contour. Propose a general framework for the classification system and 
determine the density of vehicles in the area of video observation. 
Keywords: Optical Flow, Contour Analysis, Car Counting, Shape Detection, Vehicle 
Classification. 
Ngày nhận bài:01/8/2014; Ngày phản biện:25/8/2014; Ngày duyệt đăng: 25/11/2014 
Phản biện khoa học: PGS.TS Ngô Quốc Tạo – Viện Hàn lâm KHCN Việt Nam
* Tel: 0986 919333 

File đính kèm:

  • pdfphan_loai_phuong_tien_giao_thong_trong_video_dua_tren_dac_tr.pdf