Kết hợp đặc trưng thị giác và ngữ nghĩa trong truy vấn video số dựa trên mô hình phân cấp dữ liệu
Tóm tắt. Hiện nay dừ liệu video số được lưu trừ và phát triển với số lượng ngày càng tăng, do vậy dần đến một nhu câu là cân có một cách thức quản lý hừu hiệu hơn đê phục vụ việc truy tìm thông tin và cách thức truy tìm. Trong bài báo này chúng tôi trình bày một phương pháp giúp phân tích tự động cấu trúc của video số nhằm tạo ra bản mục lục và chỉ mục, giúp lưu trừ nội dung đoạn video số theo cấu trúc phân cấp: video, lớp các đoạn cơ SỞ, đoạn cơ SỜ, khung hình chính, lớp các vùng và truy vấn dựa vào đặc trưng thị giác và ngừ nghía.
Bài toán được tiếp cận bằng việc đầu tiên là phân tích tự động video số thành các đoạn cơ sờ, sau đó nhóm chúng lại theo phương pháp phân lớp phân cấp và cuối cùng là rút gọn cấu trúc phân cấp để tạo bảng mục lục và chỉ mục. Việc truy vấn được thực hiện dựa trên cấu trúc phân cấp với hai giai đoạn, trong giai đoạn đầu, kết quả truy vấn dựa vào đặc trưng thị giác, trong giai đoạn cuối, kết quả được lọc lại dựa vào ngừ nghía hoặc ngược lại.
Kết quả thực nghiệm cho thấy phương pháp này đạt kết quả cao hơn so với phương pháp truy vấn chỉ dựa vào đặc trưng thị giác toàn cục, cục bộ hoặc ngừ nghía.
File đính kèm:
- ket_hop_dac_trung_thi_giac_va_ngu_nghia_trong_truy_van_video.pdf