Bài giảng Truyền thông và mạng máy tính (Phần 2) - Trần Nguyên Ngọc
Các dạng dữ liệu Multimedia
Các dạng dữ liệu Multimedia gồm
Các dạng dữ liệu truyền thống: văn bản, số liệu
Âm thanh: tiếng ồn, âm nhạc, tiếng nói
Hình ảnh tĩnh: đồ họa, ảnh
Ảnh động: animation, video
Văn bản
Dữ liệu văn bản kinh điển: plain text
Đơn giản, không đòi hỏi phải xử lý nhiều.
Mã hóa bởi bộ mã ASCII, ISO/IEC 646 hoặc EBCDIC.
Chuyên dùng để tạo các tệp tin cấu hình, thư điện tử do tính tương thích cao.
Dạng Rich Text: kiểu chữ, cỡ chữ, màu chữ
Các vấn đề
Nhập: gõ phím, tự động nhận dạng text.
Xử lý: tạo văn bản và chỉnh lý, biên tập theo nguyên tắc WYSIWYG (What
you see is what you get).
Lưu trữ: tách biệt nội dung và cấu trúc, mã hóa và nén, nén không mất thông
tin.
Hiển thị: hiển thị và cảm giác.
Vấn đề phổ biến: thường gặp sự không tương thích giữa các văn bản.
Tóm tắt nội dung tài liệu: Bài giảng Truyền thông và mạng máy tính (Phần 2) - Trần Nguyên Ngọc
16 2. Các dạng dữ liệu Multimedia Các dạng dữ liệu Multimedia gồm Các dạng dữ liệu truyền thống: văn bản, số liệu Âm thanh: tiếng ồn, âm nhạc, tiếng nói Hình ảnh tĩnh: đồ họa, ảnh Ảnh động: animation, video 17 2.1 Văn bản Dữ liệu văn bản kinh điển: plain text Đơn giản, không đòi hỏi phải xử lý nhiều. Mã hóa bởi bộ mã ASCII, ISO/IEC 646 hoặc EBCDIC. Chuyên dùng để tạo các tệp tin cấu hình, thư điện tử do tính tương thích cao. Dạng Rich Text: kiểu chữ, cỡ chữ, màu chữ Các vấn đề Nhập: gõ phím, tự động nhận dạng text. Xử lý: tạo văn bản và chỉnh lý, biên tập theo nguyên tắc WYSIWYG (What you see is what you get). Lưu trữ: tách biệt nội dung và cấu trúc, mã hóa và nén, nén không mất thông tin. Hiển thị: hiển thị và cảm giác. Vấn đề phổ biến: thường gặp sự không tương thích giữa các văn bản. 18 2.1 Văn bản Biểu diễn văn bản ASCII – American Standard Code for information interchange là bộ mã mã hóa ký tự và hỗ trợ biểu diễn văn bản trên máy tính và các thiết bị khác liên quan. Trước khi ASCII được phát triển, người ta sử dụng các bộ mã để mã hóa 26 ký tự, 10 chữ số và khoảng từ 11 – 25 biểu tượng đặc biệt, ngoài ra còn một số các ký tự điều khiển khác nhằm tương tích với chuẩn CCITT (Consultative Committee International Telephone and Telegraph) CCITT ≥ 64 ký tự (tương đương với 6 bit). Các công nghệ băng bấm lỗ thời bấy giờ cho phép 8 bit cùng được lưu tại một vị trí. Chính vì thế bên cạnh 7 bit biểu diễn cho một ký tự, chúng ta có thêm 1 bit khác gọi là parity bit để có thể sửa lỗi xảy ra trong quá trình truyền dẫn. 19 2.1 Văn bản Biểu diễn văn bản Bảng mã ASCII: Sử dụng 7 bit để biểu diễn một ký tự, ngoài ra còn có một bit (parity bit) chuyên dùng để sửa lỗi. 20 2.1 Văn bản Biểu diễn văn bản Mã Unicode Bộ mã chuẩn dùng làm bộ mã duy nhất cho tất cả các ngôn ngữ trên thế giới. Hỗ trợ các ký tự tượng hình phức tạp như tiếng Trung Quốc, tiếng Thái. Unicode chiếm 1.114.112 ((16+1)*65536) code point, đã gán 96000 mã chữ. Unicode chia làm 17 mặt phẳng. Mỗi mặt gồm 65536 code point. 21 2.1. Văn bản Mã Unicode ( tiếp ) 256 mã đầu tiên phù hợp với ISO 8859-1 17 mặt phẳng gồm : Mặt phẳng đầu tiên (plane 0), "Mặt phẳng đa ngôn ngữ căn bản" (Basic Multilingual Plane - BMP), là nơi mà đa số các ký hiệu được gán mã. BMP chứa các ký hiệu cho hầu hết các ngôn ngữ hiện đại đặc biệt là các ngôn ngữ CJKV (Hán-Nhật-Hàn-Việt). Hai mặt phẳng tiếp theo được dùng cho các ký tự "đồ họa". Mặt phẳng 1, "Mặt phẳng đa ngôn ngữ bổ sung" (Supplementary Multilingual Plane - SMP), được dùng chủ yếu cho các loại chữ viết cổ, ví dụ Egyptian hieroglyph (chưa được mã hóa), nhưng cũng còn được dùng cho các ký hiệu âm nhạc. Mặt phẳng 2, (Supplementary Ideographic Plane - SIP), được dùng cho khoảng 40000 chữ Trung Quốc ít gặp mà đa số là các ký hiệu cổ, ngoài ra cũng có một số ký hiệu hiện đại. Mặt phẳng 14 hiện chứa một số các ký tự thẻ ngôn ngữ không được khuyến khích và một số ký hiệu lựa chọn biến thể. Mặt phẳng 15 và Mặt phẳng 16 được mở cho các sử dụng cá nhân. 22 2.1 Văn bản Các dạng mã Unicode : UTF-32, UTF-16 và UTF-8 UTF-32 : sử dụng 32 bit cho mỗi ký tự, được gọi là UTF-32 và ISO/IEC 10646 gọi là UCS-4 UTF-16/UCS-2 Mã hóa dùng Unicode 20 bit. Trong Windows NT, CE người ta dùng 16 bit để mã hóa các ký tự BMP. Một code point có 20 bit được chia làm hai nhóm 10 bit: Most Significant: U+D800 – U+DBFF Least Significant: U+DC00 – U+DFFF D800 DC00 U+00010000 DBFF DFFF U+0010FFFF Bộ mã sử dụng cặp thay thế UTF-16 23 2.1 Văn bản UTF-8 Mã hóa các xâu ký tự theo UCS hoặc Unicode theo dạng mỗi ký tự dùng 2 hoặc 4 byte – tương ứng các sơ đồ mã hóa UCS-2 và UCS-4. UTF-8 được thiết kế để tương thích với chuẩn ASCII. UTF-8 có thể sử dụng từ một (ASCII) cho đến 6 byte để biểu diễn một ký tự. tương thích với các hệ thống hiện tại Sơ đồ mã hóa UTF-8 U+0000 – U+007F: các ký tự ASCII. Các ký tự > U+007F được mã hóa thành một dãy các byte có các nhóm bit đặc biệt sao cho không có byte nào của ASCII xuất hiện trong thành phần các ký tự này. Byte đầu tiên của các ký tự nhiều byte luôn bắt đầu từ 0xC0 đến 0xFD. Byte đầu chỉ rõ có bao nhiêu byte sẽ theo sau byte này trong chuỗi mã của ký tự đang xét. Ví dụ: byte đầu là 11110xxx: có nghĩa ký tự này sẽ được mã hóa bằng chuỗi bit bao gồm 4 byte. Các byte sau sẽ có giá trị từ 0x80 đến 0xBF. 24 2.1 Văn bản Sơ đồ mã hóa UTF-8 U+00000000 – U+0000007F: 0xxxxxxx U+00000080 – U+000007FF: 110xxxxx 10xxxxxx U+00000800 – U+0000FFFF: 1110xxxx 10xxxxxx 10xxxxxx U+00010000 – U+0010FFFF: 11110xxx 10xxxxxx 10xxxxxx 10xxxxxx U+00200000 – U+03FFFFFF: 111110xx 10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxx U+04000000 – U+7FFFFFFF: 1111110x 10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxx U+00A9 1010 1001 UTF-8: 11000010 10101001 U+2260 10 0010 0110 0000 UTF-8: 11100010 10001001 10100000 = 0xE2 0x89 0xA0 25 2.1 Văn bản Các phiên bản Unicode 1991 Unicode 1.0 1993 Unicode 1.1 1996 Unicode 2.0 1998 Unicode 2.1 2000 Unicode 3.0 2001 Unicode 3.1 2002 Unicode 3.2 2003 Unicode 4.0 26 2.1 Văn bản Văn bản được đánh dấu (Markup Text) Biểu diễn bằng khuôn dạng và nội dung Nội dung là chuỗi các ký tự của văn bản Khuôn dạng là cấu trúc biểu diễn của văn bản Markup text: văn bản chứa những chuối ký tự chuyên biệt thể hiện giới hạn cấu trúc và khuôn dạng của từng phần văn bản Nhược điểm: chứa hỗn độ các cấu trúc logic như: điểm bắt đầu và kết thúc từng phần, mục với các cấu trúc xác định cách bố trí của văn bản như căn lề SGML (Standardized General Markup Language) phân tách cấu trúc logic và layout bằng các document type. Gồm nhiều phần tử (element) có tên riêng. Sử dụng cặp start-tag và end-tag để đánh dấu phần tử. HTML (HyperText Markup Language): ngôn ngữ đánh dấu cho các trang Web. Phiên bản mới nhất 4.01 XHTML 27 2.1 Văn bản Văn bản được đánh dấu (Markup Text) Ví dụ minh họa cho XML Ví dụ minh họa cho SGML 28 2.1 Văn bản Khuôn dạng văn bản ASCII: Khuôn dạng cơ sở ASCII chuẩn ISO 8859. Đặc tính. Văn bản không định cấu trúc. Không có các định dạng trang. 128 ký tự đầu là không đổi, 128 ký tự sau phụ thuộc vào từng biến dạng. Dạng phương tiện đơn. Khuôn dạng Rich Text: RTF. Ký tự có kiểu, cỡ. Trang văn bản có định dạng. Cho phép tạo văn bản chứa các hình đồ hoạ. Khuôn dạng của Microsoft cho văn bản trong môi trường MS-DOS, Windows, OS2, Apple. 29 2.1 Văn bản Khuôn dạng HTML(HyperText Markup Language). Một số khái niệm. Ra đời từ năm 1989 HIện nay: phiên bản HTML 4.01. HTML là khuôn dạng được dẫn xuất từ SGML bằng một DTD. Trong một trang HTML có thể chứa các liên kết với các trang HTML khác. Trong một trang HTML có thể chứa các dạng thông tin khác nhau như: text, hình ảnh, video, âm thanh. HTML là cơ sở của dịch vụ WWW. Hiển thị các trang HTML bằng các trình duyệt Web. Một số đặc điểm. Định dạng của trang Web được biểu thị qua các thẻ. Các thẻ được biểu diễn qua dấu . Thẻ được ghi theo cặp: thẻ mở và thẻ đóng. VD: : biểu diễn văn bản là một trang HTML. : biểu diễn phần tiêu đề. 30 2.1 Văn bản Một số loại thẻ HTML. : xác định văn bản HTML. : phần đầu trang HTML. : tiêu đề trang HTML. : phần thân văn bản HTML. : xác định cỡ chữ. : xác định paragraph 31 2.1 Văn bản Ưu điểm của HTML. Đơn giản, dễ hiểu. Mô tả được cấu trúc văn bản. Mô tả được định dạng văn bản. Tạo được các kết nối trên mạng. Nhược điểm. Không tuân thủ theo chuẩn về cấu trúc cũng như định dạng văn bản. Các thuộc tính văn bản quá ít, do đó không tạo được những văn bản có cấu trúc phức tạp. Cần phải mở rộng khả năng của HTML. 32 2.1 Văn bản Dạng văn bản XML(eXtensible Markup Language). Dạng XML đươc W3C đưa ra vào 1998. XML là tập con của SGML, là đơn giản hoá của SGML cho viêc sử dụng trên WWW. Về đặc tính: XML là một siêu ngôn ngữ: là ngôn ngữ mô tả ngôn ngữ. XML là ngôn ngữ xác định cấu trúc, cho phép đưa ra lừ điển từ vựng và cấu trúc cú pháp của dữ liệu. XML cho phép phân tách nội dung văn bản và cách trình bày. Điều này ngược lại với HTML. Kiểm tra cú pháp của một văn bản: DTD – document type definition Một văn bản XML có định dạng chặt chẽ. Mỗi văn bản XML có một DTD và được định dạng theo DTD đó. 33 2.1 Văn bản Giải mã văn bản XML. Để đọc một văn bản XML, ta phải tách được thông tin trong văn bản đó. Sử dụng bộ phân tích cú pháp. Bộ phân tích cú pháp phải cho phép tách thông tin một cách thích hợp. Ba dạng file. File nội dung: văn bản XML. Định dạng hiển thị: tệp định kiểu XSL. Định dạng cách viết nội dung: DTD. Một số dạng dữ liệu văn bản dựa trên XML: OFX – Open Financial eXchange. MathML – Mathematical Markup Language. CML – Chemical Markup Language. SMIL – Synchronize Multimedia Integration Language. 34 2.1 Văn bản Hiệu quả của XML: Dễ đọc: không cần biết lý thuyết để hiểu nội dung văn bản XML. Tự mô tả và mở rộng. Cấu trúc mềm dẻo: cho phép mô hình hoá phần lớn các dạng thông tin văn bản. Tính vạn năng và cơ động. Khả năng triển khai: có thể được truyền theo các giao thức dùng để truyền text: HTTP. Tính tích hợp: một văn bản XML có thể được được mở trong mọi ứng dụng có cài bộ duyệt cú pháp XML. Khả năng mở rộng: các văn bản XML có thể được sử dụng trong tất cả các lĩnh vực ứng dụng. XML trên thực tế được sử dụng để trao đổi dữ liệu và văn bản. 35 2.1 Văn bản Các thao tác trên văn bản Các thao tác trên ký tự: các thao tác đơn giản nhất trên các ký tự và là thành phần cho các thao tác phức tạp hơn. Thể hiện thông qua kiểu ký tự. Các thao tác trên xâu: các thao tác trên chuỗi các ký tự. Soạn thảo và biên tập văn bản: các thao tác thay đổi khuôn dạng và cấu trúc của văn bản Định dạng văn bản: thực hiện các thao tác đặt các thuộc tính về bố trí của văn bản WYGIWYS. So sánh mẫu và tìm kiếm: tìm kiếm những đoạn văn bản cho trước bằng cách so sánh với mẫu hoặc theo các tiêu chí tìm kiếm. Sắp xếp văn bản. 36 2.1 Văn bản Các thao tác trên văn bản Nén văn bản: dùng mã ASCII cần 7bit cho một ký tự. Lý thuyết chứng minh cần khoảng 1-2bit dể biểu diễn ngôn ngữ tự nhiên. Nén là phương pháp loại bỏ sự dư thừa này. Nén Huffman: tìm độ dài mã tối ưu theo tần xuất xuất hiện ký tự – xuất hiện càng nhiều thì độ dài mã càng ngắn. Nén Zip-Lempel: tìm kiếm những xâu lặp nhiều lần và thay bằng con trỏ tới bảng các xâu. Tỷ lệ nén: từ 1/2 đến 2/3 kích thước ban đầu. Mã hoá: các sơ đồ mã hoá đối xứng và mã hoá công khai. Phương pháp DES(Data Encryption Standard) và RSA(Rivest-Shamir-Adleman) 37 2.2 Âm thanh Các dạng âm thanh: tiếng nói, tiếng ồn, âm nhạc Âm thanh là dạng tín hiệu tương tự. Âm thanh được sinh ra do các dao động của môi trường truyền. Các sóng âm được truyền trong các môi trường hỗ trợ (không khí, kim loại, nước, ) 38 2.2 Âm thanh Các thuộc tính của âm thanh Tốc độ - phụ thuộc vào nhiệt độ của môi trường Ở nhiệt độ 15°C, tốc độ âm thanh chuẩn là: 340 m/s v = 331.5 m/s + 0.6T Cách đo âm thanh: quan sát các hiện tượng xung quanh như sấm chớp Âm thanh truyền cả trong môi trường lỏng và rắn. 39 2.2 Âm thanh Các thuộc tính của âm thanh Tần số: v = f.λ, và được tính bằng Hz. Tai người nghe thấy âm thanh trong khoảng 20 Hz – 20 kHz Tần số: tel: 4 kHz, AM: 7 kHz, FM: 15 kHz, HI-FI: 20 kHz, Audio CD: 22 kHz. 0 – 20 Hz: Thấp hơn khoảng nghe thấy, có thể cảm nhận qua cơ thể. Thính lực giảm theo tuổi tác. > 20 kHz: cao hơn khoảng nghe thấy, một số động vật có thể cảm nhận được âm thanh ở tần số này. Cường độ phụ thuộc vào biên độ, biên độ càng lớn thì cường độ càng cao thiết bị Amplifier. Cường độ được tính theo dB. 0-30 dB: tiếng thì thầm, 31-50 dB: đối thoại nhỏ, 51-70 dB: trao đổi bình thường, 71-90 dB: tiếng ô tô di chuyển, 91-110 dB: tiếng nhạc to có thể gây đau tai, > 110 dB: có thể gây điếc. 40 Bảng cường độ âm thanh 1*10-12 W/m2 0 dB Ngưỡng nghe 1*10-11 W/m2 10 dB Tiếng lá xào xạc 1*10-10 W/m2 20 dB Tiếng huýt sáo 1*10-6 W/m2 60 dB Nói chuyện thông thường 1*10-5 W/m2 70 dB Tiếng xe cộ đường phố 1*10-4 W/m2 80 dB Máy hút bụi 6.3*10-3 W/m2 98 dB Dàn nhạc giao hưởng 1*10-2 W/m2 100 dB Walkman at Maximum 1*10-1 W/m2 110 dB Dàn nhạc rock 1*101 W/m2 130 dB Ngưỡng đau 1*102 W/m2 140 dB Máy bay quân sự cất cánh 1*104 W/m2 160 dB Thủng màng nhĩ 41 2.2 Âm thanh Các thuộc tính của âm thanh Bước sóng (wavelength) - Là quãng đường mà sóng truyền đi được trong một chu kỳ dao động của sóng Bước sóng thường được đo là khoảng cách giữa hai đỉnh xung vT f v 42 2.2 Âm thanh Âm sắc Là một đặc tính sinh lý của âm , được hình thành trên cơ sở các đặc tính vật lý của âm là tần số và biên độ Thực nghiệm chứng tỏ khi một nhạc cụ hoặc một người phát ra một âm có tần số f1 thì đồng thời cũng phát ra các âm có tần số f2=2*f1,f3=3*f1, f4=4*f1,, trong đó f1 được gọi là âm cơ bản,các tần số f2,f3,f4 ,được gọi là các hoạ âm thứ hai,ba,bốn.. 43 2.2 Âm thanh Một số hiện tượng và hiệu ứng Phản xạ: khi sóng âm chạm tới biên giới hai môi trường khác nhau thì có hiện tượng phản xạ, sóng phản xạ quay trở lại môi trường ban đầu, nó có thể trùng pha hoặc ngược pha với sóng ban đầu Có hai hiện tượng: Echo, Reverberation Bộ não con người có thể ghi nhớ âm thanh trong khoảng 0,1 s. Nếu sóng phản xạ đến tai ≤ 0.1 s so với sóng trước đó, ta có cảm giác âm thanh kéo dài mãi Reverberation. Trong trường hợp khác, ta sẽ thấy âm thanh lặp lại liên tục Echo. Nếu căn phòng có kích thước 17m x 17m x 17m. Môt người đứng trong phòng phát ra tiếng động thì hiện tượng gì sẽ xảy ra ? 44 2.2 Âm thanh Một số hiện tượng và hiệu ứng Phản xạ Ứng dụng: trong nhà hát người ta thường làm tường sần sùi để cho bất kỳ ai ngồi vị trí nào đều có thể cảm nhận được các sóng phản xạ. Khúc xạ Là hiện tượng thay đổi hướng của sóng khi truyền từ môi trường này qua môi trường khác. Nhiễu xạ Là hiện tượng thay đổi hướng khi sóng đi qua khe hở hoặc vòng qua một vật cản trên đường đi của nó. 45 2.2 Âm thanh Một số hiện tượng và hiệu ứng Hiệu ứng Doppler Là hiện tượng xảy ra khi nguồn sóng chuyển động tương đối với người quan sát và tốc độ chuyển động của nguồn âm chậm hơn so với tốc độ truyền âm. Tần số tăng lên khi nguồn tiến về phía ngưới quan sát và giảm đi khi nguồn xa người quan sát. Ứng dụng: Tiếng còi xe cấp cứu. Súng bắn tốc độ 0( ) s v f f v v 46 2.2 Âm thanh Một số hiện tượng và hiệu ứng Shock wave - Là hiện tượng xảy ra khi nguồn sóng chuyển động đối với người quan sát, và tốc độ chuyển động của nguồn âm nhanh hơn so với tốc độ truyền âm Ví dụ : Sonic boom 47 2.2 Âm thanh Tai người Cách thức mà con người nghe liên quan đến 3 yếu tố Cấu tạo của tai Tâm lý của mỗi người Âm thanh Quá trình nghe gồm: Chuyển năng lượng của âm thanh thành năng lượng của sóng cơ học,sau đó lại chuyển thành tín hiệu thần kinh truyền đến não.Con người có thể phân biệ ... ụ âm nhạc chơi đồng thời. Xác định các nốt sẽ được chơi, trên dụng cụ âm nhạc nào và âm lượng. Dung lượng thông tin cho 2 phút âm nhạc: MIDI 20Ko. WAV chất lượng CD: 20Mo Các file dễ dàng được soạn thảo bởi những chương trình soạn thảo MIDI. Dễ dàng thay đổi thiết bị âm thanh. Các hạn chế của khuôn dạng MIDI Chất lượng âm thanh phụ thuộc vào: thiết bị ngoại vi và số lượng kênh âm thanh. Việc mã hoá dụng cụ âm nhạc không bình thường 55 2.2 Âm thanh Các thao tác đối với âm thanh số Lưu trữ Truy xuất (lưu trự và tìm kiếm, trích chọn) âm thanh số Các hiệu ứng âm thanh, lọc Trễ Lọc nhiễu Chuyển đổi khuôn dạng âm thanh Chuyển từ ADPCM về PCM hoặc ngược lại (quá trình giải nén và nén) 56 2.3 Hình ảnh tĩnh Ảnh sáng. Tần số. Cường độ. Màu sắc: Phụ thuộc vào bước sóng. <380nm: tia cực tím. 380nm – 450nm: tia tím. 450nm – 490nm: tia xanh lơ. 490nm – 560nm: xanh lá cây. 560nm – 590nm: vàng. 590nm – 640nm: da cam. 640nm – 760nm: đỏ. >760nm – hồng ngoại. Cảm nhận ánh sáng Cảm nhận theo bước sóng ánh sáng bàng các tế bào nón. Có ba dạng tế bào nón cảm nhận theo ba màu: đỏ, xanh lá cây, xanh da trời. Các tế bào này cảm nhận theo bước sóng từ 400nm – 700nm. Chứng mù màu. 57 2.3 Hình ảnh tĩnh Tổng hợp màu: Tổng hợp dương. Màu sắc được xác định như tổng cân bằng của ba màu cơ bản. Ba màu cơ bản: đỏ, xanh lá cây, xanh da trời. Mô hình RGB. Các màu cơ bản: Red, Green, Blue. Màu là tổng hợp của ba màu cơ bản theo thành phần. Nguyên lý chính của thiết bị màn hình. Tổng hợp âm. Màu sắc được xác định như cân bằng giữa màu trắng và ba màu cơ bản. Ba màu ngược với Red, Green, Blue là Cyan, Magenta, Yellow. Mô hình CMYK. Ba màu ngược với RGB: CMY. Màu là tổng hợp của ba màu cơ bản là ánh sáng phản xạ trên bề mặt của vật. Tổng của ba thành phần bằng nhau là màu đen. CMYK: màu tổng với màu đen tuyền. Nguyên lý của các thiết bị in. 58 2.3 Hình ảnh tĩnh Tổng hợp dươngTổng hợp âm 59 2.3 Hình ảnh tĩnh Ảnh: thông tin về vật thể hay quang cảnh được chiếu sáng mà con người quan sát và cảm nhận bằng mắt và hệ thống thần kinh thị giác. Ảnh đơn được biểu diễn bởi hàm độ chói và các biến tọa độ trong mặt phẳng ảnh I(x,y). Pixel: phần tử nhỏ nhất để biểu diễn ảnh, về nguyên tắc mắt thường không thể phân biệt được hai mức kề nhau. Pixel thiết bị: Màn hình máy tính là tập hợp của nhiều điểm nhỏ - pixel. Mỗi pixel gồm một cặp x,y và màu. Pixel có thể lưu trữ bằng: 1 bit - ảnh nhị phân (0-1). 8 bit - ảnh đa mức xám (0-255). 24 bit - ảnh màu (3 kênh RGB). 60 2.3 Hình ảnh tĩnh Ảnh 8 bit hay 16 bit Ảnh 8 bit RGB biểu diễn được hơn 16,7 triêu màu. Tuy nhiên các phép xử lý ảnh đều gây mất mát thông tin đặc biệt là với ảnh 8 bit. Ảnh 8 bit được thay thế bằng ảnh 16 bit Cho phép biểu diễn nhiều sắc thái màu hơn (65536 mức trên một kênh). Thông tin của ảnh sẽ nhiều hơn khi ảnh được xử lý, lương tin mất không đáng kể. Nhiều công cụ như Photoshop CS hỗ trợ xử lý ảnh 16 bit với đầy đủ các tính năng. Máy NIKON hỗ trợ ảnh nguyên thể 12 bit. Ảnh 48 bit thực ra là ảnh màu RGB (16 bit/kênh). 61 2.3 Hình ảnh tĩnh Các thiết bị thu nhận ảnh Máy camera + bộ chuyển đổi tương tự thành số AD hoặc máy quét scanner chuyên dụng. Hệ thống thu nhận ảnh thực hiện hai quá trình: Cảm biến: biến đổi năng lượng quang học thành năng lượng điện. Tổng hợp năng lượng điện thành ảnh điện. Số hóa ảnh Lấy mẫu: áp dụng cho ảnh có giải tần giới hạn được thực hiện bằng cách quét ảnh theo hàng ngang. Lương hóa ảnh: thực hiện ánh xạ từ một biến liên tục u (biểu diễn giá trị độ sáng) sang một biến rời rạc u* với các giá trị thuộc tập hưu hạn: Bộ lượng hóa không nhớ: giá trị đầu ra chỉ phụ thuộc duy nhất vào đầu vào. 62 2.3 Hình ảnh tĩnh Biểu diễn màu Dựa vào các màu gốc, việc xác định màu gốc có liên quan đến các khái niệm sinh học hơn là vật lý. Mắt người phản ứng khác nhau đối với ánh sáng khác nhau. Mô hình màu RGB sử dụng mô hình bổ xung trong đó ánh sáng đỏ, xanh là cây và xanh lam tổ hợp với nhau để tạo thành nhiều màu khác. RGB được dùng trong đồ họa máy tính, ống tia âm cực Kiểu 16 bit: 555 hoặc 565. Kiểu 32 bit: được đưa ra để phù hợp hơn với các phần cứng của máy tính. 32 bit RGBA: RGB + Alpha channel 63 2.3 Hình ảnh tĩnh Biểu diễn màu YUV Quy định không gian màu được tạo bởi một độ sáng Y (luminance) và hai thành phần màu (chrominance). Y về cơ bản giống tín hiệu truyền hình ti vi đen trắng, trong khi U, V có thể bỏ qua. YUV có thể dễ dàng xử lý loại bỏ bớt thông tin để tiết kiệm băng thông. Được sử dụng trong giải thuật nén video như MPEG-2 HSV Brightness: độ chói. Hue: sắc lượng, hay sắc thái màu Saturation: độ bão hòa. 64 2.3 Hình ảnh tĩnh Hệ thống xử lý ảnh 65 2.3 Hình ảnh tĩnh Các vấn đề về xử lý ảnh tĩnh: Thu nhận ảnh: số hoá ảnh. Xử lý ảnh: tạo ảnh, biên tập ảnh, hiển thị và thao tác ảnh trực quan. Lưu trữ ảnh:mã hoá ảnh, nén và giải nén; chất lượng nén; lưu trữ ảnh, các khuôn dạng lưu trữ ảnh. Phục hồi ảnh: hiển thị ảnh, chiếu ảnh; cảm nhận ảnh. Phổ biến ảnh: Thay đổi các khuôn dạng video, hoạt hình.. Nhiều khuôn dạng biểu diễn làm giảm tính tương thích. Vấn đề tăng chi phí truyền ảnh. Các tiêu chuẩn chất lượng ảnh: Tiêu chuẩn về màu sắc: số lượng màu sắc dùng biểu diễn ảnh. Tiêu chuẩn về độ phân giải: số lượng điểm dùng để biểu diễn ảnh. 66 2.3 Hình ảnh tĩnh Ảnh 3D Hình ảnh 3D là tập hợp của các điểm trong không gian 3 chiều được kết nối với nhau bằng các đoạn thẳng, tam giác hoặc mặt phẳng cong Hình ảnh 3D được tạo ra bằng tay, sử dụng thuật toán hoặc scanner. Các cách biểu diễn hình ảnh 3D: Sử dụng cấu trúc đặc. Sử dụng được biên. 67 2.3 Hình ảnh tĩnh Các khuôn dạng ảnh:hai dạng chính Ảnh vector. Là các dữ liệu đồ hoạ. Các dạng PIC, WMF, ... Một ảnh được coi là tập hợp của các hình hình học đơn giản. Ảnh bitmap. Là các dữ liệu hình ảnh. Các dạng file: BMP, GIF, TIFF, JPG, ... ảnh được biểu diễn bằng ma trận các điểm. Mỗi điểm có các giá trị tương ứng với các màu. 68 Các khuôn dạng ảnh Ảnh vector ảnh được hiểu như tổ hợp các hình hình học đơn giản. ảnh được hiển thị bằng cách vẽ các hình đồ hoạ tương ứng với các đối tượng của ảnh. Có ba dạng đối tượng rời rạc trên ảnh: Các điểm rời rạc: các đối tượng điểm. Các đường rời rạc: các đối tượng đường. Các mặt rời rạc: các đối tượng mặt. 69 Các khuôn dạng ảnh Các ảnh vector. Các ưu điểm: Mã hóa ảnh bằng các hình đơn giản. Gọn, kích thước nhỏ. Thay đổi kích thước đơn giản, không bị mất thông tin. Sửa dễ dàng do các phần tử của ảnh độc lập. Các nhược điểm: Không biểu diễn được các ảnh chụp. Xử lý các ảnh phức tạp với nhiều đối tượng gặp nhiều khó khăn. Khuôn dạng không chuẩn, các trình duyệt web không nhận dạng được. Khuôn dạng WMF: Chứa các thông tin về các đối tượng. Một file WMF có thể chứa 65535 đối tượng. 70 Các khuôn dạng ảnh Ảnh bitmap Hình ảnh được biểu diễn thông qua ma trận các điểm. Giá trị các điểm ảnh chỉ tới các mầu của điểm tương ứng với các sơ đồ biểu diễn màu. Biểu diễn màu theo sơ đồ RGB. Hai sơ đồ mã hóa màu: RGB và CYMK. Không gian màu và chuyển đổi: RGB(1,1,1) -> CMY (0,0,0) C=1-R; G=1-M; R=1-C; Y=1-B; M=1-G;B=1-Y; 71 Các khuôn dạng ảnh Mã hóa màu: Giá trị của điểm ảnh. Màu tương ứng theo giá trị đó tùy theo bảng màu. Phương pháp đơn giản. Đối với mỗi điểm ảnh giá trị của điểm ảnh là giá trị của màu. Màu được lựa chọn theo mô hình RGB. Đối với mỗi pixel: Mã hoá một thành phần RGB sử dụng n bit. Mô hình màu theo RGB sẽ được mã hoá theo 3 x n bit. Số lượng màu cho phép đối với mô hình RGB: 2n x 2n x 2n. Màu thực: true color: sử dụng 8 bit cho một thành phần màu, do đó số lượng màu cho phép biểu diễn sẽ là: 224 màu. 72 Các khuôn dạng ảnh Thành phần thứ tư là phần mở rộng có độ dài 8 bit để biểu diễn. Kênh alpha. Kênh alpha dùng để biểu diễn tính trong suốt của ảnh (transparence). Tính chất này dùng để tránh hiệu ứng bậc thang khi có nhiều ảnh chồng lên nhau. Biểu diễn bảng màu. N được lựa chọn trong số 2m x 2m x 2m màu. m chỉ số lượng bit để biểu diễn một thành phần màu. N là vị trí tương ứng trong bảng màu. Kích thước khối thông tin ảnh: X * Y * n trong đó X: số cột,Y: số hàng, n: số bit dùng để mã hoá một ảnh. ảnh bitmap cho chất lượng cao. 73 2.3 Hình ảnh tĩnh Một số định dạng ảnh phổ biến JPEG (Joint Photographic Experts Group): phương pháp nén ảnh hiệu quả với tỷ lệ nén tới vài chục lần. Sử dụng phương pháp nén mất mát thông tin. Các bước gồm: Phân khối, biến đổi Cosin rời rạc (DCT), lượng tử hóa và mã hóa. BMP: Các tệp tin đồ họa lưu dưới dạng BMP và có phần mở rộng .bmp hoặc .dib. Bitmap header (14 bytes): giúp nhận dạng tệp tin bitmap. Bitmap information (40 bytes): lưu chi tiết hiển thị ảnh. Color pallete (4x bytes), x là số màu của ảnh. Bitmap data: dữ liệu ảnh. GIF (Graphics Interchange Format): là định dạng tệp tin hình ảnh bitmap sử dụng ít hơn 256 bit. TIFF (Tagged Image File Format): được sử dụng trong quét ảnh, gửi fax, xử lý văn bản, nhận dạng chữ viết 74 2.4 Hình ảnh động Video Video là chuỗi các hình ảnh tĩnh được trình diễn trong một đơn vị thời gian khiến người xem có cảm giác như các sự vật trên đó như đang chuyển động. Video có thể lưu trữ và truyền trong nhiều môi trường khác nhau: PAL, NTSC, MPEG-4 hay DVI 3D video được quy định trong chuẩn MPEG-4 Part 16 Animation Framework eXtension (AFX). Các đặc tính của video: Số lượng khung (frame) trên một giây. Interlacing Độ phân giải Kích thước khung hình Phương pháp nén video Tốc độ truyền (đối với video số) 75 2.4 Hình ảnh động Video số Thuận lợi: Truy cập ngẫu nhiên trực tiếp thuận tiện, Việc tạo, lưu trữ và ghi đọc nhiều lần không ảnh hưởng đến chất lượng ảnh. Không cần xung xoá và xung đồng bộ. Xử lý thuận tiện, không gặp trở ngại về giới hạn tần số, băng thông. Khó khăn Tuy nhiên, tín hiệu số gặp một số trở ngại xoay quanh vấn đề về tính hiệu quả, chẳng hạn bộ lọc số có giá thành tương đối cao. Tiêu chuẩn lấy mẫu màu: Thuận lợi trong việc xử lý đối với tín hiệu video thành phần, nhưng băng thông yêu cầu lớn. 76 2.4 Hình ảnh động Video Số lượng khung hình trên một giây (Frame rate) Thông thường từ 6-25 frame/s, tùy theo camera. PAL (EU), SECAM (EU): 25 frame/s NTSC (US, Japan): 29,97 frame/s Interlacing Interlacing: Chia màn hình thành các dòng, mỗi lần chùm electron chỉ quét dòng chẵn hoặc lẻ tiết kiệm băng thông đường truyền. NTSC, PAL, SECAM sử dụng chế độ interlacing: PAL 576i50. Progressive: dòng electron sẽ quét tất cả màn hình cho hình ảnh chất lượng cao, vd: HDTV. Độ phân giải Được tính theo đơn vị pixel đối với dữ liệu số và dòng quét ngang, quét dọc với dữ liệu tương tự. NTSC: 720/704/640x480i60. PAL: 768/720x576i50. HDTV: 1920x1080p60 77 2.4 Hình ảnh động Video Kích thước màn hình Màn hình truyền thống: 4:3 Màn hình HD: 16x9 widescreen. Các phương pháp nén video Intraframe compression: nén tương tự như kỹ thuật nén ảnh. Interframe compression: nén dựa trên sự khác biệt giữa các frame (chỉ lưu sự khác biệt). MPEG-2: sử dụng cho DVD và ti vi truyền từ vệ tinh. MPEG-4 dùng cho video gia đình. Tốc độ truyền (bitrate): Tốc độ càng cao, chất lượng video càng tốt. Video CD; 1 Mbps. DVD: 5 Mbps. HDTV: 20 Mbps. 78 2.4 Hình ảnh động Hoạt hình (Animation) Tạo ra ảo giác quang học về sự chuyển động do nhiều hình ảnh tĩnh được chiếu tiếp diễn liên tục. Nguyên lý: dựa vào hiện tượng lưu ảnh của mắt (persistence of vision). Một số định dạng đồ họa: GIF, MNG, SVG, Flash kích thước nhỏ, cho phép truyền trên máy tính thông qua Internet. Motion capture Kỹ thuật lưu lại chuyển động và tái hiện thông qua mô hình mô phỏng. Được sử dụng rộng rãi trong các lĩnh vực thể thao, giải trí 79 2.4 Hình ảnh động Một số các định dạng video AVI (Audio Video Interleave) là một định dạng của Microsoft được giới thiệu vào tháng 11 năm 1992. AVI là tập tin có thể chứa cả âm thanh và video dữ liệu trong một container cho phép đồng bộ tập tin âm thanh-với-video. AVI là một trong những định dạng của RIFF. Phần header (56 byte) chứa các thông tin : Thời gian trễ giữa các frame Tốc độ dữ liệu, Số lượng frame, Số dòng dữ liệu Kích thước video . MKV (Matroska Multimedia Container) - là một chuẩn mở miễn phí định dạng container. Được công bố vào ngày 06 tháng 12 2002, Matroska là một định dạng tập tin có thể chứa đựng một số lượng không giới hạn video, âm thanh, hình ảnh hoặc phụ đề trong một tập tin duy nhất. 80 2.4 Hình ảnh động Một số các định dạng video MPEG (Moving Picture Expert Group) được ra đời vào năm 1988 nhằm mục đích chuẩn hoá cho nén tín hiệu âm thanh và video Mpeg-1 là chuẩn lưu trữ và phục hồi ảnh động và Audio trong lưu trữ Media Mpeg-2 là chuẩn cho TV số Mpeg-4 là chuẩn cho các ứng dụng MultiMedia Mpeg-7 chứa đặc tả thông tin, giao diện cho việc tìm kiếm thông tin H26x – Do tổ chức ITU đưa ra phục vụ cho dịch vụ hội nghị truyền hình và video phone H261 – phục vụ cho truyền qua ISDN ở tốc độ 64 kbps Sử dụng CIF và QCIF H263 – cải tiến cho video tốc độ thấp, có thể truyền trên mạng thoại công cộng PSTN 81 2.4 Hình ảnh động Một số dạng tín hiệu video số theo các chuẩn CIF : Common Intermediate Format Sử dụng trong chuẩn H261, dễ chuyển sang chuẩn PAL hay NTSC Y resolution: 352 x 288, 8 bits/pixel(sample) CrCb/UV resolution: 176 x 144 Frame rate: 30 frames/second progressive QCIF:Quarter Common Intermediate Format Y resolution: 176 x 144, 8 bits/pixel (sample) CrCb/UV resolution: 88 x 72 Frame rate: 30 frames/second progressive TV –NTSC Resolution: 704 x 480, 30 frames/second interlaced DVD –NTSC Resolution: 720 x 480, 24 –30 frames/second progressive 82 2.4 Hình ảnh động Các vấn đề liên quan đến thao tác: Xử lý Tạo, biên tập theo phương pháp tương tự và số Các phần mềm hiển thị và thao tác với ảnh động Hiển thị và thao tác chuỗi video Chèn các hiệu ứng thích hợp Lưu trữ: Mã hóa và nén Lưu trữ, các khuôn dạng lưu trữ Mất thông tin khi nén dữ liệu Phục hồi ảnh Hiển thị ảnh, chiếu ảnh, cảm nhận ảnh 83 2.4 Hình ảnh động Đồng bộ giữa audio và video Tại sao ? Dữ liệu đa phương tiện : dữ liệu từ nhiều nguồn phương tiện (media) khác nhau cả về thời gian và không gian Nhiệm vụ của đồng bộ: xác lập lại quan hệ thời gian thực giữa các dòng dữ liệu nguồn Một số khái niệm Đồng bộ liên tục : đồng bộ bám liên tục theo thời gian, Đồng bộ điểm : đồng bộ các khối dữ liệu tại các thời điểm, Đồng bộ trong một dòng dữ liệu phương tiện (Intramedia Synchronization) : xác lập lại quan hệ thời gian giữa các sự kiện trong 1 dòng dữ liệu của 1 phương tiện, đơn luồng Đồng bộ giữa các dòng (Intermedia synchronization) : xác lập lại quan hệ thời gian giữa các dòng dữ liệu phương tiện.
File đính kèm:
- bai_giang_truyen_thong_va_mang_may_tinh_phan_2_tran_nguyen_n.pdf