Xây dựng thư viện số và một số thách thức trong lưu trữ - Bảo quản tài liệu số

Cuộc cách mạng về công nghệ thông tin đã làm thay đổi các thư viện từ truyền thống

sang hiện đại. Việc phát minh ra đĩa CD-ROM vào năm 1980 là một bước ngoặt trong số

hóa thông tin và hơn 20 năm qua cùng với sự phát triển mạnh mẽ của Internet và công

nghệ số đã dễ dàng cho phép con người tạo ra số lượng tài nguyên thông tin số vô cùng

lớn mà trước đó chúng ta không thể tưởng tượng được. Do vậy trong các thư viện, nguồn

tài liệu số cũng tăng lên nhanh chóng từ tài liệu số (born-digital materials) và công tác số

hóa (digitization) dẫn tới suy nghĩ cần phải xây dựng thư viện số, tổ chức lưu trữ, bảo

quản để phục vụ tìm kiếm sử dụng lâu dài và thế là Thư viện số ra đời, phát triển cùng rất

nhiều những thách thức đặt ra với các cơ quan thông tin – thư viện.

Đối với một số người thì thư viện số chỉ đơn giản là tin học hóa thư viện truyền thống.

Nhưng trong thực tế thì để triển khai một hệ thống Thư viện số là phải có một hạ tầng

công nghệ thông tin chuyên dụng cùng các khâu nghiệp vụ chuyên môn như thu thập, tổ

chức, phân loại, xây dựng các bộ sưu tập, các vấn đề bản quyền, chính sách truy cập và

các phương pháp tiếp cận cũng như bảo quản lâu dài để sử dụng được trong tương lai khi

các ứng dụng đọc, xem tài liệu có thể thay đổi mà nguồn tài liệu không bị ảnh hưởng gì

hay phục hồi các đối tượng số khi xảy ra nguy cơ, sự cố.

pdf 5 trang kimcuc 6300
Bạn đang xem tài liệu "Xây dựng thư viện số và một số thách thức trong lưu trữ - Bảo quản tài liệu số", để tải tài liệu gốc về máy hãy click vào nút Download ở trên

Tóm tắt nội dung tài liệu: Xây dựng thư viện số và một số thách thức trong lưu trữ - Bảo quản tài liệu số

Xây dựng thư viện số và một số thách thức trong lưu trữ - Bảo quản tài liệu số
XÂY DỰNG THƯ VIỆN SỐ VÀ MỘT SỐ THÁCH THỨC 
TRONG LƯU TRỮ - BẢO QUẢN TÀI LIỆU SỐ 
 Lê Bá Lâm
*
Tóm tắt: Thư viện số là gì? Các định nghĩa về thư viện số; Thư viện số, Thư viện ảo, 
Thư viện điện tử,.. đều là thư viện số? Những vấn đề trong xây dựng một thư viện số; 
Phân tích những thách thức trong việc lưu trữ và bảo quản kho tài liệu số của các thư 
viện. 
Từ khóa: Thư viện số; Lưu trữ số; Bảo quản số 
Mở đầu 
Cuộc cách mạng về công nghệ thông tin đã làm thay đổi các thư viện từ truyền thống 
sang hiện đại. Việc phát minh ra đĩa CD-ROM vào năm 1980 là một bước ngoặt trong số 
hóa thông tin và hơn 20 năm qua cùng với sự phát triển mạnh mẽ của Internet và công 
nghệ số đã dễ dàng cho phép con người tạo ra số lượng tài nguyên thông tin số vô cùng 
lớn mà trước đó chúng ta không thể tưởng tượng được. Do vậy trong các thư viện, nguồn 
tài liệu số cũng tăng lên nhanh chóng từ tài liệu số (born-digital materials) và công tác số 
hóa (digitization) dẫn tới suy nghĩ cần phải xây dựng thư viện số, tổ chức lưu trữ, bảo 
quản để phục vụ tìm kiếm sử dụng lâu dài và thế là Thư viện số ra đời, phát triển cùng rất 
nhiều những thách thức đặt ra với các cơ quan thông tin – thư viện. 
Đối với một số người thì thư viện số chỉ đơn giản là tin học hóa thư viện truyền thống. 
Nhưng trong thực tế thì để triển khai một hệ thống Thư viện số là phải có một hạ tầng 
công nghệ thông tin chuyên dụng cùng các khâu nghiệp vụ chuyên môn như thu thập, tổ 
chức, phân loại, xây dựng các bộ sưu tập, các vấn đề bản quyền, chính sách truy cập và 
các phương pháp tiếp cận cũng như bảo quản lâu dài để sử dụng được trong tương lai khi 
các ứng dụng đọc, xem tài liệu có thể thay đổi mà nguồn tài liệu không bị ảnh hưởng gì 
hay phục hồi các đối tượng số khi xảy ra nguy cơ, sự cố. 
Định nghĩa Thư viện số 
Theo Larson định nghĩa “Thư viện số là thư viện ảo toàn cầu – hàng ngàn thư viện điện 
tử nối mạng với nhau”[1]. Thư viện số trình bày các bộ sưu tập tài liệu số và cho phép 
người dùng tin truy cập tại bất kỳ địa điểm và thời gian nào. 
Một nhóm làm việc trong cơ quan hạ tầng công nghệ thông tin của chính phủ Mỹ cho 
rằng “Thư viện số là một hệ thống cung cấp cho người dùng truy cập đến tri thức, thông 
tin trong các kho tài liệu số”. 
Liên đoàn thư viện số Mỹ thì định nghĩa “Thư viện số là một tổ chức cung cấp tài nguyên 
thông tin, bao gồm cả các nhân viên để hướng dẫn truy cập, tạo lập, phân phối, đảm bảo 
tính toàn vẹn và ổn định lâu dài theo thời gian của các bộ sưu tập số”. [2] 
Nói chung để định nghĩa thư viện số thì nó là một tập hợp các yếu tố: Các bộ sưu tập số 
của các đối tượng thông tin; các dịch vụ hỗ trợ sử dụng; tổ chức và bảo quản các tài liệu 
* Phó Giám đốc, Trung tâm Thông tin – Thư viện, Đại học Quốc gia Hà Nội 
số. Mục tiêu chính là cải thiện tiếp cận tài liệu nhanh chóng, nhiều người cùng lúc, tiết 
kiệm chi phí, bảo quản tài liệu lâu dài với sự hỗ trợ của công nghệ thông tin. 
Xây dựng thư viện số 
Một trong những vấn đề lớn nhất trong xây dựng thư viện số là xây dựng các bộ sưu tập 
số. Mô hình của nó chính là một hệ thống liên kết giữa hệ thống mạng, phần cứng, phần 
mềm. Phần cứng ở đây là hệ thống mạng, máy chủ, bộ lưu trữ, máy tính, máy quét; Phần 
mềm sẽ giúp tổ chức các bộ sưu tập, hiển thị, trình bày nội dung cùng với các phần mềm 
số hóa để chụp tài liệu, chỉnh sửa hình ảnh, nhận dạng kí tự,... 
Một số điểm quan trọng khi xây dựng một thư viện số như sau: 
a) Bộ sưu tập số: Để có tài liệu số xây dựng thành các bộ sưu tập, thông thường lấy 
từ 3 nguồn là bản thân tài liệu xuất bản số; tài liệu số hóa từ bản cứng và tài liệu số thư 
viện sưu tập được. 
b) Truy cập ra bên ngoài thông qua các hợp đồng, thỏa thuận với các nhà xuất bản 
sách điện tử, tạp chí điện tử, cơ sở dữ liệu như Elsevier, Springer,... hoặc các đối tác hoặc 
đến các trang web. 
c) Lựa chọn tài liệu để số hóa: Lựa chọn tài liệu để số hóa cũng là một vấn đề quan 
trọng trong công tác số hóa tài liệu. Thông thường tài liệu nội sinh sẽ được tính đến vì 
nhiều vấn đề liên quan như khẳng định giá trị học thuật của đơn vị, vấn đề bản quyền,... 
Các đơn vị thường đưa ra 5 tiêu chí và xếp theo thứ tự ưu tiên. Tài liệu được chọn phải 
thỏa mãn 3 tiêu chí hoặc ít nhất là 2 tiêu chí đầu. 
 + Tiêu chí 1 – Truy cập. Là tài liệu được sử dụng nhiều hoặc tài liệu có giá trị như 
giá trị chính trị, giá trị nghiên cứu giảng dạy, giá trị tài chính và giá trị văn hóa xã hội 
hay truyền thống. Những tài liệu đơn bản hoặc hiếm cũng được xếp trong tiêu chí này. 
 + Tiêu chí 2 – Bảo quản. Là những tài liệu dễ hỏng, dễ phân hủy, khó bảo quản. 
 + Tiêu chí 3 – Cộng đồng. Là những tài liệu phục vụ cho các sự kiện, các chương 
trình nghiên cứu trọng điểm hay các triển lãm và xây dựng thương hiệu ĐHQGHN. 
 + Tiêu chí 4 – Tài liệu có tiềm năng phát triển. Là những tài liệu có kinh phí từ dự 
án, tương lai được đầu tư, bổ sung hoặc số hóa theo yêu cầu của lãnh đạo hay nhà tài trợ. 
 + Tiêu chí 5 – Cam kết của thư viện. Thư viện có thể có một cam kết từ trước khi 
số hóa một bộ sưu tập cụ thể. 
d) Hạ tầng công nghệ thông tin: Đây là một trong những nội dung quan trọng trong 
các nội dung đưa ra gồm hạ tầng phần cứng và phần mềm. Hạ tầng phần cứng và phần 
mềm là bắt buộc, tuy nhiên một số đơn vị có thể lựa chọn thuê một phần hoặc trọn gói 
bởi các nhà cung cấp dịch vụ, nội dung này là xu hướng các thư viện trên thế giới hay áp 
dụng sẽ tiết kiệm chi phí đầu tư ban đầu, cũng như vận hành và quản trị. Các phần mềm 
thường đã đóng gói, thư viện chỉ được giới thiệu các tính năng và xem demo, khi đi vào 
sử dụng thực tế mới nảy sinh nhiều bất cập mà những kỳ vọng ban đầu của thư viện cho 
phần mềm lại không đáp ứng được. 
e) Nhân lực triển khai và quản trị: Để triển khai xây dựng cần có một đội ngũ nhân 
lực được đào tạo bài bản để xử lý tài liệu, áp dụng các vấn đề bản quyền, bảo mật, vận 
hành và cung cấp dịch vụ sau khi hoàn thành cũng như sửa chữa cập nhật thông tin. 
Những ưu điểm và hạn chế của thư viện số 
Ưu điểm: 
- Không hạn chế bởi ranh giới vật lý: Người dùng tin có thể truy cập ở bất cứ đâu, 
chỉ cần thiết bị có kết nối Internet. 
- Không hạn chế thời gian truy cập: Người dùng tin có thể truy cập vào bất kỳ thời 
gian nào (24/7). 
- Nhiều truy cập cùng lúc: Các tổ chức và cá nhân có thể truy cập cùng lúc tới thư 
viện, tới cùng một đối tượng thông tin. 
- Truy vấn thông tin: Người sử dụng có thể sử dụng thuật ngữ bất kỳ để tìm kiếm và 
khai thác thông tin (từ, cụm từ, nhan đề, tác giả, chủ đề,...) trong toàn bộ thư viện số và 
có thể kết hợp các lệnh tìm với nhau để tìm kiếm chính xác qua sự hỗ trợ của giao diện 
phần mềm. 
- Không gian bảo quản và lưu trữ: Tài liệu số cho phép lưu trữ gọn nhẹ và bảo quản 
lâu dài và không cần nhiều không gian như lưu trữ vật lý. 
- Bổ sung thông tin: Hình ảnh tài liệu số hóa có thể được làm rõ hơn nhờ công nghệ 
chỉnh lý hình ảnh hoặc thêm bớt các hướng dẫn, nhận xét dễ dàng. 
Hạn chế:[3] 
- Người dùng phải được cấp quyền truy cập nếu thư viện yêu cầu 
- Những vấn đề liên quan đến bảo quản số 
- Các thỏa thuận liên quan đến vấn đề bản quyền tài liệu 
- Nhiều chính sách truy cập cho các đối tượng khác nhau 
- Làm sao để thiết kế giao diện tối ưu cho nhiều đối tượng người dùng 
- Lựa chọn được phần mềm phù hợp là vấn đề rất khó khăn 
- Tổ chức thông tin phù hợp 
- Đào tạo, phát triển và duy trì 
Một số thách thức trong lưu trữ - bảo quản tài liệu số 
Để bảo quản một kho tài liệu số thì hiện nay đa số các phần mềm được phát triển dựa 
trên mô hình Hệ thống thông tin lưu trữ mở OAIS (Open Archival Information System). 
Các nghiên cứu chỉ ra rằng, mô hình này đảm bảo 6 chức năng của một hệ thống bảo 
quản số là: Thu thập; Lưu trữ; Quản lý dữ liệu; Quản trị; Bảo quản; Truy cập. Mô hình 
OAIS giúp hiểu rõ hơn các quy trình công việc cần thiết cho hệ thống lưu trữ số cũng 
như một số thuật ngữ đã đề cập như gói thông tin đăng ký SIP (Submission Information 
Package), gói thông tin lưu trữ AIP (Archival Information Package), gói thông tin phổ 
biến DIP (Dissemination Information Package),... 
Thách thức I: Xác định ý nghĩa của việc xây dựng, bảo quản thư viện số và làm sao 
để tổ chức, quy hoạch mạch lạc đối với các đối tượng số trong điều kiện số lượng 
phát triển nhanh chóng 
Xác định mục tiêu cuối cùng là lưu trữ, bảo quản toàn vẹn về nội dung và cho phép truy 
cập lâu dài theo thời gian. Các vấn đề đặt ra ở đây là: 
 Khôi phục thảm họa: Xác định các rủi ro thiên tai, chủ quan của con người và 
cách phục hồi tài liệu từ những rủi ro, việc này áp dụng cho không chỉ các tài liệu số mà 
cũng như tài liệu giấy, vật lý. 
 Sao lưu dữ liệu: Các tài liệu cần phải được sao lưu thành nhiều bản và phải đặt ở 
các địa điểm vật lý khác nhau. 
 Đảm bảo các công cụ lưu trữ luôn tốt: Các thiết bị lưu trữ khác nhau đều có thời 
hạn sử dụng nhất định và đều có những rủi ro nhất định theo thời gian. Khi xảy ra sự cố 
đều có thể phá hủy dữ liệu, mất tính toàn vẹn. Trong một nghiên cứu gần đây của tập 
đoàn PrestoPRIME (một dự án được tài trợ bởi Liên minh châu Âu về việc bảo quản nội 
dung nghe nhìn), hơn 35 rủi ro về lưu trữ tài liệu số đã được ghi nhận. 
 Lên kế hoạch bảo quản: Thường xuyên lên kế hoạch bảo quản, chuyển đổi định 
dạng khi cần thiết để phù hợp với các chương trình đọc dịch mới. 
Một hiệp hội về Dịch vụ kỹ thuật và các bộ sưu tập thư viện (ALCTS) có định nghĩa về 
bảo quản số, trong đó có một ý là: “kết hợp các chính sách, chiến lược và hành động để 
đảm bảo luôn truy cập được nội dung, không phụ thuộc vào công nghệ thay đổi”. Định 
nghĩa này xác định việc bảo quản tài liệu số là một quá trình lâu dài, bền bỉ và khó khăn 
khi phải đối diện với nhiều nguy cơ. 
Người ta xác định 3 chủ đề chính trong bảo quản số là: 
- Thu thập: Thu thập tài liệu và đưa vào hệ thống 
- Lưu trữ: Đảm bảo sự toàn vẹn của tài liệu (các files) 
- Bảo quản: Tích cực phát hiện rủi ro, sao lưu thường xuyên. 
Thách thức II: Mô hình dữ liệu. Làm sao để triển khai thực tế tốt nhất 
Tạo một mô hình dữ liệu để lưu trữ, bảo quản tài liệu số có các nhiệm vụ và thách thức: 
 Hỗ trợ cấu trúc và siêu dữ liệu để bảo quản lâu dài 
 Hỗ trợ nhiều định dạng và dữ liệu trong cùng một mô hình 
 Hỗ trợ được nhiều tổ chức như thư viện, bảo tàng, trung tâm lưu trữ 
 Phù hợp với các chuẩn quốc tế và chuẩn mở 
Một hệ thống bảo quản dữ liệu số ngoài việc lưu trữ số tất nhiên còn lưu trữ hệ thống mô 
tả siêu dữ liệu biên mục. Thông thường các hệ thống này sử dụng chuẩn biên mục 
DublinCore. 
Thách thức III: Cơ sở hạ tầng và công nghệ 
Các đơn vị thường đã có một cơ sở hạ tầng (phần cứng, phần mềm), có thể là cho quản lý 
các bộ sưu tập số đơn giản hoặc các phần mềm thư viện trước đó và khi đó nảy sinh 2 
vấn đề: 
- Thứ nhất: Muốn tạm thời giữ lại và chưa thay thế hoàn toàn 
- Thứ hai: Hệ thống phải tích hợp được với hệ thống cũ và dữ liệu cũ phải được 
chuyển đổi 
Thách thức IV: Hệ thống phải đáp ứng hoặc cho phép can thiệp bởi các ứng dụng 
phát triển khác 
Một hệ thống bảo quản số được xây dựng, lập trình trong một môi trường, công cụ lập 
trình cụ thể. Những thách thức mà chúng ta đối mặt là hệ thống không bị độc quyền bởi 
nhà cung cấp trước. Một số trường hợp chúng ta cần đến ứng dụng thứ 3 để có thể đáp 
ứng được yêu cầu mới của đơn vị mà không bị lệ thuộc vào phần mềm. 
Kết luận 
Tóm lại để xây dựng được một thư viện số đúng chuẩn, chia sẻ và phục vụ thông tin dễ 
dàng, đáp ứng được đa dạng đối tượng sử dụng, đảm bảo vấn đề bản quyền, những vấn 
đề riêng của thư viện đó và bảo quản, lưu trữ số được lâu dài, sử dụng được trong tương 
lai là hết sức khó khăn đòi hỏi sự khởi đầu phải hết sức chuyên nghiệp từ nhà tư vấn đến 
lãnh đạo đơn vị và các chuyên viên. Ngoài ra kinh phí đầu tư hạ tầng ban đầu, phát triển 
tài nguyên thông tin, vận hành, duy trì là những vấn đề đặt ra cho các thư viện. Và cuối 
cùng những thách thức chính để xây dựng một thư viện số, hệ thống lưu trữ và bảo quản 
số có thể tổng kết lại là: Xác định yêu cầu ban đầu; Xây dựng mô hình dữ liệu thích hợp; 
Xác định các định dạng dữ liệu; Tích hợp hệ thống với hạ tầng hiện có; Đảm bảo an toàn 
và lâu dài cho hệ thống dữ liệu. 
TÀI LIỆU THAM KHẢO 
1. Rane, M.Y., Digital libraries: A Practical approach. 2015. 2(1): p. 142-150. 
2. Kiểm, C.M., Thư viện số: Định nghĩa và vấn đề. Tạp chí Thông tin và Tư liệu, 
2000(Số 3): p. 5-12. 
3. Mishra, R.K., Digital Libraries: Definitions, Issues and Challenger. Innovare 
Journal of Education, 2016. 4(3): p. 1-3. 

File đính kèm:

  • pdfxay_dung_thu_vien_so_va_mot_so_thach_thuc_trong_luu_tru_bao.pdf