Web scale discovery – Giải pháp tìm kiếm và khai thác thông tin cho các thư viện trong kỷ nguyên số

Tìm kiếm thông tin tập trung – Web scale discovery (WSD) đang là xu thế hiện

nay của các thư viện trong môi trường trực tuyến và có nhiều cơ sở dữ liệu

(CSDL) phân tán. Bài viết lý giải sự xuất hiện hệ thống tìm kiếm tập trung WSD

đồng thời đưa ra khái niệm và cấu trúc của cơ bản của hệ thống. Trên cơ sở

đó gợi ý cho các thư viện (cụ thể là thư viện đại học) Việt Nam trong việc phát

triển và áp dụng hệ thống này

pdf 14 trang thom 08/01/2024 1680
Bạn đang xem tài liệu "Web scale discovery – Giải pháp tìm kiếm và khai thác thông tin cho các thư viện trong kỷ nguyên số", để tải tài liệu gốc về máy hãy click vào nút Download ở trên

Tóm tắt nội dung tài liệu: Web scale discovery – Giải pháp tìm kiếm và khai thác thông tin cho các thư viện trong kỷ nguyên số

Web scale discovery – Giải pháp tìm kiếm và khai thác thông tin cho các thư viện trong kỷ nguyên số
22/12/2015 Khoa Thông tin - Thư viện | Web scale discovery – giải pháp tìm kiếm và khai thác thông tin cho các thư viện trong kỷ nguyên số
data:text/html;charset=utf-8,%3Cdiv%20class%3D%22page-title%20content-left%22%20style%3D%22padding%3A%200px%3B%20margin%3A%200px%3B 1/14
Web scale discovery – giải
pháp tìm kiếm và khai thác
thông tin cho các thư viện
trong kỷ nguyên số
Trang đầu Học liệu Bài tạp chí
Đỗ Văn Hùng
Khoa Thông tin – Thư viện, Trường Đại học Khoa học Xã hội và Nhân Văn,
VNU-HN
dvhung@vnu.edu.vn
Tìm kiếm thông tin tập trung – Web scale discovery (WSD) đang là xu thế hiện
nay của các thư viện trong môi trường trực tuyến và có nhiều cơ sở dữ liệu
(CSDL) phân tán. Bài viết lý giải sự xuất hiện hệ thống tìm kiếm tập trung WSD
đồng thời đưa ra khái niệm và cấu trúc của cơ bản của hệ thống. Trên cơ sở
đó gợi ý cho các thư viện (cụ thể là thư viện đại học) Việt Nam trong việc phát
triển và áp dụng hệ thống này.
Bài đăng trên tạp chí: Thông tin và tư liệu, số 3/2015, trang 15-24
1.Bối cảnh và yêu cầu cần có hệ thống tìm kiếm tập trung
Các thư viện đang chuyển hoạt động của mình sang môi trường trực tuyến. Đó
là môi trường mà thông tin đang dần chuyển sang định dạng số, kể cả tài liệu
in ấn cũng được chỉ mục trong cơ sở dữ liệu (CSDL) thư mục, bên cạnh đó là
thói quen khai thác và sử dụng tài liệu trực tuyến của bạn đọc. Đưa thông tin
lên interrnet, tiến gần với bạn đọc hơn thông qua thế giới mạng đang là cách
14/07/2015
22/12/2015 Khoa Thông tin - Thư viện | Web scale discovery – giải pháp tìm kiếm và khai thác thông tin cho các thư viện trong kỷ nguyên số
data:text/html;charset=utf-8,%3Cdiv%20class%3D%22page-title%20content-left%22%20style%3D%22padding%3A%200px%3B%20margin%3A%200px%3B 2/14
tiếp cận của các thư viện hiện nay. Một trong những vấn đề đặt ra cho các thư
viện là làm sao giúp bạn đọc có thể tìm kiếm và khai thác thông tin mà mình
cần một cách dễ dàng và hiệu quả nhất.
Các thư viện hiện nay có nhiều CSDL khác nhau và được tổ chức phân tán.
Nguồn thông tin trong thư viện hiện nay không còn là chỉ trong nội bộ thư viện
như các kho sách, các CSDL trong máy chủ của thư viện, mà các thư viện
đang hướng tới mua bản quyền các CSDL toàn văn trực tuyến từ các nhà
cung cấp thông tin chuyên nghiệp, cũng như cố gắng khai thác các nguồn
thông tin có chất lượng và miễn phí trên internet. Mục tiêu là đưa ra nhiều lựa
chọn, đa dạng hóa nguồn cùng cấp thông tin cho bạn đọc. Để giúp bạn đọc
khai thác thông tin, cách làm sơ khai của các thư viện là tạo liên kết đến các
nguồn thông tin này trên website của thư viện, bạn đọc phải vào từng liên kết
để tìm kiếm thông tin. Ngay cả đối với nguồn thông tin do chính thư viện tạo ra,
bạn đọc cũng phải tìm kiếm nhiều lần ở các CSDL khác nhau như cơ sở dữ
liệu thư mục và cơ sở dữ liệu toàn văn. Bạn đọc phải đăng nhập nhiều lần cho
các CSDL này. Lý do là một số thư viện quản lý dữ liệu thư mục ở phần mềm
quản trị thư viện điện tử tích hợp. Trong khi đó tài liệu số được lưu trữ ở các
phần mềm như: Dspace, Greenstone hay Content pro. Các phần mềm này
chưa có sự liên kết với nhau.
Dù muốn hay không, việc tồn tại các CSDL phân tán là điều không thể tránh
khỏi ở các thư viện hiện đại. Bài toán đặt ra là bạn đọc không cần biết thư viện
có bao nhiêu CSDL và từ nguồn nào, họ chỉ cần vào một giao diện web duy
nhất, với một công cụ tìm kiếm duy nhất có thể tìm kiếm và khai thác được tất
cả các CSDL mà thư viện đang có, kể cả các CSDL ngoài thư viện. Đây chính
là nhu cầu tìm kiếm thông tin tập trung mà các thư viện đang phải đối mặt
trong quá trình xây dựng không gian học tập trực tuyến. Hệ thống tìm kiếm tập
trung – Web scale discovery – WSD ra đời nhằm đáp ứng nhu cầu này. Mong
muốn của bạn đọc là thư viện có một hệ thống tìm kiếm như Google: đơn giản
và hiệu quả. Với một thanh công cụ tìm kiếm đơn giản nhưng có khể khám phá
được nhiều nguồn thông tin khác nhau và kết quả trả về được trình bày thân
thiện và theo một định dạng thống nhất. Đặc trưng về giao diện của hệ thống
WSD đó là tối giản hóa việc tìm kiếm bằng một ô tìm kiếm duy nhất (single
search box) như chúng ta thường thấy ở công cụ tìm kiếm google.
22/12/2015 Khoa Thông tin - Thư viện | Web scale discovery – giải pháp tìm kiếm và khai thác thông tin cho các thư viện trong kỷ nguyên số
data:text/html;charset=utf-8,%3Cdiv%20class%3D%22page-title%20content-left%22%20style%3D%22padding%3A%200px%3B%20margin%3A%200px%3B 3/14
Hình 1: Giao diện tìm kiếm của thư viện đại học Harvard sử dụng hệ thống
Primo của Ex Libris
2. Hệ thống tìm kiếm tập trung WSD
2.1. Khái niệm
Hệ thống tìm kiếm tập trung WSD ra đời khoảng giữa những năm 2000 và đã
nhanh chóng được nhiều thư viện áp dụng, đặc biệt là các thư viện đại học
[10]. Triết lý của hệ thống này là lấy người dùng làm trung tâm của hệ thống.
Tương tác người dùng đầu cuối “Front-End” của WSD nhắm tới việc cung cấp
thống nhất cách trình bày kết quả theo một định dạng chung, trên một giao
diện web duy nhất cho dù các nguồn dữ liệu là khác nhau hay các định dạng
khác nhau. Đây chính là điểm ấn tượng của hệ thống WSD. Hệ thống này cho
bạn đọc cảm giác đang tìm kiếm và khai thác thông tin ở chính trong thư viện
của mình. Thực tế có thể gọi WSD là thệ thống (Web-scale discovery systems)
hoặc là dịch vụ (Web scale discovery services) đều có thể được. Bởi WSD bảo
gồm cả các giải pháp tìm kiếm và các dịch vụ liên quan đến khai thác thông tin
đi kèm.
Hệ thống WSD dành cho các thư viện được đĩnh nghĩa là máy tìm kiếm (search
engines) cho phép người dùng tìm kiếm không chỉ đơn thuần là nhan đề của
cuốn sách, tạp chí hay video, mà giúp người dùng đào bới sâu trong từng nội
dung của bài tạp chí, từng chương trong một cuốn sách và nhiều hơn thế nữa
[10]. Về lý thuyết thì các máy tìm kiếm này mang đến một công cụ tìm kiếm đầy
sức mạnh như Google cho tất cả các nội dung tài liệu mà thư viện đang nắm
giữ hoặc có mua bản quyền từ bên ngoài [11]. Trong thực tế thì các máy tìm
kiếm của WSD đã làm khá tốt chức năng này. Dĩ nhiên không có một dịch vụ
22/12/2015 Khoa Thông tin - Thư viện | Web scale discovery – giải pháp tìm kiếm và khai thác thông tin cho các thư viện trong kỷ nguyên số
data:text/html;charset=utf-8,%3Cdiv%20class%3D%22page-title%20content-left%22%20style%3D%22padding%3A%200px%3B%20margin%3A%200px%3B 4/14
WSD hoàn hảo, nó phụ thuộc rất nhiều vào người sử dụng hệ thống đó cũng
như nguồn lực thông tin và các thư viện mà thư viện có thể cung cấp. Nhưng ít
nhất, một trong những điểm mạnh của hệ WSD là giải quyết được những vấn
đề khó khăn trong tìm kiếm các bài báo của tạp chí. Với hàng ngàn đầu tạp
chí, hàng triệu bài báo đề cập đến tất cả các lĩnh vực khoa học. Việc tìm kiếm,
sắp xếp và chuyển tải đến người dùng là vấn đề không đơn giản. WSD làm
cho công việc này dễ dàng hơn. Một điểm khác biệt giữa các máy tìm kiếm trên
internet phổ biến hiện nay (ví dụ như Google, Yahoo hay Bing) với hệ thống
tìm kiếm tập trung là WSD đánh chỉ mục, tìm kiếm và cung cấp những nguồn
thông tin đã qua sàng lọc và thẩm định (bởi thư viện) trong khi các máy tìm
kiếm internet đánh chỉ mục toàn bộ nguồn thông tin mà nó có thể với tới trên
internet.
Theo hiệp hội thư viện Mỹ (American Library Association) thì dịch vụ WSD là
một công cụ đầy tiềm năng để biến đổi bản chất của hệ thống thư viện. Các
dịch vụ này có khả năng tìm kiếm thông tin nhanh chóng từ nhiều nguồn khác
nhau (trong và ngoài thư viện, nội bộ hay từ xa), tạo ra sự liền mạch và thống
nhất trong việc cung cấp thông tin, thông tin được tìm kiếm trên một phạm vi
rộng lớn, các kết quả tìm kiếm được xếp hạng và có gợi ý các tài liệu liên
quan, và kết quả được trình bày trong một giao diện trực quan đúng như mong
đợi của người tìm kiếm thông tin. Mỗi hệ thống sẽ bao gồm ba thành tố cơ
bản: nội dung thông tin, giao diện trình bày và các chức năng liên quan đến
tìm kiếm, thu thập và phân phối thông tin.
Hình 2: Giao điện kết quả tìm kiếm của Đại học Victoria sử dụng hệ thống
Summon của ProQuest
Một trong những ưu điểm của giải pháp tìm kiếm tập trung WSD là không chỉ
22/12/2015 Khoa Thông tin - Thư viện | Web scale discovery – giải pháp tìm kiếm và khai thác thông tin cho các thư viện trong kỷ nguyên số
data:text/html;charset=utf-8,%3Cdiv%20class%3D%22page-title%20content-left%22%20style%3D%22padding%3A%200px%3B%20margin%3A%200px%3B 5/14
cung cấp giải pháp về công nghệ tìm kiếm, mà các nhà cung cấp này còn giúp
các thư viện đàm phán với các nhà cung cấp dữ liệu trực tuyến để bạn đọc
của các thư viện có tìm kiếm và khai thác CSDL của các nhà cung cấp dữ liệu,
các nhà xuất bản hay các tạp chí danh tiếng. Tức là tiến tới những thỏa thuận
về hợp tác và chia sẽ dữ liệu. Đây chính là điều tạo nên sự khác biệt của tìm
kiếm tập trung. Có thể nói thỏa thuận giữa nhà cung cấp dịch vụ tìm kiếm
thông tin và các nhà cung cấp thông tin đóng vai trò quan trọng trong giải
pháp tìm kiếm tập trung. Chính vì vậy tên của các giải pháp này thường có
thêm từ “services” – dịch vụ (Web Scale Discovery Services) để chỉ rằng đây
không chỉ là giải pháp về công nghệ mà bao hàm cung cấp các dịch vụ kèm
theo [3]. Điều này cũng lý giải tại sao hệ thống WSD thường có giá rất đắt và
phải mua bản quyền theo khoảng thời gian nhất định.
2.1. Cấu trúc của WSD
Một hệ thống WSD bao gồm các thành phần sau: nguồn thông tin (nguồn
thông tin nội bộ do thư viện quản lý và nguồn từ xa đó: học liệu mở và nguồn
thông tin thư viện mua từ các nhà xuất bản hay nhà cung cấp thông tin chuyên
nghiệp), hệ thống đánh chỉ mục tập trung, lớp khai thác và người dùng/người
tìm kiếm thông tin. Các thành phần và mối liên hệ trong một hệ thống WSD
được mô tả như Hình 3. Trong đó, xét về mặt công nghệ, có hai thành phần
quan trọng là lớp khai thác và hệ thống đánh chỉ mục tập trung. Hệ thống chỉ
mục tập trung được coi là nội dung, trong khi đó lớp khai thác sẽ là giao diện
để người dùng tương tác với nội dung.
22/12/2015 Khoa Thông tin - Thư viện | Web scale discovery – giải pháp tìm kiếm và khai thác thông tin cho các thư viện trong kỷ nguyên số
data:text/html;charset=utf-8,%3Cdiv%20class%3D%22page-title%20content-left%22%20style%3D%22padding%3A%200px%3B%20margin%3A%200px%3B 6/14
Hình 3: Cấu trúc một hệ thống WSD [10]
Lớp khai thác (Discovery layer – DL)
Lớp khai thác được định nghĩa là giao diện người dùng và hệ thống tìm
kiếm để khai thác, hiển thị kết quả và tương tác với nội dung thông tin với
người dùng. Lớp tương tác có mối liên hệ chặt chẽ với hệ thống đánh chỉ mục
tập trung. Về phía người dùng, lớp khai thác chính là giao diện tổng hợp mà ở
đó học được cung cấp các dịch vụ của WSD. DL được cấu trúc như là một
cổng thông tin – nơi giao tiếp giữa bạn đọc và thư viện. Thông qua cổng thông
tin này người dùng có thể khám phá và khai thác các nguồn tin mà thư viện
cung cấp. Lớp khai thác có những đặc tính sau:
Chức năng tìm kiếm duy nhất (single search) dựa trên nền tảng hệ thống chỉ
mục tập trung (central index). Với một ô tìm kiếm đơn giản và duy nhất người
dùng có thể tìm kiếm nhiều nguồn tài nguyên thông tin điện tử trong và ngoài 
thư viện. WSD có công cụ tìm kiếm thống minh và mạnh. Hệ thống hỗ trợ
người dùng tìm kiếm theo từ khóa, tác giả, nhan đề hay chủ đề với các toán tử
hỗ trợ, hay tìm theo cấu trúc cũng như kiểm tra chính tả và gợi ý đối với từ
hoặc cụm từ không chính xác được đưa vào tìm kiếm.
Thời gian phản hồi kết quả tìm kiếm nhanh. Đây là điều kiện tiên quyết đối với
22/12/2015 Khoa Thông tin - Thư viện | Web scale discovery – giải pháp tìm kiếm và khai thác thông tin cho các thư viện trong kỷ nguyên số
data:text/html;charset=utf-8,%3Cdiv%20class%3D%22page-title%20content-left%22%20style%3D%22padding%3A%200px%3B%20margin%3A%200px%3B 7/14
năng lực của các hệ thống WSD. Phản hồi kết quả tức thì là yêu cầu quan
trọng của một máy tìm kiếm.
Xếp hạng mức độ liên quan trong kết quả tìm. Đưa các kết quả có nội dung
gần nhất đối với yêu cầu tìm kiếm thông qua việc xếp hạng thông minh các kết
quả tìm cũng như gợi ý các tài liệu liên quan đến yêu cầu của người tìm. Ví dụ
“người dùng đọc tài liệu này thường cũng hay đọc những tài liệu xyz sau”
Có các công cụ để sắp xếp, thu hẹp, lọcdựa trên kết quả đã tìm kiếm được.
Người dùng có thể tinh chế yêu cầu tìm tin, thu hẹp kết quả tìm kiếm dựa trên
các tiêu chí về thời gian, loại hình, chủ đề của tài liệu.
Liên kết trực tiếp đến các nguồn dữ liệu số – đây có là thế mạnh của các dịch
vụ WSD. WSD không chỉ đưa ra các thông tin về tài liệu tìm được mà còn hỗ
trợ bạn đọc truy cập đến tài liệu toàn văn ngoài thư viện thông qua xác thực
định danh là người dùng của thư viện mà bạn đọc đang sử dụng dịch vụ.
Có khả năng tùy biến và cá nhân hóa cho người dùng đầu cuối. Mỗi người
dùng đều được cung cấp một tài khoản để xác nhận quyền truy cập cũng như
tùy biến các kết quả tìm của mình. Dựa trên nên Web 2.0 người dùng có thể tổ
chức thông tin, lưu trữ và kiết xuất kết quả tìm kiếm, cũng như đặt thẻ (tag),
xếp hạng hoặc chia sẻ để giới thiệu tài liệu tìm được. Các thư viện cũng có thể
gắn logo hoặc các thông tin về thư viện trên giao diện của dịch vụ WSD.
Hệ thống chỉ mục dữ liệu tập trung (Central index)
Hệ thống sẽ tiến hành đánh chỉ mục đối với toàn bộ nội dung mà thư viện cung
cấp đó có thể là từ nhà xuất bản gốc, nhà xuất bản cấp hai hay nhà tích hợp
nội dung và những thông tin nội sinh của thư viện. Có thể nói dịch vụ chỉ mục
dữ liệu tập trung chính là trái tim của hệ thống WSD. Nó tạo ra sự kết nối
người dùng với các nguồn tài nguyên thông tin. Hệ thống này thực chất là tạo
ra một CSDL tổ hợp hay một mục lục trung tâm chứa các biểu ghi của tất cả
nguồn tài nguyên mà thư viện quản lý cũng như những siêu liên kết đến kho
tài nguyên số trực tuyến. Hình 4 mô tả các nguồn thông tin được đánh chỉnh
mục tập trung trong hệ thống WSD.
Các nguồn thông tin bao gồm: nguồn trong thư viện, nguồn mở miễn phí trên
internet, nguồn của chính các nhà cung cấp dịch vụ WSD, nguồn từ các cung
cấp dữ liệu chuyên nghiệp và nguồn từ các nhà xuất bản.
22/12/2015 Khoa Thông tin - Thư viện | Web scale discovery – giải pháp tìm kiếm và khai thác thông tin cho các thư viện trong kỷ nguyên số
data:text/html;charset=utf-8,%3Cdiv%20class%3D%22page-title%20content-left%22%20style%3D%22padding%3A%200px%3B%20margin%3A%200px%3B 8/14
Hình 4. Mô hình đánh chỉ mục tập trung của WSD [6]
Đối với một hệ thống đánh chỉ mục tập trung thì độ lớn của CSDL đánh chỉ
mục không quan trọng bằng các yếu tố như phạm vi và độ sâu của nội dung
thông tin, loại hình tài liệu, tài liệu gốc toàn văn hay độ phong phú của siêu dữ
liệu. Một hệ chỉ mục hiệu quả là giúp các thư viện cung cấp thông tin phù hợp
với nhu cầu bạn đọc dựa trên những nội dung mà thư viện đang có. Hệ thống
phải hiểu được bạn đọc cần gì và đưa ra những gợi ý phù hợp. Chính vì thế
mà ở một khía cạnh nào đó WSD được coi là trí tuệ nhân tạo của năng lực
thông tin (information literacy).
Có hai khái niệm trong chỉ mục tập trung đó là đánh chỉ mục trước (pre-
harvested index) và đồng sở hữu nội dung thông tin (mutually licensed
content). Các siêu dữ liệu và tài liệu toàn văn được thu gom một cách hệ thống
và định kỳ và được xử lý trước để phục vụ cho việc tìm kiếm thông tin sau này.
Dữ liệu được thu thập từ nhiều nguồn khác nhau và được đưa vào hệ thống
chỉ mục tập trung để xử lý. Đối với nguồn thông tin có bản quyền (của thư viện
và các nhà cung cấp WSD) thì người dùng sau tìm kiếm và phải xác thực định
danh để truy cập đến tài liệu toàn văn.
Truy cập một lần – Single sign on
Dịch vụ đăng nhập một lần – single sign on (SSO) là một tính năng giúp bạn
đọc thuận tiện hơn khi sử dụng các dịch vụ thư viện. Bạn đọc có tài khoản của
thư viện chỉ cần đăng nhập một lần có thể sử dụng nhiều dịch vụ khác nhau
của thư viện. Thông thường các dịch vụ trong thư viện được thực hiện bởi
nhiều ứng dụng từ nhiều nhà cung cấp giải pháp khác nhau. Khi bạn đọc truy
22/12/2015 Khoa Thông tin - Thư viện | Web scale discovery – giải pháp tìm kiếm và khai thác thông tin cho các thư viện trong kỷ nguyên số
data:text/html;charset=utf-8,%3Cdiv%20class%3D%22page-title%20content-left%22%20style%3D%22padding%3A%200px%3B%20margin%3A%200px%3B 9/14
cập đến các dịch vụ hay tài nguyên thông tin do thư viện cung cấp thường
phải xác thực quyền truy cập vào hệ thống. Nếu không có sự thống nhất trong
thiết kế hệ thống, bạn đọc phải đăng nhập nhiều lần khi sử dụng các dịch vụ
khác nhau trong thư viện. Ví dụ, người dùng phải đăng nhập để biết thông tin
về mượn trả hay gia hạn mượn tài liệu. Khi khai thác CSDL số trong thư viện
người dùng lại phải đăng nhập lần nữa để xác thực định danh, việc này cũng
sẽ diễn ra tương tự nếu người dùng khai thác nguồn thông tin trực tuyến mà
thư viện mua bản quyền truy cập. Điều này sẽ gây phiền toái cho bạn đọc.
SSO giúp bạn đọc xác thực quyền của mình đối với toàn bộ dịch vụ mà thư
viện cung cấp với một lần đăng nhập duy nhất. Ngoài việc giúp bạn đọc tiện lợi
trong sử dụng dịch vụ của thư viện, SSO còn giúp các thư viện tăng cường
tính bảo mật của hệ thống và dễ dàng trong việc quản trị cũng như giảm chi
phí trong quản lý.
Hình 5: Sơ đồ mô tả đăng nhập trước và sau khi áp dụng SSO [2]
2.3. Một số nhà cung cấp dịch vụ WSD trên thế giới
SSO kết hợp với WSD là một phải pháp tổng thể trong quản trị thư viện trong
thời đại số và internet. Mục tiêu là mang đến cho người dùng sự dễ dàng và
thuận tiện trong việc tiếp cận các dịch vụ của thư viện. Bên cạnh đó giải pháp
này giúp các thư viện quản trị hệ thống của mình đễ dàng hơn và nâng cao
năng lực cung cấp thông tin của thư viện.
WSD là dịch vụ mới so với lịch sử ứng dụng công nghệ thông tin trong lĩnh vực
22/12/2015 Khoa Thông tin - Thư viện | Web scale discovery – giải pháp tìm kiếm và khai thác thông tin cho các thư viện trong kỷ nguyên số
data:text/html;charset=utf-8,%3Cdiv%20class%3D%22page-title%20content-left%22%20style%3D%22padding%3A%200px%3B%20margin%3A%200px%3B 10/14
thư viện. Tuy nhiên dịch vụ này đang được rất nhiều thư viện quan tâm. Hiện
nay trên thế giới có một số dịch vụ WSD nối tiếng có thể kể đến như Summon
(của ProQuest), Primo (của Ex Libris), EBSCO Discovery Service (của EBSCO)
và WorldCat Discovery Services (của OCLC). Có thể thấy rằng những tên tuổi
này đều là những nhà cung cấp thông tin và giải pháp công nghệ chuyên
nghiệp. Các nhà cung cấp này có sự cạnh tranh thị phần với nhau tuy nhiên
trong một số trường hợp họ phải hợp tác với nhau vì có những thư viện sử
dụng nguồn dữ liệu từ nhiều nhà cung cấp (7).
Dịch vụ Summon của ProQuest hiện có hơn 500 thư viện trên thế giới sử
dụng, khách hàng tiểu biểu của dịch vụ này là Đại học Harvard và Đại học
Victoria, New Zealand [9]. ProQuest là một nhà cung cấp CSDL toàn văn về
nhiều lĩnh vực khoa học, ngoài ra còn cung cấp các giải pháp, ứng dụng và
các sản phẩm cho thư viện. Trong đó Summon là một giải pháp tìm kiếm tập
trung nổi bật. Summon là một giải pháp công nghệ mới, dễ sử dụng với tiêu chí
chỉ cần một cổng tìm kiếm duy nhất có thể truy cập đến tất cả các CSDL phân
tán những như các CSDL đơn lẻ trực tuyến khác. Mục tiêu của Summon là
giúp các thư viện tạo lập một môi trường học thuật trong đó hỗ trợ bạn đọc
của thư viện với tới các nguồn thông tin mà họ cần thông qua một cổng thông
tin duy nhất của thư viện [1].
Ex Libris là nhà cung cấp các giải pháp tự động hóa cho thư viện. Ex Libris tập
trung vào xây dựng giải pháp tổng thể cho thư viện bao gồm khai thác, quản trị
và phân phối các nguồn tài liệu trong thư viện kể cả tài liệu in ấn và tài liệu số.
Dịch vụ Primo của Ex Libris đang được trên hơn 2100 thư viện sử dụng. Đây là
một trong những dịch vụ WSD phổ biến nhất hiện nay. Primo giúp người dùng
khám phá tri thức từ nhiều nguồn khác nhau và chuyển giao trực tiếp đến
người dùng. Dịch vụ này giúp người dùng cá nhân hóa phương thức tìm kiếm,
đánh giá và sắp xếp kết quả tìm kiếm và chia sẻ lên mạng xã hội. Cũng như
các dịch vụ WSD khác, đánh chỉ mục tập trung là chính là điểm mạnh của
Primo trong việc giúp người dùng tìm kiếm thông tin trong các CSDL phân tán
[5].
EBSCO Discovery Service (EDS) là một dịch vụ WSD của EBSCO – nhà cung
cấp dữ liệu và giải pháp tự động hóa cho thư viện. Với triết lý hướng tới sự tiện
lợi và đơn giản hóa việc tìm kiếm thông tin cho người dùng, EDS cung cấp
công cụ tìm kiếm đa nguồn (OPACs, tạp chí điện tử, sách điện tử và các CSDL
toàn văn) trong một cửa sổ tìm kiếm duy nhất, có khả năng phân loại và sắp
xếp kết quả tìm kiếm theo mức độ ưu tiên (streamlined search) và trình bày
22/12/2015 Khoa Thông tin - Thư viện | Web scale discovery – giải pháp tìm kiếm và khai thác thông tin cho các thư viện trong kỷ nguyên số
data:text/html;charset=utf-8,%3Cdiv%20class%3D%22page-title%20content-left%22%20style%3D%22padding%3A%200px%3B%20margin%3A%200px%3B 11/14
trên một giao diện thân thiện và đồng nhất. EBSCO phối hợp với các nhà cung
cấp thông tin để tích hợp vào dịch vụ EDS nhằm mục tiêu hỗ trợ người dùng
tìm kiếm, truy cập những thông tin có chất lượng tốt nhất, phục vụ hiệu quả
cho công việc của mình [4].
OCLC (Trung tâm thư viện máy tính trực tuyến) cung cấp dịch vụ WorldCat
discovery services với khả năng tìm kiếm và truy cập đến 1.8 tỷ tài liệu của
74.000 thư viện trên thế giới. Đây có thể coi là một ứng dụng điện toán đám
mây (cloud-based application). Ngoài khả năng cung cấp truy cập đến nguồn
tài liệu số trực tuyến, dịch vụ này còn hỗ trợ mượn liên thư viện đối với các tài
liệu in ấn. Đúng như tên gọi của dịch vụ, WorldCat Local kết nối người dùng
chặt chẽ với chính thư viện của họ, tạo ra một kênh chuyển giao thông tin dựa
trên những dịch vụ mà thư viện cung cấp, đơn giản hóa dịch vụ mượn tài liệu
của thư viện. Cũng như các dịch vụ WSD khác, người dùng được trải nghiệm
việc tìm kiếm thông tin thông qua một hộp tìm kiếm duy nhất và kết quả được
phân loại, sắp xếp và đồng bộ hóa theo nhu cầu của người dùng [8].
Mỗi dịch vụ đều có những thế mạnh riêng của mình và không có dịch vụ nào là
tối ưu cho từng thư viện cụ thể. Việc áp dụng các dịch vụ này phụ thuộc vào
quy mô, đối tượng phục vụ và tiềm lực tài chính của mỗi thư viện.
Ngoài các dịch vụ tìm kiếm có bản quyền, hiện nay cũng có rất nhiều các giải
pháp mã nguồn mở WSD dành cho thư viện. Có thể kể đến như Blacklight,
Fac‐Back‐OPAC, LibraryFind, Rapi, Scriblio, SOPAC và VuFind. Các giải pháp
mã nguồn mở cũng tiếp cận phương pháp tìm kiếm tương tự như WSD bản
thương mại. Điểm khác nhau giữa giải pháp mã nguồn và WSD thương mại là
các nhà cung cấp giải pháp thương mại thường cung cấp gói thông tin đi kèm
(có sự thỏa thuận đối với nhà cung cấp thông tin), trong khi đó nếu thư viện
quyết định sử dụng mã nguồn mở, họ phải tùy biến mã nguồn này và xây dựng
thỏa thuận với các nhà cung cấp dịch vụ thông tin.
3. Giải pháp cho các thư viện Việt Nam
3.1. Mua các giải pháp WSD từ nước ngoài
Giải pháp nhanh nhất cho các thư viện đại học Việt Nam đó là mua dịch vụ
WSD của nước ngoài. Với kinh nghiệm triển khai lâu năm, tối ưu về mặt công
nghệ và khả năng kết nối, có mối liên hệ rộng với các nhà cung cấp thông tin
chuyên nghiệp, các giải pháp nước ngoài hiệu quả hơn về mặt tìm kiếm và mở
rộng truy cập đến các nguồn tin chất lượng. Đối với các thư viện có tiềm lực thì
đây là lựa chọn tối ưu.
22/12/2015 Khoa Thông tin - Thư viện | Web scale discovery – giải pháp tìm kiếm và khai thác thông tin cho các thư viện trong kỷ nguyên số
data:text/html;charset=utf-8,%3Cdiv%20class%3D%22page-title%20content-left%22%20style%3D%22padding%3A%200px%3B%20margin%3A%200px%3B 12/14
Tuy nhiên, khó khăn của phần lớn của các thư viện đại học Việt Nam là kinh
phí hoạt động hàng năm hạn chế. Do vậy đầu tư một hệ thống WSD từ nước
ngoài là thực sự ngoài tầm với khả năng của các thư viện. Với việc phải mua
bản quyền theo năm, các dịch vụ này đòi hỏi các thư viện cần có tiềm lực tài
chính mạnh để duy trì.
Một số chú ý khi quyết định đầu tư một hệ thống WSD đó cần xem xét các tính
năng của đánh chỉ mục tập trung và lớp khai thác. Công cụ đánh chỉ mục tập
trung có giúp đưa ra toàn bộ những nguồn thông tin mà thư viện đang nắm giữ
không? Các kết quả tìm kiếm có được xếp hạng và phù hợp với yêu cầu người
dùng không? Hệ thống có khả năng tìm kiếm được các CSDL của các nhà
cung cấp mà thư viện mua bản quyền không? Hệ thống có cung cấp khả năng
tìm kiếm toàn văn cho các bài báo tạp chí không? Hệ thống có các mức tìm
kiếm cơ bản hoặc nâng cao hay không, có hạn chế người dùng tìm kiếm nội
dung mà họ mong muốn? Giao diện người dùng có thân thiện, dễ sử dụng và
điểu khiển được không? Người dùng có khả năng nâng cao hiệu quả tìm kiếm
thông qua các tiêu chí và các gợi ý của hệ thống? Những câu hỏi này cần
được trả lời “có” mới có thể xem xét đầu tư một hệ thống WSD.
3.2. Tự phát triển WSD trong nước
Câu hỏi đặt ra là các công ty công nghệ và các thư viện Việt Nam có thể phát
triển được hệ thống WSD được không? Câu trả lời là có. Về mặt công nghệ,
xây dựng hệ thống tìm kiếm WSD là hoàn toàn khả thi đối với năng lực hiện tại
của các công ty công nghệ. Một số công ty đã bắt tay vào phát triển hệ thống
tìm kiếm tập trung và đang chạy thử nghiệm và cho kết quả bước đầu. Ngoài
việc tự phát triển công nghệ này, các công ty hay thư viện hoàn toàn có thể sử
dụng mã nguồn mở để phát triển thêm hoặc tùy biến theo nhu cầu thực tế.
Vấn đề còn lại là ở chính các thư viện. Đó chính là sự mong muốn áp dụng
cũng như thỏa thuận hợp tác trong việc chia sẻ nguồn thông tin. Đối với các
nguồn tin phân tán trong nội bộ một thư viện (local resources), việc áp dụng
WSD là dễ dàng và khả thi. Tuy nhiên đối với nguồn tin từ xa (remote
resources) thì việc tìm kiếm và khai thác là một trở ngại lớn. Để hệ thống tìm
kiếm tập trung đạt hiệu quả thì nhất thiết phải có sự hợp tác giữa các thư viện.
Đó là sự thỏa thuận trọng việc cho phép các máy tìm kiếm có thể truy cập và
tìm kiếm trong các CSDL. Cao hơn nữa đó là thỏa thuận trong việc truy cập
các nguồn tài nguyên số. Nếu mới chỉ dừng ở bước tìm kiếm, mà chưa thể lấy
được tài liệu về sử dụng thì không phải là một hệ thống WSD hoàn chỉnh. Điều
này lại phụ thuộc và sự thỏa thuận giữa các thư viện với nhau.
22/12/2015 Khoa Thông tin - Thư viện | Web scale discovery – giải pháp tìm kiếm và khai thác thông tin cho các thư viện trong kỷ nguyên số
data:text/html;charset=utf-8,%3Cdiv%20class%3D%22page-title%20content-left%22%20style%3D%22padding%3A%200px%3B%20margin%3A%200px%3B 13/14
Một trở ngại của các giải pháp WSD phát triển trong nước đó là khả năng khai
thác các nguồn thông tin có bản quyền từ các nhà cung cấp thông tin chuyên
nghiệp trên thế giới. Thường thì các nhà cung cấp dịch vụ WSD đều cạnh
tranh nhau. Do vậy để hợp tác với họ là khó vì họ vừa đóng vai trò là nhà cung
cấp thông tin cũng như giải pháp WSD. Đối với một số thư viện có khả năng
mua được các CSDL trực tuyến, một trong những thỏa thuận quan trọng là
cho phép WSD có thể tìm kiếm được thông tin trong CSDL mà thư viện mua
bản quyền.
4. Kết luận
Với sự gia tăng không ngừng của tài nguyên số và xu thế khai thác thông tin 
trực tuyến đã và đang đặt ra cho các thư viện một bài toán khó đó là hỗ trợ
người dùng tìm kiếm thông tin nhanh, dễ dàng và hiệu quả trong một khối
lượng thông tin khổng lồ. Sẽ không còn có cán bộ thư viện túc trực hỗ trợ bạn
đọc trong tìm kiếm như khi bạn đọc đến trực tiếp thư viện, thay vào đó bạn đọc
phải tự khai thác thông tin. Điều này phải nảy sinh nhu cầu là cần có một hệ
thống tìm kiếm đủ thông minh để biết bạn đọc cần gì và tìm kiếm thông tin ở
đâu. WSD ra đời với kỳ vọng đáp ứng được nhu cầu này. WSD là một dịch vụ
đòi hỏi cao về công nghệ, chi phí và nhân nhân lực. Do vậy các thư viện cần
có sự chuẩn bị cho các yếu tố này để sẵn sàng xây dựng và triển khai dịch vụ
WSD. Việc hợp tác giữa các thư viện để xây dựng dịch vụ WSD là một điều
kiện tiên quyết tối quan trọng trong chiến lược phát triển chung của hệ thống
thư viện đại học.
Tài liệu tham khảo
1. Burke, J. (2010). Discovery versus Disintermediation: the new reality driven
by today’s end-user. Retrieved
from
2. Codeproject (2013). Basics of Single Sign on (SSO). Retrieved
from
SSO.
3. Diamond, T.; Price, S. and Chandrasekar, R. (2013). Actions Speak Louder
than Words: Analyzing large-scale query logs to improve the research
experience. Code4Lib Journal. Retrieved
from
4. Ebsco (2014). Ebsco discovery services. Retrieved
from
5. Exlibris (2014). Primo – Empowering libraries to address user deeds.
22/12/2015 Khoa Thông tin - Thư viện | Web scale discovery – giải pháp tìm kiếm và khai thác thông tin cho các thư viện trong kỷ nguyên số
data:text/html;charset=utf-8,%3Cdiv%20class%3D%22page-title%20content-left%22%20style%3D%22padding%3A%200px%3B%20margin%3A%200px%3B 14/14
Retrieved from 
6. Hoeppner, A. (2012). The ins and outs of evaluating web-scale discovery
services. Computers in Libraries, 3(32), pp. 6-11.
7. OCABD – Orbis Cascade Alliance Board of Directors (2014). Alliance Board
letter to EBSCO and Ex Libris. Retrieved
fromhttps://www.orbiscascade.org/file_viewer.php?id=2205
8. Oclc (2014). WorldCat Local. Retrieved from 
local.en.html.
9. ProQuest (2014). Discovery Services. Retrieved
from
10. Thompson, J. (2014). Implementing web-scale discovery services: A
practical guide for librarians. London: Rowman & Littlefield Publishers
11. Vaughan, J. (2011). Investigations into library web scale discovery
services. Information Technology and Libraries. Retrieved
from

File đính kèm:

  • pdfweb_scale_discovery_giai_phap_tim_kiem_va_khai_thac_thong_ti.pdf