Giải pháp xây dựng các bộ sưu tập tài liệu số
Thư viện điện tử và Thư viện số là những khái niệm đang còn rất mới ở Việt Nam và cũng tồn tại nhiều cách hiểu và định nghĩa khác nhau.
Thư viện điện tử và Thư viện số là những khái niệm đang còn rất mới ở Việt Nam và cũng tồn tại nhiều cách hiểu và định nghĩa khác nhau: Thư viện điện tử: Khái niệm về thư viện điện tử được định nghĩa như sau: “Một hệ thống thông tin trong đó các nguồn thông tin đều có sẵn dưới dạng có thể xử lý được bằng máy tính và trong đó tất cả các chức năng bổ sung, lưu trữ, bảo quản, tìm kiếm, truy cập và hiển thị đều sử dụng kỹ thuật số”.
Sự xuất hiện khái niệm này có liên quan trực tiếp tới sự bùng nổ Internet và Web mang lại. Khái niệm này đang được các chuyên gia công nghệ thông tin sử dụng để chỉ toàn bộ hệ thống dạng này, bất kể có dựa trên một thư viện truyền thống hay không. Môi trường kỹ thuật Internet hiện nay thậm chí cho phép một số người coi toàn thể nguồn thông tin của mạng một lúc nào đó như một thư viện số ảo toàn cầu mà độc giả là toàn thể những người sử dụng mạng trên hành tinh và các công cụ tìm tin và sự hiện diện của Web bảo đảm các chức năng thư mục cho thư viện đó.
Có thể hiểu theo nghĩa tổng quát là một loại hình thư viện đã tin học hóa toàn bộ hoặc một số dịch vụ thư viện. Là nơi người sử dụng có thể tới để tra cứu, sử dụng các dịch vụ thường làm như với một thư viện truyền thống nhưng đã được tin học hóa. Nguồn lực của Thư viện điện tử bao gồm cả tài liệu in giấy và tài liệu đã được số hóa. Có thể hiểu theo nghĩa tổng quát là một loại hình thư viện đã tin học hóa toàn bộ hoặc một số dịch vụ thư viện. Là nơi người sử dụng có thể tới để tra cứu, sử dụng các dịch vụ thường làm như với một thư viện truyền thống nhưng đã được tin học hóa.
1.THƯ VIỆN SỐ:
Thư viện số là một Thư viện điện tử cao cấp trong đó toàn bộ các tài liệu của thư viện đã được số hóa và được quản lý bằng một phần mềm chuyên nghiệp có tổ chức giúp người dùng dễ dàng truy cập, tìm kiếm và xem được nội dung toàn văn của chúng từ xa thông qua hệ thống mạng thông tin và các phương tiện truyền thông.
Một Thư viện số hoàn chỉnh phải thực hiện được tất cả các dịch vụ cơ bản của thư viện truyền thống kết hợp với việc ứng dụng các lợi thế của công nghệ thông tin trong việc lưu trữ, tìm kiếm và phổ biến nội dung thông tin.
Thư viện số là cơ hội đặc biệt cho thư viện truyền thống đổi mới phương thức phục vụ cho người dùng tin, đảm bảo hiệu quả, chất lượng cho đối tượng phục vụ. Quá trình tin học hoá này được thực hiện hầu như không tách rời với các truyền thống và các chuẩn đã định về mô tả và các công cụ thư mục, được thực hiện nhờ các mô tả theo chuẩn quốc tế (ISBD, AACR2) đã tiêu chuẩn hoá việc phân vùng các phiếu mục lục chuẩn bị chuyển thành khuôn khổ trao đổi các biểu ghi dạng số. Vấn đề đặt ra các công cụ tin học phải đáp ứng được các nhu cầu xử lý đặc biệt có liên quan đến vấn đề đa ngôn ngữ và đa chữ viết của các loại hình tài liệu. Các nhà công nghệ thông tin đã phát triển ứng dụng tin học riêng với trình độ của các nước Bắc Mỹ, sau đó là trình độ quốc tế, kèm theo thiết bị chuẩn riêng biệt nhằm mục đích cho phép kết nối các ứng dụng này với nhau cũng như việc trao đổi chung các dữ liệu thư mục trên bình diện thế giới. Người ta đã áp dụng các chuẩn quốc tế về khổ mẫu và trao đổi dữ liệu, về mã hoá các ký tự cho các hệ thống các chữ viết khác nhau, về giao thức kết nối mục lục trực tuyến hoặc các hệ thống cung cấp tư liệu từ xa vào qui trình xử lý và khai thác thông tin.
Khái niệm Thư viện số không chỉ tương đương với bộ sưu tập số, đó là một môi trường tập hợp các bộ sưu tập số theo chủ đề. Nguồn thông tin của thư viện số có thể nằm ngay trong thư viện và có thể cả bên ngoài thư viện (ví dụ: CSDL toàn văn mua quyền truy cập theo thời gian).
Khái niệm về bộ sưu tập số: Bộ sưu tập số là một tập hợp có tổ chức nhiều tài liệu đã được số hoá dưới nhiều hình thức khác nhau (văn bản, hình ảnh, audio, video…) về một chủ đề. Mặc dù mỗi loại hình tài liệu có sự khác nhau về cách thể hiện, nhưng nó đều cung cấp một giao diện đồng nhất mà qua đó các tài liệu có thể truy cập, tìm kiếm dễ dàng.
Ví dụ: bộ sưu tập số về Chủ tịch Hồ Chí Minh gồm các văn bản, các tác phẩm văn học, các văn kiện chính trị do Bác viết và do người khác viết về Bác; Những bài hát, bản nhạc viết về Hồ Chí Minh; những đoạn phim, những băng video phản ánh cuộc đời và sự nghiệp hoạt động cách mạng của Người.
Như vậy, một Thư viện số có thể bao gồm nhiều bộ sưu tập theo các chủ đề khác nhau, có thể do tập thể hoặc cá nhân tự xây dựng hoặc trao đổi, mua bán. Có thể nằm trong lưu trữ của thư viện nhưng cũng có thể nằm ngoài thư viện thông qua một kênh cung cấp từ phía đối tác.
Sự có mặt của các nguồn tin số hoá mở đầu một chiều hướng mới trong việc quản lý các thư viện được tin học hoá, bởi vì cũng cần đảm bảo việc quản lý bản thân các nguồn số hoá gắn liền với sự thông báo trong mục lục truyền thống. Như vậy các thư viện số đã bổ sung vào hệ thống quản lý thư viện tích hợp một hệ thống quản lý các nguồn số hoá trong quá trình xây dựng các sưu tập thông tin. Sự hiện diện đồng thời dưới dạng số của một nguồn lực và hình thức mô tả nguồn đó tác động đến sự tiến triển của các khổ mẫu dữ liệu.
Trong điều kiện về kinh phí, nhân lực và cơ sở hạ tầng nói chung của các thư viện đại học hiện nay thì việc đặt ra mục tiêu trước mắt để xây dựng một Thư viện số là chưa có tính khả thi. Nhưng với mục tiêu xây dựng các bộ sưu tập số thì các thư viện hoàn toàn có thể thực hiện được.
2. Ý NGHĨA CỦA BỘ SƯU TẬP SỐ
Một trong những nhiệm vụ ưu tiên hàng đầu trong kế hoạch chiến lược phát triển của một trường đại học, đó là việc tăng cường mở rộng ứng dụng công nghệ thông tin phục vụ thiết thực và hiệu quả cho công tác quản lý, công tác đào tạo, nghiên cứu hướng tới mục tiêu trở thành trường đại học tiên tiến đạt chuẩn trong khu vực và trên thế giới.
Chất lượng đào tạo và nghiên cứu khoa học của nhà trường là tiêu chí quan trọng để đánh giá mức độ hoàn thành các mục tiêu mà nhà trường đề ra trong Kế hoạch chiến lược phát triển. Để nâng cao chất lượng đào tạo và nghiên cứu khoa học; Trước hết phải tập trung nâng cao năng lực nghiên cứu và giảng dạy của đội ngũ giảng viên, tạo cho giảng viên có nhiều thời gian hơn dành cho nghiên cứu khoa học, nắm bắt những vấn đề mới, sát với thực tiễn khoa học công nghệ cũng như kinh tế, xã hội đất nước; Tăng cường và khuyến khích giảng viên trẻ nâng cao trình độ; Hệ thống giáo trình, bài giảng phải từng bước được cập nhật và biên soạn mới để đảm bảo nội dung chất lượng, phải được thiết kế trên cơ sở áp dụng được những công nghệ hiện đại trong đào tạo - Hệ thống công nghệ thông tin và dịch vụ thông tin - thư viện nhà trường. Việt Nam gia nhập WTO vào ngày 07/11/2006 - Chúng ta bắt đầu hội nhập toàn diện với quốc tế, thực hiện hàng loạt các cam kết cắt giảm hàng rào thuế quan và phi thuế quan, giảm bảo trợ trong nước, mở cửa thị trường.... Trong giáo dục và đào tạo đến năm 2009, Nhà nước cho các cơ sở đào tạo nước ngoài đầu tư 100% vốn vào Việt Nam làm tăng tính cạnh tranh đối với các cơ sở giáo dục đại học của Việt Nam. Do đó yêu cầu các cơ sở đào tạo cần phải đổi mới phương thức đào tạo, nâng cao chất lượng, từng bước hội nhập với quốc tế, tạo sự cạnh tranh với các đối tác nước ngoài thì mới tồn tại và phát triển.
Xuất phát từ những yêu cầu nêu trên, công tác Thông tin - Thư viện ở các trường đại học phải có sự đổi mới mạnh mẽ và phải đi trước một bước mới đáp ứng được yêu cầu phục vụ thông tin - tri thức cho nâng cao chất lượng đào tạo của nhà trường. Giải pháp xây dựng các bộ sưu tập số trong các thư viện đại học là một bước đi cần thiết để góp phần giải quyết các vấn đề về đổi mới và nâng cao năng lực, chất lượng đào tạo của nhà trường. Bởi lẽ bộ sưu tập số có những đặc tính nổi trội mà dịch vụ thư viện truyền thống chưa có như:
- Bộ sưu tập số tạo ra một môi trường và cơ hội bình đẳng rộng mở cho tất cả mọi người đều có cơ hội sử dụng nguồn tài liệu học tập bởi sưu tập số không bị giới hạn về không gian và thời gian. Loại bỏ khoảng cách tri thức giữa người giàu và người nghèo, giữa thành thị và nông thôn, giữa các quốc gia.
- Tính linh hoạt và khả năng đáp ứng của tài liệu số trong đào tạo thể hiện ở chỗ một bản tài liệu số có thể cùng lúc phục vụ cho nhiều đối tượng khác nhau, không phụ thuộc vào số lượng người dùng, thời gian và vị trí địa lý của người học.
- Tình hiệu quả của bộ sưu tập số là tiết kiệm thời gian và kinh phí: thư viện đỡ tốn kinh phí xây dựng kho tàng, kinh phí bổ sung tài liệu, bảo quản và kinh phí trả lương cho người phục vụ. Hơn hết là giúp cho người dùng tin được dễ dàng thuận tiện, tiết kiệm được thời gian, tiền bạc trong việc tìm thông tin.
- Bộ sưu tập số kết hợp với phương thức thư viện truyền thống sẽ phục vụ có hiệu quả hơn cho việc đổi mới và nâng cao chất lượng đào tạo, đặc biệt là đào tạo theo tín chỉ, đào tạo trực tuyến của nhà trường. Giúp cho người học chủ động trong việc sắp xếp thời gian học tập, họ không phải đến thư viện cũng có thể lấy được tài liệu qua hệ thống mạng thông tin ở mọi lúc, mọi nơi.
- Trong điều kiện còn thiếu nguồn tài liệu tham khảo học tập in giấy, thì việc có thêm giải pháp tài liệu số hóa sẽ giúp cho người học có thêm nhiều lựa chọn để phục vụ cho kế hoạch học tập của cá nhân.
- Bộ sưu tập số góp phần giải phóng kiến thức, mở rộng đối tượng phục vụ: Phạm vi phục vụ các tài liệu của thư viện không bị bó hẹp trong khuôn viên của nhà trường mà nó vươn tới các vị trí địa lý khác.
- Bộ sưu tập số là lựa chọn tối ưu để bảo tồn được lâu dài các tài liệu quý hiếm, ngăn chặn những rủi ro hủy hoại do thời gian, thiên tai, khí hậu và tần suất sử dụng.
3. GIẢI PHÁP XÂY DỰNG BỘ SƯU TẬP TÀI LIỆU SỐ
Quy trình để xây dựng một bộ sưu tập số bao gồm:
- Lựa chọn tài liệu đầu vào;
- Lựa chọn công nghệ thực hiện;
- Số hóa nguồn tài liệu;
- Tạo siêu dữ liệu liên kết;
- Vận hành, bảo quản và cung cấp dữ liệu;
- Xuất, nhập dữ liệu từ bên ngoài để trao đổi.
3.1 Lựa chọn tài liệu đầu vào
Trước khi thực hiện số hóa nguồn tài liệu, chúng ta phải đưa ra các tiêu chí để làm căn cứ lựa chọn những tài liệu nào cần thiết đưa vào bộ sưu tập. Có những tiêu chí mà chúng ta phải quan tâm như sau:
- Tiêu chí tình trạng bản quyền của tài liệu: Vấn đề bản quyền thực sự đang là rào cản làm nhụt chí những người có tâm huyết với công việc số hoá tài liệu thư viện. Sở dĩ như vậy là vì chúng ta chưa thực sự nắm vững những quy định cụ thể của Luật bản quyền (Luật Sở hữu trí tuệ). Các cơ quan chức năng nhà nước cũng chưa có những văn bản dưới luật để hướng dẫn thi hành.
Theo Luật Sở hữu trí tuệ của Việt Nam ban hành năm 2005 thì tại điều 25 khoản (a) và (đ) có quy định: những trường hợp sử dụng tác phẩm đã công bố không phải xin phép, không phải trả tiền nhuận bút, thù lao, cụ thể như sau:
a) Tự sao chép một bản nhằm mục đích nghiên cứu khoa học, giảng dạy cá nhân;
đ) Sao chép tác phẩm để lưu trữ trong thư viện với mục đích nghiên cứu;
Khái niệm về phạm vi không gian khuôn viên thư viện hiện nay cũng cần phải xem xét lại: đối với một thư viện truyền thống thì phạm vi khuôn viên thư viện là một không gian nằm trong hàng rào của trụ sở thư viện. Nhưng với một thư viện số thì khuôn viên thư viện không phải như vậy mà là phạm vi những bạn đọc được thư viện cho phép truy cập sử dụng tài liệu dưới sự giám sát bằng một công cụ tin học cho dù người đó sử dụng từ bên ngoài thư viện. Với khái niệm này thì việc vận dụng Luật Sở hữu trí tuệ vào số hoá tài liệu thư viện sẽ dễ dàng hơn.
- Theo tiêu chí nhóm người dùng mà thư viện xác định mức độ ưu tiên phục vụ:
+ Cán bộ lãnh đạo;
+ Giảng viên, cán bộ nghiên cứu;
+ Cán bộ kỹ thuật;
+ Sinh viên;
+ Các đối tượng khác.
- Theo tiêu chí nội dung tài liệu: Trên cơ sở xác định nhóm người dùng mục tiêu mà thư viện lựa chọn các chủ đề tài liệu theo nội dung tài liệu phục vụ; tài liệu phục vụ phát triển giáo trình, bài giảng; tài liệu có tần suất sử dụng cao.
- Theo tiêu chí điều kiện bảo quản hiện tại: Tùy tình hình cụ thể của từng thư viện trong tình trạng điều kiện bảo quản kêt hợp với nội dung tài liệu mà quyết định lựa chọn tài liệu đưa vào. Ví dụ: ưu tiên cho các tài liệu in trên giấy giòn, dễ rách, có hóa chất bảo quản.
- Theo tiêu chí các loại tài liệu đặc biệt: Tài liệu độc bản, tài liệu quý hiếm, thời gian xuất bản (Luận án tiến sỹ, tài liệu cổ, tài liệu cẩm nang chuyên ngành)...
3.2 Lựa chọn công nghệ
Việc lựa chọn công nghệ để tiến hành thực hiện rất quan trọng bởi vì nó là công cụ đắc lực giúp ta thực hiện các công việc trong quy trình tạo lập và vận hành của bộ sưu tập số. Do đó công nghệ để thực hiện phái đáp ứng các yêu cầu:
- Là công cụ, môi trường để đảm bảo các tài liệu số hóa sau khi được tạo lập sẽ dễ dàng, thuận tiện cho người dùng tiếp cận;
- Có đủ độ tin cậy cho người quản trị và kỹ thuật viên trong quá trình tạo lập, bảo quản và cung cấp dữ liệu trong quá trình hoạt động của bộ sưu tập;
- Đáp ứng đầy đủ các yêu cầu về chuẩn nghiệp vụ thông tin - thư viện;
- Dễ dàng trao đổi dữ liệu với các chuẩn khác, có công cụ sao lưu an toàn dữ liệu.
Dựa theo các yêu cầu nêu trên, để bộ sưu tập số phát huy được hết tác dụng, thư viện khi thực hiện tạo lập bộ sưu tập số cần phải có cơ sở hạ tầng sau:
+ Phải có hệ thống mạng Intranet được kết nối Internet với đường truyền đủ đáp ứng cho số người dùng tối thiểu của thư viện (hiện nay hầu hết các trường đều đã xây dựng. Mạng LAN của thư viện là một nhánh của hệ thống Intranet của trường ).
+ Hệ thống máy chủ đủ mạnh để đáp ứng việc lưu trữ, bảo quản, cung cấp dữ liệu và quản lý người dùng và các phần mềm hệ thống có bản quyền.
+ Trang Web đăng tải và là cổng truy cập của người dùng vào bộ sưu tập.
+ Phần mềm quản lý tài liệu số:
Hiện nay cũng có nhiều phần mềm, trong đó có phần mềm nguồn mở Greenstone và một số phần mềm do các công ty và cá nhân xây dựng. Công ty Tinh Vân đã phát triển thêm một phân hệ quản lý tài liệu số trong hệ quản trị thư viện điện tử LIBOL phiên bản 6.0.
Phần mềm quản lý tài liệu số phải đáp ứng các yêu cầu như:
+ Tạo siêu dữ liệu: có 3 dạng siêu dữ liệu:
- Siêu dữ liệu mô tả: Mô tả các thông tin về tài liệu;
- Siêu dữ liệu cấu trúc: Mô tả các liên kết giữa các đối tượng thông tin liên quan của tài liệu như mục lục, chương, phần, trang sách, hình ảnh minh họa, phụ lục...giúp người dùng dễ dàng di chuyển đến các thành phần của tài liệu.
- Siêu dữ liệu quản trị: gồm tạo kích cỡ tập tin; Định dạng tài liệu (PDF); Đặc tính sử dụng và tình trạng của tài liệu.
+ Mô tả dữ liệu: (theo một trong các chuẩn siêu dữ liệu: MARC; Dublin core; MODS; METS, ISO 2709) trong đó chuẩn Dublin Core là dùng tương đối phổ biến vì có khả năng tùy biến cho các tiêu chuẩn khác với 16 trường biên mục.
+ Vận hành liên kết là tạo ra một giao diện tra cứu tích hợp cho người dùng trên nhiều bộ sưu tập cùng một lúc dựa trên các điểm truy cập nhất quán như: tác giả; nhan đề tài liệu, từ khóa; chủ đề; chỉ mục quốc gia...
+ Quản lý các nguồn dữ liệu truy cập được cho phép (phần này chưa có trong các phần mềm nguồn mở). Theo đó chỉ có các thành viên đã được đăng ký mới được quyền truy cập vào tài liệu (hoặc quản lý chế độ download của tài liệu).
+ Xuất - nhập dữ liệu để trao đổi với các hệ thống khác theo các chuẩn chung.
3.3. Số hoá nguồn tài liệu
Đây là công đoạn đòi hỏi đầu tư nhiều công sức, kinh phí nhưng lại là khâu dễ dàng thực hiện nhất. Bởi vì hiện nay công nghệ số hóa tài liệu đã tiến bộ rất nhiều. Nếu như trước đây, khi ta muốn số hóa một cuốn sách khoảng 2.000 trang thì phải mất hàng mấy ngày để quét từng trang sách. Nhưng hiện nay cũng với cuốn sách đó chỉ mất vài giờ đồng hồ là cho ra một sản phẩm tài liệu số đảm bảo chất lượng tốt, sắc nét, hình ảnh đẹp, giống 100% bản gốc và đặc biệt còn cho phép tự động tạo các siêu dữ liệu mô tả và siêu dữ liệu cấu trúc của tài liệu ở định dạng XML. Hiện nay ở Việt Nam đã có các thiết bị số hóa tài liệu của công nghệ KIRTAS APT 1200, công nghệ này cùng với thiết bị BookScan APT 1200 có thể giúp các thư viện có thể số hóa nguồn tài liệu với số lượng lớn, giá cả hợp lý và đảm bảo chất lượng, thiết bị nhận dạng quang học OCR. Đặc biệt là công nghệ KIRTAS APT 1200 có một phần mềm biên tập BookScan Editor cho phép tự động biên tập, tạo siêu dữ liệu theo yêu cầu; BookScan APT 1200 không làm hư hỏng tài liệu gốc do không phải tháo gáy tài liệu đối với tài liệu có độ dày trang khi thực hiện Scan.
Sự phát triển mạnh mẽ của khoa học và công nghệ cùng với xu thế hội nhập là những đòi hỏi và thách thức cho ngành Thông tin - Thư viện nói chung và cho thư viện đại học nói riêng cần phải có những đổi mới hoạt động, bắt kịp những tiến bộ của thời đại phục vụ đắc lực cho sự nghiệp CNH, HĐH đất nước. Chúng tôi thiết nghĩ giải pháp xây dựng các bộ sưu tập tài liệu số tại các thư viện đại học là một việc làm cần thiết, một động thái tích cực để đổi mới phương pháp phục vụ nhằm góp phần nâng cao chất lượng đào tạo và nghiên cứu trong trường đại học. Để làm được điều này, ngoài những nỗ lực của cán bộ thư viện tại các thư viện đại học, cũng cần phải có sự quan tâm chỉ đạo và có định hướng từ các cấp lãnh đạo của nhà trường, của các bộ, ngành liên quan.
Một tương lai với nhiều cơ hội đang chờ đón chúng ta.
PGS.TS. Hoàng Đức Liên, TVVC. Nguyễn Hữu Ty
Trung tâm Thông tin - Thư viện, Đại học Nông nghiệp I
Tài liệu tham khảo
1. TS. Nguyễn Huy Chương, ThS.Trần Mạnh Tuấn. Quan điểm xây dựng chiến lược và mục tiêu phát triển hoạt động TT-TV đại học Việt Nam giai đoạn 2006 –2010.
2. BA.MS. Nguyễn Minh Hiệp. Thư viện số với hệ thống nguồn mở. Bản tin thư viện công nghệ thông tin, 8-2006.
3. TS. Vũ Văn Sơn. Thư viện điện tử - phúc đáp và trích dẫn . Theo http://www.folis.info
4. Chỉ thị số 29/2001/CT-Bộ GD&ĐT về tăng cường giảng dạy, đào tạo ứng dụng công nghệ thông tin trong ngành giáo dục, giai đoạn 2001-2005 của Bộ GD & ĐT.
5. Luật Sở hữu trí tuệ số 50/2005/11 ngày 29/11/2005 của nước CHXHCNVN