eq is more important:数字图书馆前沿问题与图书馆信息技术部建设

来源:百度文库 编辑:中财网 时间:2024/05/08 03:57:40
数字图书馆前沿问题与图书馆信息技术部建设(讲义)
1 数字图书馆前沿问题
1.1 北京 DL高级研讨班概况
2006年8月14日-16日,“2006·北京 数字图书馆前沿问题(发展战略与实践)高级研讨班”在清华大学举行。该研讨班由清华大学图书馆、美国斯坦福大学图书馆和中国图书馆学会数字图书馆建设与研究专业委员会联合主办,中国学术期刊(光盘版)电子杂志社协办。来自全国78所高校图书馆和相关机构的200多位代表参加了本次研讨会。这是继“2004·深圳”、“2005·厦门”两届研讨会之后,海内外从事数字图书馆研究和建设的同仁们第三次相聚在一起,共同分享信息、交流经验,尤其就某些数字图书馆前沿问题进行广泛而深入地探讨。
1.2 三届数图高研班主题
(表)
1.3 北京DL研讨班专家报告综述
1.3.1 国内数字图书馆的发展概况
国家图书馆.数字图书馆管理处孙卫总工程师.《国家图书馆二期工程暨国家数字图书馆工程》;
中国科学院文献情报中心副主任、国际图联采访与藏书发展专业委员会孙坦研究员《E-science条件下的数字图书馆建设》,重点介绍了CSDL开放体系的基本设计原则、基本架构以及CSDL开放建设的进一步设想。
CALIS管理中心副主任、北京大学图书馆副馆长、教育部高等学校图书情报工作指导委员会副主任兼秘书长朱强教授介绍了CALIS的现状与进展以及CALIS通过验收的情况。
1.3.2 数字图书馆战略策划
阐述数字图书馆发展的战略趋势。
霍普金斯大学图书馆系统部主任王雪茅先生,《全球图书馆环境中的领导培养》,首先介绍了全球化、全球图书馆以及领导培养的理念,然后从多个方面剖析了所在高校数字化图书馆的五年战略规划,从理论与实践结合的角度阐述了领导培养应该考虑哪些方面的问题。
爵硕大学林夏博士《数字图书馆新技术展望》,指出新一代数字图书馆必须建立在新的观念上,要掌握数字信息的本质以及研究信息实体之间新生的链接和关系,提出一门建立在网络科学、图书馆和信息科学,认知科学基础之上的新学科——数字信息组织(DIO),并且介绍了几种知识组织新技术。
肯特州立大学图书情报学院的曾蕾教授《数字保存》,阐述长期保存的重要性,解释了长期保存(Preservation)和获取使用(Access)的关系,并指出天生的数字资源应该有长期保存的优先权并推荐了做长期保存项目应该参考和遵循的十个文件,最后介绍了长期保存的一些实用技术。
斯坦福大学图书馆的张甲先生做了题为《数字时代的信息服务》报告,他从项目背景、项目进展、合作原则等方面介绍了斯坦福大学图书馆和Google合作的图书全文检索项目,另外还介绍了斯坦福大学扫描图书的流程以及全文检索的各种检索功能,具体的检索层面分为字段检索、知识分类检索、联想检索、引文检索、信息工具、定题追踪、建议/推荐、导航工具。他指出图书馆的作用正在发生转变:从编制书目到知识导航,从提供馆藏到提供满足读者信息需求的工具,从收集书刊到保存知识和发展数字文献内容,变单馆运作为知识源提供机构的成员。
1.3.3 知识组织与内容管理
上海图书馆刘炜博士《数字图书馆2.0》,展示了目前流行的Web2.0的理念、原则、结构、语言和技术特征,进而结合web2.0在图书馆界的影响和应用论述了图书馆2.0的服务理念、类型和原则。另外三位专家从不同角度阐述了知识组织和管理的发展历程和技术方法。《在浏览和检索界面设计中利用知识组织系统》(曾蕾),介绍了第一代到第四代网络界面的特征和变迁,如何在实际工作中利用KOS的原理和方法提高用户的检索效率。《信息构建的可用性测试》(周晓英),主要从人机界面的可用性、信息构建与可用性、数字图书馆系统的可用性及其测试方法等方面阐述这一主题。
1.3.4 数图技术科研与应用
《信息可视化与可视分析》(林夏),指出信息可视化应用的新浪潮即将到来,新的应用将体现在信息搜索、知识发现、信息分析和集成方案等领域中。《信息抽取及其在数字图书馆中的应用研究》(张智雄),从信息抽取的概念、层次、类型、应用等方面对信息抽取做了详细介绍,对信息抽取技术在数字图书馆的应用中作了展望。《OpenURL及其在链接解析系统中的应用》(刘伟玲),《机构库——背景、现状及思考》(李春旺)。
1.3.5 资源整合与知识检索
《资源整合与门户建设——清华大学图书馆的实践》(姜爱蓉),主要从资源整合的层面、方法、效果和门户建设的思路、内容、应用等方面汇报了清华大学图书馆资源整合与门户建设的基本情况、实践经验和引发的思考。
《从无的放矢到个性化的知识检索》,提出了完全以用户需求为中心组织资源的理念,倡导将图书馆的资源作为其他大型研究和学习组织的一部分来提供服务,旨在方便读者使用。
《数字资源管理的实例介绍:利用图书馆自动化系统以及开发数字资源管理系统》(刘伟玲)。
1.4 重点讲两个前沿问题
一个是因为与《数字图书馆》课程密切相关;一个是因为与信息管理与信息系统专业密切相关。
1.4.1 数字图书馆2.0
DL2.0=DL+WEB2.0
数字图书馆1.0(图)
数字图书馆2.0(图)
2.0只是表示一种版本升级,呈现出与以往的一些不同
DL2.0:具有许多Web2.0特征的数字图书馆(以Web2.0作为技术和理念背景的DL)
具有不同的问题域和不同的侧重点,例如
以用户为中心
更复杂(细粒度)的数字对象结构
更普遍的链接性
更多的多媒体而不是文本
更普遍的手持设备与p2p应用等
Web 2.0技术特征
分布式架构——物理位置不同而共享资源与服务
松散耦合——高互操作性组建按需联络,统一的消息传递机制
平台独立性——不同应用平台(指操作系统、数据库平台)具有通用的机器界面和人机界面
开放API‘s ——服务的使用和通信等开放接口(或符合通用协议标准),技术文档齐全
支持Web服务——访问(共享/重用)Web2.0组件的 的趋势(例如采用SOA架构,但并非都这样)
2.0为什么会成功(Web2.0的核心竞争力)
服务,而非软件。
通过使更多用户使用独特的、难以复制的数据而获得价值;
把用户作为开发者;
获得集体智能;
通过用户的“自服务”而服务于“长尾”;
轻型用户界面、开发模型以及商务模型(普及、普及、普及)
Web2.0与图书馆2.0比较
Web 2.0
互联网成为平台(参与体系)而不是利用互联网来统治和控制;
充分重视并利用集体力量和智慧;
将数据变成“Intel Inside”;
分享和参与的架构驱动的网络效应;
通过带动分散的、独立的开发者把各个系统和网站组合形成大汇集的改革;
通过内容和服务的联合使轻量的业务模型可行,分享经济的模式;
注重用户体验的持续的服务(“永久的Beta 版”);
服务和应用无处不在(非单机版和单一平台版本);
图书馆2.0
以用户为中心;
富技术(technology-savy)环境;
提供长尾化服务;
内容为多种设备而准备;
软件的组件化,而不是单一的ILS解决方案;
持续不断的变化;
采用Web2.0的应用和服务;
开放标准
1.4.2 信息可视化
可视化向人们提供一种方法和手段,利用这种方法和手段人们可以观察人们所不能观察到事务或概念。
可视化基本上可以划分为两个大类:科学的可视化(医学信息的可视化、气象信息的可视化)和信息的可视化(软件工程的可视化、信息检索的可视化、因特网的可视化)。这两者的根本区别在于科学的可视化在显示和展示事务和概念时,继承事务和概念在它本体中的固有结构。
传统信息检索系统(Internet搜索引擎,以及传统图书馆文献目录检索系统)
1 没有考虑人的检索查询行为。
2 对用户来讲是一个不透明的黑箱。
3 用户对传统信息检索系统的检索过程是不连续的。
4 检索结果是一种简单的线性表达。
5 缺乏一种有效的检索反馈机制。
6 检索结果不能够有效地展示大量文献体。
信息检索可视化优势:
1 一个可视化的信息检索环境利于用户进行信息浏览,信息开发,信息挖掘。
2 可以使一个信息检索过程透明。
3 可以向用户提供更为丰富的信息。
4 有可能开发出新的信息检索和信息浏览方法和机制。
5 可以将人的认知能力融入信息检索和信息浏览过程之中。
6 是一个良好的人机对话和交流的环境。
7 可以大大改善信息检索的检全率以及检准率。
8 为传统的信息检索打开了一扇全新的窗口,开拓了崭新的应用以及研究领域,提升了信息检索的档次,
它代表着信息检索系统发展的未来。
建立信息检索可视化系统的一般步骤:
1 选择应用领域以及信息检索系统类型。
2 鉴别和定义要进行可视化的目标以及特征。
3 对可视化空间的定义。
4 目标体从原始数据库影射到可视化空间的算法和方法。
5 定义可视化空间中信息检索和信息浏览方法。
6 可视化系统设计语言的选择。
可视化信息检索系统的常见功能:
1 允许用户在可视化空间中观察文献与文献之间,可能的话文献与提问之间的语义关系,浏览可视化空间中任意特定领域。
2 根据用户的需求,在可视化空间中动态地调整文献分布。
3 根据用户的需求,在可视化空间中扩大/缩小一个特定的局部空间领域。
4 根据用户的需求,在可视化空间中任意地选择一个文献并且阅读它的有关详细信息。
5 提供信息查询手段。
6 展示并且解释标准的情报检索模型以及其他信息检索机制。
信息检索可视化面临的问题:
1 怎样在有限的显示空间内展示海量信息?
2 怎样有效地定义和建立信息可视化空间?
3 怎样有效地评价信息检索可视化系统?
4 信息检索可视化系统空间维数的争论。
互联网信息的可视化主要反映在以下方面:
1 对搜索引擎结果的可视化。
2 对互联网之中网页之间节点联系的可视化。
3 对互联网之中用户使用网络的情况进行可视化处理。
信息检索的可视化系统:TileBars;VISUAL NET;GRIDL;DARE。(很遗憾,似乎为小范围实验系统,笔者未能体验。)
(注:以下资料源自林夏先生的PPT。)
信息可视化是一门边缘学科(计算机科学,信息科学,心理学;教育学及其他应用领域)
1995年前后,随着网络信息技术的发展,一批可视技术有了新的突破。信息可视化领域的一个里程碑是1995年开始的InfoVis年会。另一个里程碑是1999年出版的“Readings in Information Visualization”。
信息可视化的三大支柱:感知的功能;图形的功力;联想的潜力。
信息可视化是对人类智能一种新的开发:理性的智慧;感性的智慧;知性的智慧(理解感知的能力:认知的功能、图形的功能、联想的功能;通过计算机的功能来提高,放大认知的功能)
信息可视化寻求人机合作(计算机将大量抽象的信息映射到图像上;人们通过图像的结构,特征等来理解认识从而获得知识。)
计算机与人各显神通(电脑的高速信息处理能力远远超过人脑;人脑的识辨,理解能力是电脑所不可及的)
今天的信息世界(信息爆炸:怎样组织它们?信息超载:怎样理解它们?所有信息是相互关联的:怎样介入它们?知识淹没在信息中:怎么发现知识?信息以各种形式展现:怎样显示他们?)
信息可视化在数字图书馆中的应用(用可视化揭示信息的分布;用可视化显示检索的结果;用可视化为大量的信息分类;用可视化帮助用户浏览;用可视化为信息个体化服务)
信息可视化的应用实例:
TheBrain: http://www.thebrain.com/
Touchgraph: http://www.touchgraph.com/
Grokker: http://www.groxis.com/service/grok/g_products.html
Topic maps
Highwire: http://www.highwire.org
信息可视化开发工具:
http://iv.slis.indiana.edu/
InfoVis Cyberinfrastructure – Indiana University: http://iv.slis.indiana.edu/
Piccolo Toolkit – University of Maryland: http://www.cs.umd.edu/hcil/piccolo/
the prefuse visualization toolkit: http://prefuse.sourceforge.net/
The visualization toolkit: http://public.kitware.com/VTK/
OpenDX: http://www.opendx.org/
2 图书馆信息技术部建设
2.1 中美图书馆信息技术及相关机构设置调查
根据2006中国高校排名、2006美国大学排名,逐一访问各自前10名高校图书馆网站,结合笔者占有的资料,从中分别选取关于机构设置信息最新最多的5所高校作为研究对象。中国选取清华大学(1)、浙江大学(3)、复旦大学(5)、武汉大学(8)、中山大学(10)。美国选取Princeton University(2)、Yale University(3)、University of Pennsylvania(4)、Duke University(5)、Stanford University(6)。(注:学校后边括号内的数据为其名次。)表1为信息来源网址,访问时间均为2006年6月26日。
中美图书馆信息技术及相关机构设置调查表
图书馆
机构设置
清华大学
系统部、数字图书馆研究室、文献技术服务部
浙江大学
系统中心、数字资源中心、
复旦大学
数字化部
武汉大学
办公室、采编部、系统部、声像部、信息服务中心、典藏部、文理分馆、工学分馆、信息科学分馆、医学分馆
中山大学
数字资源部
Princeton University
Technical Services Department;
Yale University
Digital Library Research and Planning Team; Integrated Library Technology Services;
University of Pennsylvania
Information Processing Center;Information Technologies & Digital Development
Duke University
Academic Technology and Instructional Services
Stanford University
Digital Library Program; Digital Library Systems and Services
调查结论:
(1)机构名称混乱,岗位职责不够明晰。机构名称五花八门。如系统部、系统中心、数字资源中心、数字化部、数字资源部均貌似“信息技术部”,具体岗位职责不得而知。这给读者服务与馆际交流带来若干不便。
(2)美国设有数字图书馆研究部(或组), 具体从事有关数字图书馆的技术和服务方面的研究, 中国称数字化部等, 其职能远不及美国, 只是从事简单的资源数字化工作, 职能与美国相近的也只有清华大学图书馆的数字图书馆研究室。美国数字图书馆的发展过程,经历了由静态表达到动态检索,最后实现信息同步这样一个由初级向高级阶段递进的发展过程,数字图书馆的实现方式也由自己开发软件向购买商业软件转向,并始终保持与 IT业界发展同步和享用IT行业的技术与成果,因此,图书馆界非常关注IT技术的发展和IT技术在图书馆方面的应用问题,关注数字化文献保存技术。国内高校图书馆数字化技术的重视程度还远不及美国,对数字图书馆的研究乃至对信息技术的应用均落后于美国。
2.2 图书馆2.0与图书馆信息技术部的建设
现代技术与图书馆的发展密切相关这是一个共识。但我国目前图书馆信息技术部的建设很不理想。(其实,技术部门的叫法,依旧是五花八门,我坚持用图书馆信息技术部来称谓它。)“图书馆2.0:观念与技术”,观念是前提,技术是手段,图书馆需要自己的技术人才。
广义的现代图书情报技术:数字图书馆相关技术问题的理论探讨与实践交流,如数字图书馆体系结构;个性化服务的技术、算法及管理机制;分布式数据库技术;基于内容的多媒体信息检索;海量信息存储、组织和管理;元数据标准和规范的研究和制定;馆藏数字化技术;基于Web的搜索引擎技术;自然语言处理技术以及语义网研究等。计算机信息管理技术的应用、研究与发展。计算机技术在图书馆学、情报学中的应用。
现代图书情报技术具体到图书馆领域,主要是指应用于现代图书馆管理与服务中的现代信息技术。主要包括以下内容:
硬件层面。包括网络综合布线工程、网络设备、UPS、计算机设备及其他信息技术设备。前期的设备规划,中期的管理与维护,后期的报废处理都需要技术。图书馆员(技术人员)在里边起的作用主要是一种协调作用,包括馆内的协调,馆外的协调(比如与硬件供应商,维修商等等的协调。)对于各种信息技术设备,我们的图书馆员(技术人员)要尽可能熟悉其原理,拥有相应的一些维修设备,能够进行一些日常维护。
软件层面。核心是图书馆自动化系统,系统管理员在图书馆是一个非常重要的角色。其他还有电子阅览室管理系统、网站发布系统、办公自动化系统,电子书电子期刊服务系统等等。图书馆员(技术人员)需要有较强的学习能力,熟悉SQL语言,了解相关技术,最好是精通一门编程语言,此外要有较强的沟通能力,现代信息技术运用能力。
服务层面。比如网站的设计与制作,网站日志分析,自动化系统数据挖掘,学科导航设计,数字参考咨询,开展网络调查等等方面。这个层面需要有敏锐的洞察力及较强的归纳分析能力,需要有较深的理论基础及较强的信息技术应用能力。
在上海召开的“图书馆2.0:观念与技术”研讨会闲聊中,进一步感受了图书馆信息技术部的生存状况。有专门技术部门的馆对信息技术部馆员的评价,简单说就是:没本事,脾气大。两年前,也是外出开会,跟一位老师聊起他们的技术部主任,感觉恨得咬牙切齿:利用图书馆设备干私活,人在心不在。如此等等。这几年我亲身走访过的几十所不同类型的图书馆,去任何一馆,我都会尽可能的去了解他们的信息技术部状况,令人满意的太少。
很多馆都提出要计算机人才,招聘的时候明确说要计算机专业的。有个结论(或体会)就是,真正优秀的技术人才根本不到图书馆;翅膀硬了的技术人才不留图书馆。没有图书情报功底、且对图书情报工作没有激情的“技术人才”是不可能干好图书馆信息技术部工作的。开会的过程中,有与会者(大概是高校图书馆技术部负责人)抱怨说,图书馆2.0工作无从开展,原因是领导不支持,同事不理解。技术部工作我个人深有体会,跟同行也有过好些交流。感觉没事干、干不了事情的图书馆信息技术部很多。我看到好些图书馆信息技术部人员减少、职能萎缩,非常痛心,因为是被迫的,而不是因为技术进步了、管理方式进步了等积极因素导致。
我们的图书馆工作要做到三个结合:理论和实际相结合;技术与内容相结合;人脑和电脑相结合。图书馆要实现真正意义上的图书馆2.0,需要一支有战斗力的信息技术队伍。图书馆信息技术部人员的职业生涯设计,我们图书馆行业需要给予更多的关注。
3 交流与探讨
参考文献:
1 http://dlSeminar.lib.tsinghua.edu.cn
2王平.《2006.北京.数字图书馆前沿问题(发展战略与实践)高级研讨班》会议综述.数字图书馆论坛,2006(9):72-76
3 数图高研班的主题.http://my.donews.com/keven/page/3/
4 刘炜.数字图书馆2.0. 数字图书馆前沿问题(发展战略与实践)高级研讨班资料.2006.8
5 (张进.信息检索可视化)曾民族主编.知识技术及其应用._北京:科学技术文献出版社,2005.11431-460
6 林夏.信息可视化与数字图书馆.厦门数字图书馆高级研讨班PPT,2005.7
7 林夏.信息可视化与可视分析.数字图书馆前沿问题(发展战略与实践)高级研讨班资料.2006.8