上海金汇通航:知识地图技术的发展趋势及评价研究

来源:百度文库 编辑:中财网 时间:2024/05/05 20:26:24
知识地图技术的发展趋势及评价研究马大川,马越

(武汉大学信息管理学院,湖北武汉 430072)

摘要:本文对知识地图的从导航和查询两种功能出发,研究知识地图的技术发展趋势。同时,根据传统的检索技术评价指标和知识地图自身的技术特点,提出了知识地图的评价指标。

关键词:知识地图;发展趋势;评价研究

中图分类号:G203 文献标识码:A 文章编号:1007-7634(2006)08-1121-04

1 知识地图概述

知识地图是知识管理工具之一,对组织知识起到定位和导航的作用。关于对知识地图的定义,各个专家学者们说法不一。但是,人们共同的认识是知识地图指出知识的所在位置或来源,并不包含知识的内容,其所连结的信息包括人员、程序、内容及它们的相互关系。知识地图最大的贡献在于构建知识间的关系,使无序的知识信息以有序的面貌呈现在用户面前,提高了知识的利用率。

知识地图可以清楚地表明组织知识所在位置,是隐性知识和显性知识的导航工具,并使组织成员清楚地了解其角色和任务。同时,知识地图在试图揭示知识之间的关系时,往往会发现以往所没有发现的某些知识之间的新的关系,从而产生新的知识,最终实现在知识有序化的过程中的知识创新。知识地图还可以表明知识的所有者,有助于企业知识产权的建立和明晰化,并作为组织总体的知识智力资源清单,加强组织的竞争优势。

2 知识地图的导航功能与技术

导航图是解决超文本数据迷航问题最有效的方法之一。知识地图是对组织知识位置的图形化显示,帮助用户迅速准确地定位需要的知识信息。因此,可以将知识地图看作一种有效的导航图工具。

知识地图与Web技术相结合,用Web页面将知识结构体系及各个知识点网络图用示意图方法表示出来,用户需要访问哪个页面时,可以直接选中示意图上对应的节点。由于示意图的直观性较好,其导航速度快、效果好;知识关系清晰明确,便于用户了解相关知识、知识背景,并扩大检索范围。

知识导航,主要涉及到信息提取技术和元知识技术。信息提取技术主要应用于关于文献信息资源的知识地图中,可以被用于提取基本概念来表达非结构化或者半结构化文本(如文档等)。通过词语分割、文本索引和特征选择等文档转换技术,将文档划分为最小单元,然后识别每篇文档主要概念的关键术语并建立索引,在术语权重系统中,按照每个关键词在文档中的出现为线索来评价每个关键词的可辨性,并将其作为机器学习的特征加以选择。元知识技术主要针对其他一些显性知识和隐性知识。与元数据相似,所谓元知识就是“有关知识的知识”。元知识可以分为以下三类:第一类元知识是关于已知的知识,即关于怎样组织、管理知识的知识,这类元知识表达的是内容、结构等一般特征以及分类、综合等相关特征;第二类元知识是关于如何运用知识求解问题的知识,这类元知识主要是为了指导领域内知识的运用;第三类元知识是关于从知识源中获取知识的知识,这里的知识源包括了数据库、书本、人以及其他各种形式的知识系统。

要发展知识地图技术,必须提高知识地图检索功能和导航效率。未来的知识地图的信息检索导航系统的发展趋势大致有以下几个方面。

(1)导航技术智能化。随着检索技术的发展,检索工具日益功能强大,知识地图的导航要使用全方位检索手段,提高检索的准确和缩短响应的时间;同时支持多语种,使检索界面变得更加友好,检索结果格式清晰,网页链接可靠。这就要使用智能检索技术。智能检索是指机器对用户提供的以自然语言表达的检索要求进行分析,形成检索策略进行检索。目前的信息检索工具主要是基于人工语言开发的,要求用户使用标准的语词,既增加用户掌握学习标准语词的负担,又降低了检索的效率。因此,基于自然语言的智能检索是发展的必然趋势。知识地图要提高导航功能的效率,就要广泛使用智能搜索引擎、智能浏览器、智能自动搜索软件。

(2)网络跟踪和漫游技术自动化。知识地图可以利用和开发网络搜索软件自动搜索指订的WEB站点的网页和多媒体数据,从组织网站主页、任一页面以及组织的内部网络数据库中的任一位置开始搜索,遍历所有信息点,确保知识地图背后隐藏住组织所有的知识点。

(3)知识组织技术整合化。知识地图管理人员可以利用和开发网上自动分类标引、自动文摘技术,复制组织内外网站相关的资源和知识内容,组织建立索引文档,形成目录数据库,并建立独立的搜索引擎对索引数据库进行检索。特别要注意对引用的数据库、网站内容进行统一的分类,建立统一的内容归类和类目标准,将知识组织的技术应用到网络自动化中,才能够使知识地图实现有效的导航功能。

(4)导航历史分类化。利用和开发定量分析软件,自动跟踪、统计用户访问的知识地图各个分支知识情况。统计各站点被访问次数、统计各站点有关内容被下载次数,自动确认用户常用的知识类目和用户经常访问的知识点,在重点信息中心导航库中作为推荐知识并生成相关信息;自动记录用户常用的知识地图导航路径,将最常使用的检索路径记录下来,列入知识地图相关知识点推荐路线之一。

3 建立用户友好的查询界面

在知识地图的管理者和组织者努力改进导航技术的同时,提高知识地图使用率的另一个办法是建立查询模式,从用户使用的角度加强知识地图的功能,这就需要考虑用户使用的简单性。不能仅仅要求用户靠自身的分类知识去摸索,而应该建立相应的查询模式,帮助用户查找知识线索。

查询模式的建立可以按照现有常用数据库系统的模式来建立,方便客户将其他数据库查询的知识应用于知识地图查询上,尽快熟悉使用方法。利用图书馆系统的查询界面为例,可以将知识地图的界面建立成以下模式。

(1)简单查询。在简单查询中每次只能选择一种“检索途径”,并可限定所查询知识的类型。

(2)高级P精确查询。可以同时选择多种“查询途径”组配使用,并除可限定知识资源的类型之外,还可限定所属部门,专家,时间等内容。

(3)查询途径。限定了知识所属部门的类型,知识地图的类型,可能的专家等查询路径。

①题名:题名包括文件名,数据库名,专家名,可键入题名全称或名称起始部分等。当然,键入的内容根据用户掌握的信息来确定,信息越清楚明确,键入的内容越详细,直接找到个人所需知识可能性就越大,需要的路径和所花费的时间就越短。例如:生产计划部表单;生产计划部10日计划购入原材料表单。

②主题词:键入完整主题词,将所查询的知识信息进行分类。前提是要建立完整统一的分类标准和主题词标准。这项工作应该在知识地图建立的最早期完成,它是建立整个知识地图内容框架的基础。

③分类号:结合组织数据库和所有组织知识,根据主题内容进行统一分类,有力于知识地图内知识条目的管理。

④专家:在隐性知识的检索中,专家是重要的查询入口。

⑤知识类型:可以根据目的知识的展现方式,如文档、文件夹、图表、多媒体形式等。

(4)近似词。为了防止用户因为对于所查的类目把握不准确,系统自动显示出相关词的提示,包括语义近似、语音近似等。当然,为了能做到近似词查询,需要与相关的分类数据库相连接。

(5)排序方式。一般可以设立”相关度”和”日期”两种排序标准,也可以根据用户的习惯或者需要选取“作者名字”等方式排序。

(6)查询模式。限定了“查询内容”和相关被检索知识条目的匹配关系,包括“前方一致”、“等于”和“任意匹配”。也可以设立为“精确”或者“模糊”两种匹配方式。

①前方一致:指所定位的相关内容以输入的“查询内容”开头。

②等于:指所定位的相关内容和输入的“查询内容”完全一致。

③任意匹配:指所定位的相关内容包含所输入“查询内容”。

(7)资料来源。为了缩小检索范围,可以设定检索范围,选择项目可以从资料类型到专家、资料所在部门等。

(8)查询日志。由用户志愿对本次使用知识地图的情况做简单记录和评价,包括检索目的、检索效果、检索路径。在知识地图建立初期,如何建立有效的和用户互动的查询日志很重要,他关系到知识地图长期的发展和使用。知识地图管理人员需要认真的记录用户的查询日志,对存在的问题进行修改,并挑选出比较重要的查询项目的最佳定位路径。这一点,对建立隐性知识查询模式尤为重要。

4 知识地图使用效果评价指标

知识地图还在推广使用的阶段,很多问题需要在使用中逐渐显露,知识地图的完善也需要通过不断找出现有知识地图的问题和不足,并进行相应的改进。那么,这就需要建立一个知识地图的评价系统,根据这个标准进行知识地图的评估,来区分其技术的成熟度,并不断改进没有达到评价标准的地方。通常,这些需要改进的方面,也是用户使用中最不满意的和最可能阻碍知识地图推广使用的因素。

4.1 传统的评价指标在知识地图评价中的应用

知识地图作为知识体系的定位和导航工具,传统的评价指标仍然可以有效的应用于其评价体系当中。用户使用时,最理想的效果仍然是张琪玉老师当初对于文献检索系统检索效率所定义的那样:“凡是已纳入检索系统的符合检索要求的文献能被全部检出,不要遗漏;而所检出的文献全部符合检索要求,都是有用的(即检全率为100%,检准率也为100%)”。只不过其中的文献在知识地图中成为用户要寻找的知识,或者知识的存储定点。

(1)检全率。知识地图在帮助用户定位、检索用户所需知识的时候,理想的状态是所有相关文献都能够得到。当然,理想状态是难以实现的,知识系统中知识是分散存在的,隐性知识的漏检可能性更大。但是,理想的知识地图仍然应该设法使用户得到尽可能高的检全率。目前组织中知识地图的一个潜在问题在于过于关注公司内部资源,没有考虑到公司环境及公司外部资源也是公司知识组成的重要部分,因此,这一部分知识的缺失也将影响到知识地图的检全率的实现。

(2)检准率。对于知识地图而言,检准率的标准更加难以确定。传统的检索系统给予的是用户要检索的某篇文章,可以精确到“点”;而知识点的分散和关联性、隐性知识的模糊性使知识地图所反馈给用户的结果,不是传统的一篇确定的文章,而是一群相关知识点的集合,是以面的形式呈现的。因此,知识地图的检准率指标不应该简单地用传统检准率指标来计算,即所得到的准确结果与所有结果的比,而应该建立一个模糊检准集合,用模糊综合评价法来评价是否得到了较为准确的结构。

4.2 知识地图评价指标

除了传统的评价指标,知识地图应该建立基于自身特点的评价指标,以便更好的评价知识地图的使用效果。

(1)响应时间。知识地图连接的是知识库系统,检索结果的返回时间长度将影响用户对一个知识地图的使用兴趣。响应时间的计算可以通过不同知识地图对于相同课题的检索时间长度比较得到。

(2)更新速度。信息量海量增长的时代,知识的及时更新是很重要的,昨天的信息今天就可能失去了价值。同时,保持组织知识库的更新,就需要随时更新知识地图,更新知识地图的知识定位、知识链接和知识间的关系。虽然更新工作很复杂,但是,只有保持更新的知识地图,才能保证它的使用价值。要实现知识地图的维护更新,可以采用人工和机器两种方式。由于数据量变化不大,小型组织、稳定的组织的知识地图可以采用人工维护的方式。较大型、动态的组织则要采用机器维护,例如可以利用搜索引擎原理,定期定向由知识地图管理程序派出类似搜索引擎的“蜘蛛”程序,扫描更新的知识信息点集合并将有关信息存入数据库保持知识地图的更新。

(3)标引深度。知识地图作为知识导航工具的一种,必须要对组织知识库进行标引,才能够实现检索功能。标引深度实质上取决于诸如“网络蜘蛛”等网络信息收集工具的功能,网络信息检索工具标引到网页超文本结构的哪一层次。在企业的INTRANET上,有的检索工具只标引主页或者文件名称,不能够标引到深层次的内容,不利于用户的使用和学习。功能越强者,就越能收集深层次的内容。因此,应该有专门的知识地图标引工具来完成对于知识库和企业INTRANET深层次标引的工作。

(4)地图展现方式。知识地图之所以采用地图的形式,就是为了体现所有知识之间的联系,方便人们进行多面分析。多面向分析主要是立足于对象的观察与展现是多面向的基础,即使是发展成熟的事物,也可能具有多变的面向对向。多面向分析的方式是希望建立一个具有弹性且可扩及新事物处理的机制,而所分析的面向可从人、事、时、地、物等,或者是类似的结构来分析对象。

现有的知识地图管理软件常用的展现方式有档案总管型、思考管理型、网状地图型、星状地图型、点状地图型、条列地图型、等高线地图型等。

①档案总管型:将知识点用提纲的形式排列,同时点击每个知识树上的知识点时,就会出现知识的具体内容文件夹,方便了使用者快速直接了解知识分类及分布。

②思考管理型:将知识树以人类思考模式的方式来展现知识分布,用户可以通过层层遍历的方式找到具体的知识,方便使用者直接了解知识思考分布与内容。

③网状地图型:通过网状地图的方式来展现知识分布,方便使用者直接了解知识分类,透过网状连结可清楚了解知识彼此间的关联性,一般应用于网站内容相似度高或关联性高的内容。

④点状地图型:主要使用于知识大类分类的情形,由点之稠密度和点与点之间的距离来表达知识地图之展现。但是由于点的随意性和不确定性,这种知识地图形式可能是很散乱的,需要管理者创立其他形式来帮助点状地图的清晰化和条理化。例如颜色、大小是区分与联系点与点之间关系的重要方面。

⑤条列地图型:以条状建立知识点是非常简单的,快速建构是条列地图主要优势之一,亦是早期知识地图应用常使用的方法之一。但是,今天的知识关系错综复杂,知识地图变化也是很大的,条状知识地图可能会难以体现知识类目关系并不能跟上更新的速度。

⑥星状地图型:星状地图是发散形式的,每一个主要的类目下围绕着相应的具体分支,主次非常清楚,但是二级、三级以及更深的分类和知识间关系难以体现。

⑦等高线地图型:等高线地图植入了地理上等高线的原理,通过三维空间将知识地图可视化。等高线地图的不足之处在于关系表达不够直观,如果使用不熟练可能会在理解上有一定困难。

不难看出,地图的方式展现知识联系的形式较灵活,但是如何在尽量简约的形式上建立出知识之间的关系,却不是那么容易的。如何选择适合的知识地图形式,以用户最容易理解和最容易找到自己需要的知识的形式展现出来,同时还要便于用户对知识关系进行多面分析,也是评价知识地图的一个重要标准。

G 文化、科学、教育、体育马大川马越知识地图发展趋势评价研究情报科学/情报科学编辑部·—月刊·—ISSN 1007-7634·— 2006-8,p1121-1124全部