化学元素的命名:人物信息的网络检索途径与方法

来源:百度文库 编辑:中财网 时间:2024/04/29 23:06:28
人物信息的网络检索途径与方法
http://www.sowang.com  2008-05-28 作者:邢志宇
关键词:人物信息检索 网络检索 检索途径与方法
摘  要:通过实例介绍了网页搜索、专用搜索引擎、传记网站、百科全书网站、人物资料数据库、网络传记辞典等六种人物信息网络检索的主流途径,以及相应的检索方法和相关资源的调查方法。
人物信息是关于人的信息,是在社会生活生活中产生和被广泛利用的一种信息,它即可以是诸如姓名、性别、职业、出生年月、从业单位等简单的身份确认信息,也包括较为详细的生平或传记资料。互联网诞生之前,人物信息的检索主要使用相关的工具书,或通过论文著者索引和图书馆著者目录等展转查找,由于工具书和其他印刷型检索工具的出版周期和时滞性限制,人物信息的传播时空较小,检索利用极为不便。随着互联网的产生与普及,信息的产生、传播和利用呈指数增长,以网络为载体的人物信息空前丰富,其检索利用也更加快捷和方便。然而,在浩瀚的网络信息中,人物信息仅为沧海一粟,且类型多样分散难觅,只有了解其分布规律,借助一定的工具,选择适当的途径,采用相应的方法才能进行有效的搜寻和检索。
一、网页搜索
网页搜索(web search)是利用搜索引擎的网页搜索功能查找一般网页中的人物信息,适用于公众人物、知名人士或新闻人物、成功人士、专栏作家等简单身份信息的查找。网页搜索是搜索引擎的主要和常用的功能,不同的搜索引擎对网页索引的深度与范围不同,收录网页的文种和数量各异,适用的逻辑算法、搜索语法和对关键词的规定等亦各有差别,因此有效的网页人物信息搜索,要求对搜索引擎有较为全面的了解,掌握相应的检索方法和技巧。就关键词的选取而言,单纯的人名(主题关键词)搜索往往检准率较低,必须附以必要的 “特征关键词”或限定性搜索语法才能收到事半功倍的效果。主题关键词是指表述主要搜索内容的必用的词语,不使用主题关键词就不能准确地搜索到特定的内容。特征关键词是指在内容描述中与主题关键词同时出现且位置较近的名词、量词、形容词等进一步说明和限定主题关键词的词语,特征关键词可以有效地缩小搜索范围,使结果排序更加趋前。
以GOOGLE网页搜索为例,查找俄罗斯总统普京的个人信息,仅用“俄罗斯总统普京”或“普京”搜索,返回的结果数以十万计,且前三页无适用结果,而附以特征关键词“简历”或“档案”搜索,结果首页的首项即可满足检索需要,以“普京 身高”为检索式搜索,还可以获得官方资料不载的罕见信息。
又如查找第十一世班禅额尔德尼•确吉杰布的出生年月和认定、坐床经历的资料,使用限定性搜索语法“intitle:”(仅在限定的网页标题中搜索)构建检索式“intitle:额尔德尼•确吉杰布 出生”,可以明显而有效地缩小检索范围(仅返回28项结果),且首页检索结果大多都满足要求。
查找一般网页中的人物信息,要注意“特征关键词”的斟酌和选用,通常多使用“籍贯”、“出生”、“毕业”、“简历”、“档案”或行业名称、职务称谓等描述性词语进行限定性搜索。例如,在网页搜索中出现同姓名过多且结果数量太大的情况下,只有附加如“图书馆”、“副研究馆员”等特征关键词,才能在众多相同姓名的搜索结果中快速找到特定人物的信息。
二、专用搜索引擎
顾名思义,专用搜索引擎(special search engine)是专门用于搜索某一方面信息的搜索引擎。查找网络人物资料的搜索引擎主要有个人信息搜索引擎(people search engine)、电话号码搜索引擎(phonenumber search engine)、EMAIL搜索引擎(email search engine)、黄页、白页搜索引擎(Yellow&White Pages search engine)、公众信息搜索引擎(public record search engine)等类型。此类网络检索工具国内尚不多见且功能难如人意,而在欧美国家则十分流行,从yahoo 的“Phone Numbers and Addresses”、“ Background Verification”目录和 about的“Free People Search - Use the Web for a Free People Search”等目录可见一斑,用“people Search”搜索更是多不胜数。其中,查找美国个人信息常用Yahoo! People Search(http://people.yahoo.com/)、Lycos People Search(http://www.whowhere.com/)、People Search(http://www.peoplesearch.com/)等搜索引擎,这些搜索引擎功能强大信息详尽,包括了姓名、性别、年龄、住址、电话号码、EMAIL、信用与犯罪记录,以及广泛的“背景”资料等等。而Find a Person & Email Search(http://person.langenberg.com/)则是一个极为实用的人物信息集成搜索引擎(All-in-One Search Page),它在同一页面提供Whowhere/Lycos( Phonebook Search)、Zoom Info(Person Finder)、Google-Deja(People Who Posted on Usenet)、Yahoo(Person-EMail Search)、BigFoot(Person-EMail Search)、x10/Find a Grave(Famous Person Grave Finder)等15个专用搜索引擎的检索入口,并超链接至源搜索引擎的主页,是查找国外人物信息的便捷工具。
国内较有影响的人物搜索引擎有Ucloo搜人(http://www.ucloo.com/)和搜狗人物搜索(http://people.sogou.com/)、搜人(http://www.sooren.cn/)等,由于技术原因后两个搜索引擎已经停止运行。Ucloo搜人号称“全球最大的中文搜人引擎”,它使用自动索引技术,从网络资源(包括网站、出版物、电子文书等)中收集和分析与人物有关的信息,其独特的算法使搜索器能在极短的时间内收集到最大数量的信息并进行分析匹配、归类和及时的更新。查找诸如联系方法, 个人简历, 教育工作背景, 个人照片, 网上口碑, 评价评分, 留言等极为方便快捷。
国内虽少有人物信息专用搜索引擎,但借助诸如新闻搜索引擎、百度图书搜索(http://book.baidu.com/)和百度国学搜索(http://guoxue.baidu.com/)等其他专用搜索引擎,也可以在一定程度上查找某些到方面的人物信息。例如利用新闻搜索引擎可以查找新闻人物的简介、动态信息和背景资料,百度图书搜索的“简介”较为详细,尤其传记类图书多有传主的事迹或生平介绍,百度国学搜索查找历史人物快捷方便且资料详实可靠。
三、传记网站
传记网站是查找人物信息的主要网络资源。综观网络资源,人物生平和传记资料数量庞大、广为分散、不胜枚数,但按主题或分类建立的高质量的群传网站却相对较少,系统而完备的中文传记网站与英文相比更是少而又少。利用传记网站查找人物资料,首先要掌握人物姓名的正确书写或拼写形式以及人物的大致定位,查找历史人物和著名人物首选综合性传记网站,查找现代人物和某领域、学科的知名人士多使用专科性传记网站。
1、古今中外人物(http://www.1-123.com/index1.asp)
按时代和学科分为远古、夏商周、秦汉、魏晋南北朝、隋唐五代、宋朝、元朝、明朝、清朝、政治、军事、经济、科教、哲学、宗教、文学、艺术、其他等18类,介绍近2000位中外名人,资料来源于网络文献,除按时代和学科检索外,其“古代人物索引”、“现代人物索引”、“外国人物索引”还提供人名音序检索。
2、文化人物(http://www.shtvu.edu.cn/ccwindows/page/renwu.htm)
上海电视大学《中国传统文化》的人物专栏,分为医学人物、哲学人物、文学人物(先秦两汉作家、魏晋作家、南北朝作家、隋唐五代作家、宋代文学家、辽金作家、元代作家、明代作家、清代及近代作家)、美术家、神仙人物、史学人物、古代语文学家、古代宗教人物、古代经学家、古代科学家、二十世纪文化人物等11类,介绍人物近千名,可分类查找或以人名检索。
3、Biography.com(http://www.biography.com/)
从古至今的25,000位杰出人物传记,所有资料来自《剑桥百科全书》数据库、《美国传记剑桥词典》和《A&E传记》,可按姓名和关键词检索,也可按姓名字顺浏览查找。
4、Biographical Dictionary(http://www.s9.com/biography/)
收录了古今28,000多位杰出人物的传记,提供生年、卒年、身份、职业、文学和艺术作品、成就、以及其它关键字等多种检索途径。
5、Biography Center(http://www.biography-center.com/)
多语种传记索引,收录了27,867位人物的传记资料,其中英文传记10,989篇,按姓名字顺查找,也可分语种进行关键词检索。
6、infoplease.com: Biography(http://www.infoplease.com/people.html)
按姓名、职业、学科或地区分类检索全世界30,000多位古今新闻人物的传记,资料来源于哥伦比亚百科全书、Infoplease词典和Infoplease年鉴。
7、Catalog of the Scientific Community: 16th and 17th Centuries
(http://galileo.rice.edu/lib/catalog.html)
收录1473年至1680年出生的近千位科学家的详细生平资料,数据库检索功能完善,可从生平资料的20个方面进行检索。
8、The Nobel Prize Internet Archive(http://nobelprizes.com/nobel/nobel.html)
历年诺贝尔奖得主介绍,包括主要成就、出生日期、教育背景、联系地址、E-MAIL、著述和相关资源链接,可按学科查找和关键词快速检索。
9、the American Presidency(http://ap.grolier.com/)
历届美国总统、付总统、第一夫人传记,按届别检索,按资料来源分别查看。
10、The largest guide to posthumous(http://amillionlives.com/)
已故名人传记,收录美国、加拿大、澳大利亚、西班牙、新西兰、拉丁美洲数千位已故名人传记资料,按姓名字顺,或地区、行业等分类检索,并有大量传记站点链接,由于资料多、分类细,检索前须阅读“How to Use this Site”。
调查和了解传记网站是利用其查找人物资料的前提,我们可通过搜狗(http://www.sogou.com/dir/)、YAHOO(http://search.yahoo.com/dir)、ABOUT(http://www.about.com/)等分类搜索引擎、Librarians' Index to the Internet(http://lii.org/)、Infomine(http://infomine.ucr.edu/)等图书馆员编制的参考工具和传记网站链接等三种主要途径掌握传记资源的分布,对传记网站进行选择和利用。应当注意的是,使用分类搜索引擎查找传记网站需要对其类目设置有充分的了解,如在搜狗“目录”中,综合性“传记”网站列目于“文学>纪实文学>人物传记”和“文学>纪实文学>人物传记>名人传记”类下,各学科人物和地方名人相关网站则分散在“社会科学>哲学>中国哲学>儒家”、“科学技术>科技信息/服务>人物>生物/医学家”、“政法军事>军事>军事人物”、“社会文化>人物>中国各地人物”等数十个类目之中;YAHOO的“Directory > Society and Culture > People > Biographies”类下仅列举综合性传记网站,各国、各时期、各学科和个人传记资源则分散在相关类目之中。使用参考工具网站要首先阅读其“About”,了解收录内容范围、编制体例、更新频率和检索功能等,力求用适当的检索入口和准确的关键词高质量地检索适需资源。如Librarians' Index to the Internet包括14,000多个网站的主题目录,提供分类和关键词两种检索入口,关键词检索检索可进行“all fields(在所有类目中检索)”、“Title(在标题中检索)”、“URL(在网址中检索)”、“Description(在资源描述中检索)”等检索范围设置,检索式支持逻辑运算符,用“关键词and databases”构建检索式可以检出较多的一般网络搜索难寻的深层网络结构(deep Web structure)中的罕见资源。
四、百科全书网站
百科全书是知识密集型的治学工具,包含着大量的人物资料,以网络为载体的百科全书是查找人物信息便捷而有效的途径。
1、中华百科全书(http://living.pccu.edu.tw/chinese/index.asp)
中华百科全书是多位专家学者参与编制的百科全书,分为38个类别、10,525个档案,内容丰富,图文并茂,其中“传记”类几乎囊括了中国古、近、现代名人且资料详实,按“部别”检索。
2、维基百科(http://zh.wikipedia.org/[中文])、(http://wikipedia.org/[英文])
包含200多种语言7百万篇文章的百科全书。维基百科2002年10月推出中文版,查找人物信息用人名作为关键词一检即得。由于它是任何人都可以参与编辑的开放性百科全书,其中文版的条目管理多受指摘,网站时常被封。
3、Encyclopedia Britannica(http://www.britannica.com/)
《不列颠百科全书》网络版,包括《不列颠百科全书》、《简明不列颠百科全书》和《韦氏词典》三部分,1994年正式发布,是互联网上第一部百科全书,可检索词条达到98,000多个可链接的优秀网站200,000多个。提供关键词、字顺索引、主题分类索引等多种检索方法。
4、Encyclopedia.com(http://www.encyclopedia.com/)
提供《简明哥伦比亚电子百科全书》2001年第6版50,000多篇文章的全文检索,每篇文章均有相关链接,以人名为关键词可以检索所有收录文章中人物资料。
5、Information Please(http://www.infoplease.com/)
提供主题广泛的数百万个事实查询,“Encyclopedia”可以检索《哥伦比亚百科全书》(第六版)57,000多篇文章,“Dictionary”可以查询125,000多词条,均可用于人物检索。
6、Encyclopedia Smithsonian(http://www.si.edu/resource/faq/start.htm)
《史密森百科全书》由咨询解答档案汇编而成,所有内容按主题组织,按字顺查找,每一主题下都有多个相同主题资源链接,以对该主题进行全面阐释。
7、Encyclopedia of British History: 1500-1980
(http://www.spartacus.schoolnet.co.uk/industry.html)
研究1500-1980年英国历史最好的资源,目前已有2,000多条目,并在不断增加之中。每一词条都包括故事、插图、背景资料和参考书目等,按事件或年代检索,是查找该国该时期著名人物的首选工具。
8、Encyclopedia of the orient(http://i-cias.com/e.o/index.htm)
东方百科全书,是有关北非和中东国家的唯一一部网络百科全书,收集了从北非西北部古国毛里塔尼亚到东部的伊朗,从北部的土耳其到南部的苏丹之间的所有国家的文化信息。
9、Encyclopedia Mythica(http://www.pantheon.org/mythica.html)
神话、民俗和传说百科全书,收录文章6,800多篇,神话按非洲、美洲、亚洲、欧洲、中东、大洋洲等地区分类,民俗部分包括一般的民间风俗、亚瑟王的传奇、希腊英雄传奇和很多国家的迷人的民间故事,另有动物寓言、传奇英雄、神话人物画廊、神话人物一览表等专题栏目。按地区、关键词或栏目检索。
10、The WWW Virtual Library(http://home.istar.ca/~obyrne/ency.html)
网络虚拟图书馆的参考资源,介绍并链接了24种综合与专科百科全书。
查找网络百科全书资源主要采用分类搜索引擎、图书馆员编制的参考工具和传记网站链接等方法。
五、人物资料数据库
人物资料数据库是有关机构或个人为特定目的编制的专门用于人物资料检索的事实型数据库。数据库是可供计算机快速检索的、有组织的、可共享的数据集合。就查找人物资料而言,利用数据库是最为简捷和有效的途径。
1、地方志人物传记索引数据库(http://www.nlc.gov.cn/newpages/database/dfzrw.htm)
国家图书馆编制,提供1949年以后新编地方志中所见人物的姓名、性别、民族、生活朝代、生卒年、字、号、别名、籍贯、身份类别及本条资料出处等方面的信息检索。现有数据量3.2万余条,年增数据量1万条。
2、台湾人物志资料库(http://tbmc.infolinker.com.tw/whos2app/servlet/whois?simplegenso)
摘取1895~1945台湾各种官方及民间发行的报纸、期刊和书籍中的各种记事编辑而成的综合性大事年表资料库,其中收录的材料来源超过50种,总条目数更高达50,000笔以上。
3、中国人物库(http://www.bjinfobank.com/IrisBin/Select.dll?Special?db=RW)
中国资讯行编制,数据库提供详尽的中国主要政治人物, 工业家, 银行家, 企业家, 科学家以及其他著名人物的简历及有关的资料,其内容主要根据对中国八百多种公开发行刊物的搜集而生成。
4、中国科学家门户(http://www.cqvip.com/zuozhekj/)
维普资讯依靠其强大的文献数据库摘去论文作者信息而编制,提供详细的分科浏览查找和多字段检索,个人条目下不但有姓名、所在机构、主要研究方向、个人专长、社会职务、出生年月等简要信息,还有收录在维普数据库中的“已发表论文”目录。
5、人民数据——中国重要事件、人物库(http://data.people.com.cn/111.jsp)
由人民日报社网络中心(人民网)与金报电子出版中心联合编辑制作,资料来源于人民网丰富的新闻资源,内容权威、可靠,检索方便,需注册使用。
6、搜狐经济人物库(http://business.sohu.com/7/0304/57/column219615768.shtml)
设有人物库分类导航(官员、经济学家、企业家、经理人、国际人物、经济传媒人、业界人士、专栏作家),提供分类浏览、姓名拼音字顺查找和关键词快速检索。
7、TOM人物库(http://tech.tom.com/figure/index.html)
主要介绍IT业人士,分为互联网行业、电信.手机行业、PC.硬件行业、软件行业等栏目,以网页形式按姓名浏览查找。
8、湖南人物库(http://hncd.hnu.cn:81/)
介绍古今湖南籍人物近千人,以时代分为古代人物、近现代人物和当代人物,其下多重列类详子目,在方便逐级浏览的同时,还提供关键词快速检索和高级检索。
数据库属普通搜索引擎的“蜘蛛”程序不易抓取的“深层网络”(deep Web)中的“不见网页”(The Invisible Web),查找起来有一定的难度。就国内人物资料数据库而言,除了上述介绍的之外,各省、市、自治区图书馆网站大多提供根据地方志编制的人物资料数据库的免费利用,一些国家级学术机构(如中国科学院等)网站、行业网站(如中国国防资讯网等)和高校(如武汉大学)网站等也多设置人物专栏或挂接自编人物资料数据库。据此,我们可以从地域、学科或机构等途径查找在网络中高度分散的适合自己需要的人物资料数据库,进而利用其检索具体的人物信息。
查找国外的人物资料数据库,除上述方法外,可以利用专门的查询工具,如:已介绍过的Librarians' Index to the Internet(http://lii.org/),还有About.com (http://www.about.com/) ,其查询主题数以万计,包括众多“Invisible Web”资源,以关键词“Invisible Web”检索,可以找到很多诸如:“Invisible Web: The Cloaked Internet”(“看不见的网页”:被掩盖的网络资源)等隐藏网页的链接,常用来作为查找人物资料数据库的指南。更广泛的人物资料数据库调查,可以利用The Invisible Web Directory (http://www.invisible-web.net/),它是《看不见的网页》(The Invisible Web: Uncovering Information Sources Search Engines Can't See 一书的作者Chris Sherman和 Gary Price创办的专门用于指导检索Invisible Web资源的网站,网站的宗旨是“寻找搜索引擎无法找到的隐藏的网络资源”(Finding Hidden Internet Resources Search Engines Can't See)。
六、网络传记辞典
传记辞典由来已久种类繁多,近年来随着网络的飞速发展,可在线阅读的传记辞典不断增多,其中英文传记辞典最为人称道。例如我们可以在dmoz(http://www.dmoz.org/)中检出47种biographical dictionary(传记辞典)、YAHOO“Directory”(http://search.yahoo.com/dir)中列举了97类与“"Biographical Dictionary"”(英文双引号为短语精确匹配)相关类目、lii(http://lii.org/)推荐了24类31种Biographical Dictionary等等。我们可以通过搜索引擎对传记辞典的数量有一个大致的了解,并利用搜索结果选择适合自己需要的网络传记辞典。
使用网络传记辞典前,需要认真阅读其简介或编制说明,了解其创制时间、资料收录种类和时限、学科或地域范围,以及检索入口、检索式要求等等,如Biographical Dictionary(http://www.s9.com/)1997年上线,收录33000多位世界范围内从古至今的著名人物,可以用姓名、出生与去世日期、职位、职业、学术成就等作为关键词进行检索;4,000 years of women in science(http://www.astr.ua.edu/4000ws/4000WS.html)可从姓名字顺和历史时期两中途径查找全世界4000年来的女性科学家的生平资料,而其图像资料则学要从“Photographs”中检索。
查找人物信息及其详细资料的途径多样方法各异,除上述主流途径和常用方法外,我们还可以利用论文数据库收录的论文多有作者姓名、性别、职称、单位、学术简介,同学录提供省市、学校、班级、姓名、性别、年龄等信息,博客展示个人多方面的动态信息的特性,获得简要的用于确认身份的个人信息。此外,还可以利用网页搜索引擎,以“XX人物(或名人”(XX为地区、学科或历史时期称谓,如“河南人物”、“河南名人”、“ IT名人”、“历史人物”、“三国人物”等)、“**传记”(**为GOOGLE通配符)等为关键词搜索出许多有关人物信息的网页和检索工具。再则,利用搜索引擎的互动问答平台,如百度知道(http://zhidao.baidu.com/)、雅虎知识堂(http://ks.cn.yahoo.com/)、YAHOO奇摩知识+(http://tw.knowledge.yahoo.com/)、爱问知识人(http://iask.sina.com.cn/)、YAHOO ANSWER(http://answers.yahoo.com/)等的“搜索答案/知识”、“search answer”(即查询已解答过的问题)功能,也是查找人物信息不可忽视的有效捷径。
我们应清楚地意识到,查找人物信息有不同的要求和目的,应根据具体的查询需求利用不同的工具,选择不同的途径和方法。“工欲善其事,必先利其器”,只有了解网络人物信息资源的分布规律,掌握基本的检索途径和主要的查找方法,才能有的放矢,一矢中的,一检即得。
参考文献
1、邢志宇.网络搜索中的检索式及其构建.科技情报开发与经济,2007(17):94-95
2、蔡绍莹.事实型数据库初探.情报学报.1990(5):360-370
(该文已在《河南图书馆学刊》2008年第二期发表)