江淮rs1.5报价以及图片:BYU-BNC使用手册(中文)

来源:百度文库 编辑:中财网 时间:2024/05/09 01:48:44

杨百翰大学BNC语料库使用说明

 

目录

1.免费语料容量... 2

2. 主要搜索功能... 2

2.1 搜索wordsphraseslemmaswildcards和其他更加复杂的字词... 2

2.1.1 输入单词... 2

2.1.2输入词组... 3

2.1.3 输入通配符... 3

2.1.4输入lemma(即一个单词的单复数、时态等所有形式)... 3

2.1.5 输入某种词性且部分带有某些字母的命令... 4

2.2 搜索搭配词和出现的频率... 4

2.3 搜索在字数据库(register)(或之间)出现的频率(或比较) 5

2.4 进行语义倾向比较... 6

2.4.1 比较近义词... 6

2.4.2 比较反义词... 6

2.4.3 搜索近义词... 6


Website: http://corpus.byu.edu/bnc/

 

 

杨百翰大学BNC语料库简介:

 

1.免费语料容量

通过这个网址,可以搜索到100 million词的British National Corpus (1970s-1993). (当然现在Corpus of Contemporary American English(1990-2009)能在线免费提供 400+ million 词,在线网址为:http://www.americancorpus.org/)

 

2. 主要搜索功能

2.1 搜索words、phrases、lemmas、wildcards和其他更加复杂的字词

2.1.1 输入单词“mysterious” (2.1.1-1)

得到相关结果(2.1.1-2)

若对图2中的相应条块进行点击,那么就可以看到KWIC,如图2.1.1-3 (以点Fiction的条块为例)

 

 

(图2.1.1-2

(图2.1.1-1

(图2.1.1-3

 

 

 

 

 

 

 

 

 

 

 

 


2.1.2输入词组“white+名词 (2.1.2-1)

     得到的结果都是white后面跟的名词短语 (2.1.2-2)

 

(图2.1.2-2

(图2.1.2-1

 

 

 

 

 

 

 

 

 

 


规则:输入名词的话用正则表达式: [n*];动词: [v*]; 形容词: [aj*]; 副词: [av*]……

 

 

2.1.3 输入通配符(wildcards),如分别输入un*lyr?n*,结果如图2.1.3-1.2.1.3-2

(图2.1.3-1

 

 


(图2.1.3-2

 

 

 

 

 

 

 


2.1.4输入lemma(即一个单词的单复数、时态等所有形式),若要得到sing这个单词的所有形式,可以如下图所示(图2.1.4-1

 

 

 

 

 

 

(图2.1.4-1

 


规则:若要得到某个单词的所有单复数和时态形式,那么就要在输入时,在这个单词外加 [ ]

 

2.1.5 输入某种词性且部分带有某些字母的命令,如要得到以un-开头、-ed结尾的所有形容词的所有形式(见图2.1.5-1)和得到动词+任何词+ground的所有词组(见图2.1.5-2:

(图2.1.5-1

(图2.1.5-2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 


规则:若要得到某种词性且词中带有部分带有某些字母的形式时,如要得到以un-开头、-ed结尾的所有形容词的所有形式,那么输入: un*ed.[aj*];若要得到动词+任何词+ground的所有词组,那么输入: [vv*]*[ground]即可。

 

 

2.2 搜索搭配词和出现的频率

“thick后跟的名词(图2.2-1

                                  (2.2-1)

规则:在context里输入[n*] 后选择4,表示在thic4后面(4跨距范围内)出现的任何名词

 

如跟在 “smile前面的形容词(图2.2-2

                                 (2.2-2)

规则:在words里输入: smile.[n*],表示作为名词的smile context里输入: [aj*]表示其前后出现形容词的语境。

 

 

2.3 搜索在字数据库(register)内(或之间)出现的频率(或比较)

如在FictionNewspaper子数据库中passionate后面可以跟任何名词的词及频率,分别如两图(2.3-12.3-2)

 (2.3-1)

(2.3-2)

 

但是也可以之间对两者子数据库中它们出现频率的对比,操作:分别选择section 1&2,如下图(2.3-3)

(2.3-3)

 

 

2.4 进行语义倾向比较

2.4.1 比较近义词

如:近义形容词hotwarm后面所跟名词的区别(如图2.4.1):

(图2.4.1

规则:在words的方格里分别输入hotwarm,再在context方框里输入[nn*],表示后面所跟任何名词。当然也可以比较在某个子语料库中出现的频率比较。

 

2.4.2 比较反义词

如:womanman前面所跟的形容词的区别(如图2.4.2

(图2.4.2

规则:在words的方格里分别输入womanman,再在context方框里输入[aj*],选在左3,表示前面3个跨距内所有的形容词。当然也可以比较在某个子语料库中出现的频率比较。

 

2.4.3 搜索近义词

如:搜索beautiful的所有近义词(如图2.4.3-1

(图2.4.3-1

规则:在words的方格里输入[=beautiful],表示和beautiful语义相近的所有形容词。

再如:搜索动词clean的所有近义词,如下图:

(图2.4.3-2

当然可以进一步搜索与clean语义相近的动词+the+名词的词组,如下图:

(图2.4.3-3