语料库与基础英语教育(1)
2017-08-06 02:41
导读:英语论文论文,语料库与基础英语教育(1)样式参考,免费教你怎么写,格式要求,科教论文网提供的这篇文章不错:
摘 要: 本文简要介绍了语料库的概念,强调了标注语料库在语
摘 要: 本文简要介绍了语料库的概念,强调了标注语料库在语言教学中的用途,并用大量的语言证据从词语搭配、词类搭配等方面说明语料库对基础教育的意义。同时,文章提出了应加强基础教育领域的语料库研究,使语料库能在该领域内发挥更大作用,促进我国
英语基础教育进一步发展。
关键词:语料库;英语基础教育;语料库应用
一、语料库的概念
语料库的使用早在几百年前就开始了(Kennedy 2000: 13-15)。但是,过去的“语料库”是非计算机操作,人们把需要的句子抄在卡片或纸条上,然后对其检索。所以,这种现象我们只能称之为语料库方法,而非现代意义上的语料库。
有人把语料库定义为语言材料的仓库,该定义远远不能说明语料库的特征。
语料库以计算机检索为手段。计算机有一个强大的检索功能,这是人所不及的。语料库中聚集了大量文本,而计算机对任意大的语料库进行检索易如反掌。所以,有人认为术语“语料库语言学”应为“计算机语料库语言学”(Leech 1997: 1)。
语料库文本的收集是按照某些原则进行的。英国国家语料库(British National Corpus,以下简称BNC)的书面语占总库的90%,口语占10%,整个库的结构如表1所示。Brown语料库不包括口语,书面语的收集方法和BNC有很大不同,其结构见何安平(2004:141-143)。BNC的文本长度参差不齐,长的达436 048个单词,短文本只有25个单词;而Brown把文本的长度固定在2 000词左右,超出则删除。LOB(与Brown结构相同)语料库的文件长度平均为2 013单词左右。
表1BNC文本结构信息语域总码数文档总数形符数
applied science7 104 6363707 424 216
Arts6 600 7412636 939 259
belief and thought2 972 6651453 087 156
Commerce7 257 5292957 565 415
Imaginative16 386 48647717 548 572
Leisure12 139 85343712 662 241
natural sciences3 784 2731463 934 819
social science13 906 17752714 482 806
Spoken10 341 72991010 425 409
world affairs17 116 37748317 870 882