您好,欢迎来到小奈知识网。
搜索
您的当前位置:首页论语料库应用于词典释义的优势和局限

论语料库应用于词典释义的优势和局限

来源:小奈知识网
龙源期刊网 http://www.qikan.com.cn

论语料库应用于词典释义的优势和局限

作者:黄芳

来源:《教育教学论坛》2013年第30期

摘要:基于语料库的词典释义新型途径是对传统释义方式的一种重要补充。本文对基于语料库进行词典释义的历史和现状研究进行分析,在此基础上阐述此类研究存在的优势和局限性。

关键词:语料库;词典释义;优势;局限

中图分类号:G2.0 文献标志码:A 文章编号:1674-9324(2013)30-0118-02

近年来,随着认知语言学的发展和各语言数据库的构建,基于语料库揭示语词的语义特征和词汇关系的研究受到学界的广泛关注,随之而兴起的是基于语料库进行的词典学编纂研究。语料库在现代被认为是词典编纂过程的必要组成成分,基于语料库的词典释义新型途径是对传统释义方式的一种重要补充。本文对基于语料库进行词典释义的历史和现状研究进行分析,在此基础上阐述此类研究的优势和局限性。 一、语料库研究概述

语言研究中的语料库是指以分析语言特征为目的而收集起来的文本集合。(Landau 2005:298),有一定的结构,有代表性,可被计算机程序检索,具有一定规模。(冯志伟 2009)。Sinclair(1991)认为,语言描述只有以自然语境中的真实语言为基础才能进行准确客观的描述。Biber等人(Biber,Conrad &Reppen 1998:3)认为,语料库分析研究的目的不是为了判断语言语法的正确性,而是为了通过大规模的语言现实数据来揭示语言使用的典型模式。Leech(1993:107)认为语料库语言学有如下特点:以语言的应用而不是语言能力为中心;以语言描写而不是语言普遍性为中心;以语言的定量及其定性模型为中心;以经验主义而不是理性主义的科学研究方法为中心。目前国际主流英语词典均采用语料库进行编纂,如Collins Cobuild词典采用Sinclair主持的COBUILD语料库,朗文ESL词典使用朗文语料库进行词典编纂,《牛津高阶学习词典》使用BNC语料库,《剑桥国际英语词典》使用剑桥国际语料库。此外,词典编纂也开始使用一些具有先进的检索分析工具和语法自动标注体系的语料库,如word sketch engine等语料库为语词提供了较为精确的词汇描述。 二、利用语料库进行词典释义编纂的优势

语料库应用于词典编纂研究主要存在以下几点优势:

1.提供更客观的语言事实。语料库能够用来发现相关的、核心的、典型的事实(如例证、搭配等),它全面展现了母语者使用语词的自然语境,而这种语境恰好是非母语者所缺乏的语感。语料库还可显示某一语词主要用于哪些语言变体或类别中,并给词典和语法书提供了语法

龙源期刊网 http://www.qikan.com.cn

信息的宝贵资源,更好地对每个义项进行释义,提供真实可信的合适例证。此外语料库提供的定量和定性分析也展示了更加直观、更加可靠和更加令人信服的辨析结果,有效避免了基于传统语义学理论视野的词典对词条语义分析与描述的片面性和主观性问题。

2.建立使用频率。语料库的词频统计可以辅助词典选词立目,帮助词典编者决定是否收录某个语词及其词形。常用词在大型语料库中的高频出现为词典编纂者收录高频词提供了现实依据。语料库还能凸显两个词的共现频率,确定常用的语词搭配和惯用法。

3.提高词典编纂效率。在计算机语料库建立之前,人们编纂词典往往采用卡片的方式费时、费力,低效地采集语料。一本大型词典往往要耗费多年才能出版。如今,计算机语料库的建立及便捷搜索工具的使用使得词典编纂者们得以在海量语料中提取词典所需的各种有效语言数据,缩短了词典编纂和出版的时间,提高了语料使用和词典编纂的效率。(章宜华 2012:1)

三、基于语料库进行词典释义编纂存在的局限和问题

1.共时语料库选取时段的问题。目前语料库的建设主要以共时为主。这里就存在一个共时语料库选取时段的问题。如果不能确定共时的时段,对词典编纂将会产生诸多问题。比如语词的时代标签的问题。某些语词多长时间被定义为过时?多长时间被定义为旧,都应该有一个标准。此外,随着时间的变化,某些语词的标签也会发生变化,如方言进入共同语词汇,经过一段稳定期,成为共同语的一部分。拿《现代汉语词典第5版》作为例子来说。该词典将“忽悠”一词标注为,然而笔者认为,该词标为更合适。词典的标签要考虑到历史的演变而及时进行更新,就要参考语料库。而语料库则存在一个时限的问题。如果收录50年以上的语料库,能否还被当成共时语料库?“忽悠”一词在50年中以方言的形式出现的频率多于共同语,而10年间以共同语的形式出现频率则更高。如果在50年以上的语料库中进行词典标签的标注,则会出现标注不准确的问题。

2.词典编纂选用真实语料的问题。词典编纂究竟是采用自撰例还是语料库的真实例子历来就有纷争。Landau认为,自撰例不是人们在实际生活中说的话,很多自撰例甚至从未使用过,对二语习得者来说更达不到习得真实语言的目的。因此,他提出在词典中采用真实语料比自撰例要好。然而真实语料也有缺陷。其一,真实语料受具体语境的,往往无法概括词义。其二,真实语料往往以语篇为单位,内容过长,对词条释义尤其是纸质词典的释义来说存在篇幅问题。第三,真实语料中的很多语词比被释义词难,学习者难以接受。因此,笔者认为使用修改后的真实语料更适合词典编纂实际。

3.语料库的代表性问题。即便是大型语料库,其所选的语料仍然有限,仅能反映某一时刻,大多数地区语言的真实情况。在选取体裁和文本类型时,也容易出现文本类型不均衡的情况,如没有早期文本的语料,书面语语料比例大大高于口语语料比例,语法标注不精确等局限性,样本的大小和数量以及时间跨度和地域分布的不均衡等等,不能完全真实地反映语言的千变万化的使用情况,甚至不具备某一语言的代表性。

龙源期刊网 http://www.qikan.com.cn

语料库的发展为词典编纂提供了新的研究范式和途径,但也存在不足,只有结合现代语言学及释义理论对基于语料库的词典编纂自动化进行深入研究,才能提高词典编纂速度和质量,提供二语学习者切实需要的语义信息。 参考文献:

[1]Biber D,Conrad S & Reppen S.Corpus Linguistics:Investigating Language Structure and Use,Cambridge Approaches to Linguistics[M].Cambridge University Press,1998.

[2]Sinclair,J.Corpus,concordance,collocation:Describing English language[M].Oxford:Oxford University Press,1991.

[3]Landau,Sidney I.,章宜华.词典编纂的艺术与技巧 第二版[M].夏立新,译.商务印书馆,2005.

[4]冯志伟.《语料库语言学与计算语言学研究丛书》序[C].北京:世界图书出版公司,2009. [5]章宜华.国际辞书现代化技术的新理念:辞书语料数据化[M].辞书研究,2012,(2):1-9.

基金项目:广东省教育厅高校优秀青年创新人才培育项目(WYM10033)

作者简介:黄芳(1975-),女,湖南长沙人,博士生,广东外语外贸大学,讲师,词典学。

因篇幅问题不能全部显示,请点此查看更多更全内容

Copyright © 2019- huatuo3.com 版权所有 蜀ICP备2023022190号-1

违法及侵权请联系:TEL:199 1889 7713 E-MAIL:2724546146@qq.com

本站由北京市万商天勤律师事务所王兴未律师提供法律服务