- 0
- 0
- 约2.35千字
- 约 19页
- 2023-06-12 发布于四川
-
正版发售
- 1、本文档共19页,仅提供部分内容试读,阅读完整内容需要下载文档。
- 2、本内容来自版权合作机构,仅供个人学习、研究之用,未经授权,严禁复制、发行、汇编、翻译或网络传播等,侵权必究。
- 3、因数字商品的特殊性,一经售出,不提供退换货服务、不进行额外附加服务。
龙源版权所有
浅议统计语言学在作家语言风格研究中的实际应用作者:万晓雯来源:《现代语文》2018年第02期
摘要:统计语言学是应用统计数学的方法来研究语言现象的语言学科,研究领域广泛,学界常常运用统计语言学,通过分析语言单位的出现频率及作家的用词频率、词长分布和句长分布,确定作家的写作风格。通过“判定《静静的顿河》作者”“证明《红楼梦》是否出自一人之手”两个案例可以看出,统计语言学的研究方法在进入文学研究领域后,取得了非常好的实用效果。但是,在实际应用中,除了各类词汇等可控变量,还有其他潜在因素导致统计语言学的结论有时并非绝对精准。通过进行多方面、深层次地原因分析和推断,我们发现,要得到准确的研究结果,必须做好研究的前期准备,要选择具有相似语言环境的语料,要注意避开文学语言的形象思维影响,不能滥用统计语言学研究方法,并在操作过程中严格控制各种变量,以科学的思想指导研究。
关键词:统计语言学 语言风格研究 实际应用
作为大数据时代语言学研究的一个热点领域,统计语言学(statistical linguistics)属于数理语言学的一个分支,涉及语言学、计算机科学和数学等多个学科门类,是应用数理统计、概率論和信息论等统计数学的方法来研究语言现象的语言学科。
一、统计语言学的研究领域
相较于自然科学,人文科学的研究多涉及人(包括研究者本人)的大脑,因此很容易导致“自我中心性错误”和“内省性错误”。无论是过多地依赖本人的经验,还是过多地依赖自己的内省来做出判断,都会导致研究缺乏客观性与科学性,其价值是有限的。统计语言学则是倡导用科学的方法进行实验,进而得出结论,“特别注重语言本身的系统性和动态性特点,强调语言描写的真实性和精确性”。
从其研究内容看,统计语言学大致可分为语音统计学、词汇统计学、语法统计学和语义统计学,分别研究语言的语音、词汇、语法和语义的统计特征。从其功能看,统计语言学可分为描述统计与推断统计:描述统计的作用是对数据进行整理、归纳和总结,压缩数据,把握其一般性的特征和全貌;推断统计则是根据描述统计提供的结果,进一步对有关联系加以推断。
“统计语言学可用来发现语言学内在规律(词频与词排序之间的关系)、常用词和非常用词、词语搭配、短语获取、语言习得、语域变异以及作品风格分析等领域。”可以看到,统计语言学的研究领域广泛,但其中最主要、最熟稔的实际应用,当属通过语言单位的出现频率及作家的用词频率、词长分布和句长分布,确定作家的写作风格。统计语言学进入文学研究领域后,还催生出了另一个学科,即文艺风格学,一种应用现代语言学成果和技术来分析研究文学作品的边缘学科。如苏联学者用该方法研究赫尔岑、屠格涅夫的语言风格,国内也有人用这种方法研究巴金、曹禺、老舍等人的语言风格。
二、统计语言学与语言风格研究
黎运汉在《汉语风格学》中指出:“语言表现风格是综合运用风格手段的结果,从调音、遣词、择句到设格、谋篇等的风格手段,综合地反映在一篇文章、一部作品,或一种语体,或一个作家的作品,或一个时代的作家的作品,或一个民族的作家的作品里,这就从成了他们各自的表现风格。”换言之,语言风格的差异,正是由于作者使用特定语言单位的频率不同而造成的。于是,通过对语言结构特征的分析,我们可以比较直观地感受到不同文体与不同作者的风格,得出不同作者语言风格的同一性或区别性特征,而不仅仅是通过一系列描述型的论述,阐述文体或者语言风格问的差异。统计语言学的诞生,使语言单位的出现频率和分布数据变得重要,成为一种彰显作家语言风格的数学特征。
运用统计语言学判定作家风格的数学特征,其具体过程是:选取两位作家的公认代表作品作为语料样本,首先对样本进行分词处理,以文本为基本单位计算各类语言要素在文本中所占的频率和百分比,根据两个样本的平均值,比较语言要素分布是否具有差异。一般而言,为了测试数学统计特征是否能够有效辨别不同作家语言风格,还可以选用一个作家的其他作品为语料样本,计算该样本与统计所用语料样本的相关性。
鉴于其在判定作家风格方面的显著功效,统计语言学也被成功地运用到“作者考证”这个充满争议的研究领域中。在通过分析匿名文章的写作风格进而判定其真正作者方面,统计语言学也展现出了非常好的应用效果。以往,当某本名著的作者产生争议时,我们只能够凭借经验、历史文献和作家生平记录来进行考证。如今有了统计语言学,我们可以通过严谨的数据分析,提出更有说服力的证据。
三、实际应用案例
(一)《静静的顿河》的作者纠纷案
统计语言学最著名的实际应用,就是成功破解了文学史上关于《静静的顿河》的作者纠纷案。
《静静的顿河》在苏联文学史上占有较高的地位。此书全景式地描写了俄国内战时期顿河流域的社会景观,甚至有人将其与《战争与和平》等名著相提并论。然而自从《静静的顿河》
同期文章
- 独立学院语言学概论课程教学改革探析-《现代语文》(2018年2期).docx
- 字本位理论及其在对外汉语教学中的应用-《现代语文》(2018年2期).docx
- 近五年来日本留学生汉语学习偏误分析研究综述-《现代语文》(2018年2期).docx
- 语音实验技术在汉语语音教学中的应用-《现代语文》(2018年2期).docx
- 长句对汉英同传译文质量的影响及应对策略-《现代语文》(2018年2期).docx
- 模因论与互文性视闻下寒山诗的美国经典化进程-《现代语文》(2018年2期).docx
- 论汉语基本范畴词汇翻译的再范畴化-《现代语文》(2018年2期).docx
- “XX哒”的语用功能及其原因分析-《现代语文》(2018年2期).docx
- 从“国语罗马字拼音”与“注音符号第二式”看拼音系统的改进-《现代语文》(2018年2期).docx
- 网络流行语“打call”探析-《现代语文》(2018年2期).docx
您可能关注的文档
- 主持人话语中的间接言语行为研究-《现代语文(语言研究)》(2015年7期).docx
- 对网络笑话的批评性话语分析-《现代语文(语言研究)》(2015年7期).docx
- 网络合音语气词“哒”与方言“哒”-《现代语文(语言研究)》(2015年7期).docx
- 应用文语言中不合理口语化现象去除规律与方法研究-《现代语文(语言研究)》(2015年7期).docx
- 退货对话的语类结构潜势理论研究-《现代语文(语言研究)》(2015年7期).docx
- 云南芒市街道名称调查研究-《现代语文(语言研究)》(2015年7期).docx
- 浅议国际条约在法律英语中的语言特点-《现代语文(语言研究)》(2015年7期).docx
- 概念类别及其在汉英机器翻译中的应用-《现代语文(语言研究)》(2015年7期).docx
- 基于条件随机场方法的汉语专利文本介词短语识别-《现代语文(语言研究)》(2015年7期).docx
- 英汉文化中的“羊”及相关习语的翻译-《现代语文(语言研究)》(2015年7期).docx
龙源期刊网创建于1998年,是中国领先的人文大众期刊数字发行平台。全文在线的综合性人文大众类期刊品种达到4200多种,优质版权文章数量超过2500万篇,内容涵盖时政、管理、财经、文学、艺术、哲学、历史、社会、科普、军事、教育、家庭、体育、休闲、健康、时尚、职场等全领域。
文档评论(0)