归一云思
主页网络文摘杂文
文章内容页

基于法语新闻语料库的语言能力评价

  • 作者: 长江丛刊
  • 来源: 归一文学
  • 发表于2023-11-09
  • 热度17739
  • ■张 驰/扬州大学

      “corpus(语料库)”来自于拉丁语,与法语单词“corps(身体)”为同一词源。根据《新编小罗贝尔法法词典》的定义,“‘语料库’在语言学上意为‘针对某一语言现象研究而汇集的有限的话语集合’”。

    一、法语语料库的发展

    美国布朗大学于1961年建成了当今最早的机读语料库——布朗语料库。在此期间,法国的语料库也迅猛发展起来了。法国最早使用机器对词汇进行编译的语料库是五十年代初期由贝纳尔·克马达在法国贝桑松建造的。

    (一)法国的法语语料库

    1971年至1995年间,法国全国科研中心决定召集语言学家和词典编纂专家,编纂一部旨在反映20世纪法国语言研究水平的大型语文词典——“法语宝典”,共计十六卷,每卷约一千四百页,收录九万词条。该大型词典是世界上最早运用计算机技术编成的。

      1992年,法国语言研究所为辅助了“法语宝典”的编纂工作,也为了给查询作品原文和摘录例句提供便利,建立了法国最大的语库——法兰西语库。这个大型语料库的建立经过几十年不断地完善,目前已建成了三个资料库,分别是:文本库、词语库和书目库。

    (二)国内的法语语料库

    但在国内,法语语料库语言学还是一门相对年轻而陌生的学科,相关的研究非常少,更没有规模稍大的法语语料库。在中国知网上搜索主题为“法语+语料库”的论文仅27篇;而搜索关键词为“法语+语料库”的论文,仅有3篇,分别为:《基于语料库的法语语言能力评价》、《产出导向法在词汇教学中的研究与实践——以汉法语物量词为例》、《一类基于平行语料统计的汉法机译解决方案》。因此,法语教学面临的问题是如何建立用于课堂教学目的的语料库。自建法语新闻语料库不仅可以充分考虑教学对象的需求;还能适应新闻的发展,及时更新。何安平教授也指出“建设大型语料库已经不再是困难的事,接下来的是如何建立各种有地域、语体乃至语篇特色的大型语料库……。”

    二、法语新闻语料库的建立原则

    法语新闻语料库的建立应依托于主流法语新闻报刊,能反映真实的法语世界。新闻语言相较于文学语言能最快速、最忠实地展现法语语言发展的潮流,尤其法语词汇的变化。新闻报道的主题涉及各个领域,具有极大的研究价值,是最好的语料来源。为辅助法语新闻教学,可建立一个小型的法语新闻语料库,为判断学生的语言水平提供研究工具。法语新闻语料库的建立要遵循以下原则:

    (一)采集有代表性的语料

    采集语料是语料库建立的第一步,也是最为重要的一步,因此,语料库的采集和筛选工作要遵守一个基本原则:语料应具有代表性。由于本次建立语料库的目的是检测法语学生的法语新闻领域的语言能力,所以要选取法语报刊。因此,本次抽样的范围来自以下法语主流报刊:《世界报》、《费加罗报》、《法兰西晚报》、《解放报》、《巴黎人报》;主要周刊如《快报》、《观点》、《新观察家》、《巴黎竞赛画报》等。法语新闻题材广泛,涉及到众多的领域,为保证语料具有较高的代表性,在建设语料库时,主要采用了具有代表性的主流报刊上的头条新闻,并将其分为政治、经济、历史、地理、文化、科技、社会和娱乐共8个领域。再通过分层抽样和等距抽样的方式确保语料具有代表性。

    (二)定期更新语料库

    新闻是一种时效性很强的语言,每年都会出现大量的新词。因此,为适应语言的变化,保证语料库的代表性,必须不断地更新,每个季度需重新收集新的语料,每年删除已失去语言活力的语料,确保该语料库具有使用价值。

    (三)利用较新的软件分析数据

    AntConc3.3.4w等分析统计软件是目前大家普遍使用的数据分析软件,适用于法语语料库的研究。通过此软件,将新建的小型法语新闻语料库进行法语词频统计,总结出法语新闻中常用的词汇和搭配习惯等,建立词汇表。之后,将词汇表中的词汇和固定搭配按使用频率和难易程度分为四个等级。在分析学生语言能力时,可参考词级分布率判断学生的语言能力。

    三、法语新闻语料库在教学中的应用

    该语料库可从以下几个方面辅助法语教学:

      (1)词汇教学:将统计得到的词汇表逐级教给学生,扩大学生在新闻领域的词汇量。

      履职活动在“家”中。定期举行住泰全国人大代表小组和市直省人大代表小组代表经验交流会、履职研讨会、专题座谈会,为代表相互沟通交流搭建平台;建立代表履职档案,进一步增强代表履行职责的责任感和使命感。

      (2)语篇教学:通过软件分析,找出语言使用较好、题材具有代表性的新闻,作为法语新闻教学的素材。

      (3)评估学生:通过对比学生的新闻稿和分级词汇表,客观且准确地评估学生法语新闻的撰写能力。

      为评估学生的法语新闻撰写能力,利用通过自建小型法语语料库得到的分级词汇表和计算机程序提供的词汇总量、实际词汇量、词频和词级分布率等信息,来分析学生的语言能力。为准确定位来自不同班级学生的法语水平和同一学生的语言能力提高情况,可通过横向和纵向两种组合方式,对相同的学生或班级在不同时期所写的法语新闻稿进行比较、以及不同的学生或班级在同时期所写的法语新闻稿,对新闻稿中使用的词汇进行测量,评价学生掌握和运用法语词汇的能力。

      在研究过程中,仅仅只考虑词汇总量、实际词汇量、词频和词级分布率等信息是不够的,为保证词汇量测量的信度和效度,在采集学生的新闻稿时,还应统一新闻稿的题材、体裁、字数等词汇量以外的因素。以下是几个研究实例:

      实例1:两届学生同一时期的新闻稿对比

      两组学生各8名,新闻稿各40篇,分别选自14级和15级学生大三下学期所写的新闻稿。从实际词汇量分析,15级学生新闻稿中的一级词汇分布率比14级低1%,二级词汇分布率比14级高2%;而三级四级词汇分布率,两组学生同为7%和10%。由此推测,关于已习得的新闻词汇,14级和15级学生在他们大三下学期的水平是持平的。

      实例2:同班同学同时期的新闻稿对比

      A同学和B同学同时15级法语班的学生,在大三下学期各写了5篇新闻稿。A的新闻稿不仅词汇总量高于B,而却实际词汇量也高于前者,A新闻稿中的一级词汇分布率比B低7%,二级词汇分布率比B高1%;而三级四级词汇比B高2%和3%。由此推测,关于已习得的新闻词汇,A和比B水平略高。

      实例3:同班同学不同时期的新闻稿对比

      样本是15级20名学生分别在17年5月和17年11月的法语新闻社撰写的。第二篇新闻稿(1711)的词汇总量明显高于第一篇(1705);相反1705的实际词汇量却比1711高;而且二级词汇和四级词汇分布率比1711高出1%和2%。因此,可以得出结论:同班同学不同时期的在新闻领域的语言能力是不同的。

      实例4:同一学生不同时期的新闻稿对比

      样本是15级B同学每三个月所写的新闻稿。这三篇新闻稿的二级、三级和四级词汇分布率都在逐篇递增,而一级词汇分布率却逐渐降低,这些数据表明同学法语新闻稿的撰写能力在9个月中是持续增长的。

      综上所述,我们可以得出以下结论:

      (1)词汇量:尤其是实际词汇量是语言能力的代表性因素之一,如果词汇量越大,那么就表明语言水平越高。

      (2)词级分布率:学生对不同词级词汇的使用情况基本能反映出学生的词汇习得能力,通常高级词汇使用率高的学生拥有和掌握了更多的活跃词汇。

      (3)分析统计软件:法语词汇的分析统计软件为法语水平的量化提供了便捷、客观的工具,利用这些软件可以对法语新闻教学做定期监测,了解学生法语新闻稿撰写能力的提高情况,甚至可以有针对性的进行法语新闻教学,查漏补缺。

    四、结语

    英国著名语言学家、语料库语言学专家约翰·辛克莱曾经说过:“语料库语言学已经成为英语语言学的重要方面……不仅如此,语料库也为语言教学带来许多的思想和方法。”而这一阐释也同样适用于法语语料库,建立法语新闻语料库有利于教师及时掌握学生的水平变化,在教学中有的放矢的提高学生的语言能力。

      

      本文标题:基于法语新闻语料库的语言能力评价

      本文链接:https://www.99guiyi.com/content/1043958.html

      深度阅读

      • 您也可以注册成为归一的作者,发表您的原创作品、分享您的心情!