|
论普通话水平测试评分中的非客观
要因素及其解决对策
庆阳师范高等专科学校
苟芳琴 徐治堂
摘
要:普通话水平测试是对应试人掌握和运用普通话所达到规范程度的检测。应试人在测试中被评定的普通话等级应该是客观、可靠的。但普通话水平测试是一种口语测试,主观性很强,不同与于笔试中的选择题和是非题,评分难以客观、准确,常常出现较大的误差,降低了测试的信度。在评分中影响客观化的因素我们称之为非客观因素。本文主要谈谈PSC评分中出现的非客观因素的干扰及尽量减少这些因素的有效措施。
关键词:普通话
测试 非客观因素
中图分类号:H102
文献标识码:A
一、现行PSC评分中的非客观因素
(一)普通话口语水平的模糊性。
用量化分析的方法对应试者的普通话语音的规范程度作出判断,是普通话水平测试采用的基本方法。量化分析对音节正误情况分了三种类型:“正确”、“错误”、“缺陷”,但应试者发出的音节并非都与这三种类型一一对应。我们知道学习普通话的过程是从方言母语向民族标准语转变的过程,普通话水平测试面对的是一种过渡性的语音,在测试中我们所接受到的语音信息是错综复杂的。如复韵母的动程略大或略小、声调松紧调节过快致使阳平调值突然升高,音节长度不够、发单元音时舌部肌肉松驰,致使语言清析度差等一系列的问题。由于测试大纲在这一系列的问题上界定模糊或无标准可依,加之普通话测试工作极强的专业性,使得测试员在测试过程中对标准的把握宽严不一,测试结果也是五花八门。语音本身也是一个连续的模糊变量,我们很难对某一个语音做出正确、错误、缺陷的精确切分。另外语言能力毕竟是人的心理特征,语言本身具有模糊性,仅仅靠量化分析常常难以测出应试人的真实水平,所以《普通话水平测试大纲》中,除了一些量化的评分标准之外,还有一些模糊的评分项目,如朗读、说话项中的方言语调、语速、流畅程度、词汇、语法规范程度、语音面貌等。应该说《大纲》特意设立这些“模糊”评分项目是非常科学的,它可以弥补单纯量化的不足,使测试员对应试人的语音失误进行定量统计的同时,还可以在这些评分项中对那些一一对应的语言现象进行定性的分析,从而使测试成绩更具科学性。但“模糊”评分并不是“糊涂”评分,定性分析也应该有一定方面的量的分析作基础,这样才使测试员便于操作。我们无法要求每位测试员都是语言学家,但我们可以让测试员知道一定量的分析基础上应该得出一个什么样的定性结论,缺陷才“比较突出”、“比较明显”、“略有反应”。由于《大纲》缺乏这些依据,致使测试中朗读项方言语调的扣分以及说话项中语音面貌的档次划分标准不一,出现“糊涂“评分的现象。所以模糊评价同样需要“量”的支撑,尽管这种“量”是约略的。但离开了建立在模糊评价基础上的约略的“量”,应试者的普通话测试总分及等级,难以做到精确,当然也就谈不上客观公正了。
(二)心理素质的不稳定性。
现在的普通话水平测试为了保证判断的可靠性,减少误差,采取几位测试者同时测查一位受试者的办法,但这种“三堂会审”式的阵式,往往会增加受测者的心理紧张而导致水平失常。在测试中常遇到这种情形:考生在开始测试时上来就是“第一题读单音节字……”漏报单位、姓名、编号;测试第一、二、三题时漏读、误读现象大量存在,如把“拨”读为“拔”,把“瘸”读为“拐”,把“唱”读为“歌”,把“醋”读为“酸”把“儿女”读为“女儿”,把“巴尼”读为“尼巴”,眼里看得是“加把劲”,嘴里念的是“加把油”,说话时内容准备的很充分,但报完说话题目,脑子一片空白,出现语塞,甚至有个别考生呼吸急促手腿发抖,声音弱小,发音吐字不清晰,测试程序搞混,需要测试员多次提醒,这些现象都是心理紧张所致。应试者心理素质的不稳定往往会影响到测试员的态度、情绪,测试员对考生的厌烦态度和不满情绪会造成评分时的不公正。
(三)把握标准宽严的不一致性。
语言是多层次的结构体,不同层次(如地域层次、职业层次、年龄层次、文化层次等)的语用也具有不同的特征。一般说来,普通话水平测试的参照标准就是规范的汉语口语,但在实际的言语活动及测试中,由于需要和心态的不同,人们对这一标准的态度以及由此而来的行为和结果都不相同。比如,测播音员时的评分心态和测教师时的评分心态不同,测教师和测学生时的心态不相同,测毕业生和低年级学生时的评分心态不相同,测城里学生和测农村(方言区)学生的评分心态也不同。评分心态实际暗含着测试员对不同应试对象所需具备水平的心理预期,在这种不同心理的作用下,测试员在掌握评分标准时,也往往有不同的宽严尺度,这就很可能导致不同层次的应试人等分不等值,影响测试的客观公正与成绩的可比性。
(四)测试员构成的复杂性。
普通话水平测试具有“三细”的特点,音与音的区别十分细微,给分扣分数字相当细小,测试员听辨音和整个测评操作过程十分细致。显然,这就要求测试人员不仅要有比较丰富的语音知识,比较强的听辨能力,还要有足够的细心和强烈的责任感。也就是说,要有较高的思想素质和业务素质。如果测试员的素质不高,普通话水平测试也必定会失去应有的权威。基于此,国家三部委《关于开展普通话测试工作的决定》中,特意对测试员的任职资格作了许多明确规定,如“具有大专毕业文化程度和三年以上工作实践”“熟练掌握汉语拼音”“有较高的语音分辨能力”等。但普通话是水平测试,是一种专业性很强的大规模标准化考试,这项工作需要大量的测试员去担当“主考官”的角色。在现阶段这方面人才十分短缺的情况下,必然会出现测试单位降格要求,从而导致测试员素质参差不齐的状况,有些测试员自身口语水平有待提高,有些测试员缺乏基本的语音学知识,有些测试员对测试工作的性质认识不够,有些测试员思想素质低下,心态不够正常。这种种情况,必然会影响到普通话测试的客观与公正。
二、减少PSC评分非客观因素干扰的几点想法
(一)加强测试员培训与管理,建立一支高素质的测试队伍,
1、做好测试员的物色与培训。作为测试员仅仅能讲普通话是不够的,还应具有较高的语音学知识和较强的语音听辩能力,只有如此,才能够准确、公正地为应试者评分定级。现在国家语委培训测试中心及各省的培训中心对测试员的培训基本上是以培训测试能力为主,内容主要是熟悉《大纲》和测试实践训练,时间大多为两周,这种培训对于一部分有较高语音水平和较好语音听辩基础的测试员来讲,是符合“多快好省”原则的,但对于那些未受过正规语音学教育或口语水平有一定欠缺的测试员来讲,这种培训就显得很不够,如有些去参加省级测试员培训的教师连一般的汉语拼音能力都没掌握,两周之内,既要训练提高自己的口语水平,又要具备较高水平的一定语音听辨能力,即就是勉强拿到省级测试员资格证书,若不进行后续培训,那么在具体操作中进行量化评判时,能否达到科学公正就可想而知了。测试员在评分时,必须要迅速地对应试人所发出语音进行科学量化的评判,如果测试员没有一定的语音学理论作基础,这种听辨能力是很难具备的。可见,测试员必须掌握一定的语音理论知识。在现阶段,我们首先可以对国家级测试员采取严格资格审查的办法来解决问题。即将语音学知识和国际音标技能的考查放在测试员的资格审查考试之中,要求测试员在进培训班之前,必须具备一级乙等普通话水平,具备扎实的语音学基础知识和较强的国际音标记音能力,培训时则以强化他们的测评能力和对《大纲》的熟悉程度为主要目的。
2、通过科学的分级对测试员进行区分。现在的测试员只分为国家级和省级测试两个层次。作为主考的国家级测试员不论从口语水平还是从语音理论方面都应是高标准严要求的。而现阶段国家级和省级测试员除了在考核单位和年龄要求上有所区别外,考核内容及要求达到的标准完全相同。可以说,现在的测试员实际上都是一个等级,这显然不利于测试员的提高,也不利于测试单位对测试员的管理,比如可将国家级测试员定义为:一级甲等语音水平,中文专业大专以上学历,具备较强的国际音标记音能力和一定的语音学知识以及较高的语言政策水平。省级测试员可分为一级和二级,省级一级应具备一级乙等(94分以上)语音水平,接受过专业汉语语音学知识学习和国际音标记音能力训练,听辨能力较强,测试评分误差较小;省级二级测试员应具备一级乙等(92一94分)语音水平,熟悉《大纲》有一定的语音分辨能力,是测试员中的初级,也可认为是准省级测试员。省级一级测试员可参加PSC的直接评分,省级二级测试员可经过在PSC中至少一年的见习后由省测试中心对其测试能力再次进行考核,若达到省一级测试员方可参与PSC的评分。这样区分对待可促使测试员在工作上产生竞争激励机制,不断向新的目标探索进取,使测试员整体素质不断提高,对测试工作是极其有益的。
3、坚持对测试员的后续培训。经过培训考核取得测试员资格,只是获得测评技能的开始,要真正做到熟练掌握标准,判断正误准确,评分定级合理,主要靠在实践中不断提高。因此做好测试员的后续培训工作是目前亟待解决的问题,因此,省测试中心应每年分片集中培训测试员一两次,由语言专家和优秀国家级测试员组成督导组,针对测试工作中的问题,帮助测试员从理论上和操作上进行探讨,提高业务能力。对任期三年的测试员重新对其测试能力和口语水平应重新分级进行考核,考核合格的续聘,不合格的解聘。通过考核实行续聘、解聘政策,可促使测试员保持一种动态向上的状态,对测试工作是大有裨益的。
(二)加强测试理论研究,加强PSC的可操作性。
PSC评分中非客观因素的干扰,一方面是由于PSC是口语水平测试,语音本身的模糊性和语音识别的复杂性,使评分中的主观性不可避免,只能依靠提高测试员的水平来尽量减少其所带来的影响。另一方面则是由于《大纲》没有一个较详的评分细则,测试中遇到的大量的形形色色的问题,测试员在《大纲》中找不到评分依据,于是凭自己对《大纲》精神的理解来评分,这就增加了评分中的主观性。如朗读测试项中的“方言语调”扣分项,首先大家对“方言语调”这个概念的理解就有很大的差异,有些人认为它包含“方言色彩”和“语气语调”两层含义,有些人则认为它就是指“方言色彩”,还有人认为它专指方言色彩的声调一~这种认识上的分歧必然带来评分中的混乱。又比如“说话”项中的语音面貌,虽然《大纲》为了操作方便,用量化分析的方法设计了六个档次,但由于对每一档的语音面貌的描述不很清晰,测试员在评分时此项分的误差率较高,当然,这两个评分项目作为《大纲》有意设立的定性分析项,应让测试员有一定的自由度,但定性分析并不排除用定量兮析的方法来提供依据,对于“方音明显”“方音比较明显”“方音不明显”应该有一个接近量化的界定,比如可依据有没有出现成系统缺陷或错误、成系统错误或缺陷的社会认知程度怎样等因素来判定。
(三)顾及方言区别,实行分级报考。
进行普通话水平测试,自然只能以“普通话”作标准,不可能有第二个标准。从目前测试的情况来看,反映比较突出的问题都集中在测试员评分标准的把握宽严不一上。这种宽严除反映在不同的测试员把握标准的不同外,那么同一个测试员测试不同的人群也会出现明显的宽严不同。如我在近几年的测试中,对来自城里的普通话水平较高的学生,基本上本着“从严从细“的原则,尤其是对字音准确度和朗读说话项中流畅程度的要求,比一般水平学生要高得多。相反对来自方言区尤其是静宁、庄浪等地的学生,为了不挫伤他们学习普通话的积极性,在单双音节的测试中对于ai
ei uai uei这四个韵母只要从听感上能区分就算正确;能用前元音鼻化和后元音鼻化来区分前后鼻尾韵母的只记作有缺陷。从理论上讲这种评兮的不同是不应该的,但从测试的实际情况来看,这种把握标准宽严不一是不可避免的。基于此我认为,开展普通话水平测试应当在坚持一个标准一种尺度的前提下,顾及方言区别。对于不同方言区,应在研究方言特点的基础上分别提出不同的标准。即使是对相同类型的人(比如师范生,教师),也可考虑因方言区的不同而提出不同的标准。除了面向全国的影剧演员、播音员提出统一要求外,不必“一刀切”。这样做,或许会比较公平,也较能激发方言区学习普通话,逐步争取升级的积极性。另外,我们建议普通话水平测试改为分级报考,即应试人可根据自己的普通话水平选择一、二、三级分别报考,测试单位在组织测试时,可分别选派不同等级的测试员主持不同等级的测试,测试员在评分标准的把握上也便于掌握分寸,使普通话水平测试更加公平合理,推普工作更加科学有效。
(四)加强考生考前培训,培养其良好的应试心理。
普通话水平测试与常规的书面语相比,需要应试者具备好的心理素质,不能怯场。如何克服心理障碍,使学生具备良好的应试素质,基本原则有二:一是端正应试动机,二是控制增强兴奋度的各种刺激。在平时的模拟训练中,应通过学生运用情境心理适应、角色心理适应以及默想脱敏等方法,做到从容、自然、顺畅、得体地讲话。平时可采用面对众多同学练口才、练胆子的方法,形式多种多样,有朗读、朗诵、讲故事、复述、介绍风土人情、一事一议、即兴说话等。起初练习,上台后可能目光呆滞,不敢与别人对视;或面红耳赤,呼吸急促,手腿发抖,但通过反复训练,便能够克服以上不良的心理反应,提高自我控制能力,并能使自己的口语水平得到提高。克服学生心理紧张的另外一个因素是测试员在测试时对应试者的态度要亲切平和,要端正自己的工作作风,本着对考生负责的态度克服对考生的厌烦、不满情绪,培养自己的耐心,尽量做到测试评分的客观与公正。另外、我们建议,省测试中心统计一下三人测试、二人测试和一人测试在准确性上有多大差别,优选合理的主试配置,不但以比较少的人力得到正确的测试结果,而且为考试者提供一个利于发挥自己水平的测试环境。
普通话水平测试是一顶开创性的系统工作。对模糊的口语要做出精确的界定本身就是一项难度极大的工作,加之我国幅员辽阔,方言复杂,在全社会范围内推行这大样规模的测试,需要广大语文工作者的共同努力。本文谈了一些在近几年的PSC评分中遇到的问题和不成熟的建议,恳请专家同仁指正。 |