关键词:高校科技创新模糊积分能力评价
高校科技创新能力是指高校创新系统的主体,通过整合高校内外的一切可用资源,不断促进高校基础理论研究和新兴科学理论发展的综合能力。高校科技创新能力已经成为衡量一个国家基础研究和高科技前沿领域原始性创新能力的重要标志、衡量高校竞争力的关键因素,高校科技创新是高校发展的根本动力。因此,研究高校科技创新能力对于提高高校的竞争力和推动高校的发展具有重要的理论意义和现实意义。
对于高校科技创新能力评价研究,国外的学者主要反映在院校评估与绩效评估中,如McGuire等人对科研型高校生产效率与信誉的研究。国内学者对高校科技创新能力评价进行了大量的实证研究并取得了丰富的研究成果,如王章豹、徐枞巍等在剖析高校科技创新能力及其构成要素的基础上,构建了高校科技创新能力量化综合评价指标体系,同时提出了综合评价的模型与方法;王光平、金浩建立了高校科技创新评价的指标,并运用因子分析法对高校科技创新能力进行实证分析。国内外学者对高校科技创新能力评价的研究可谓硕果累累。
一、高校科技创新能力评价指标体系的构建
1.高校科技创新能力评价指标体系构建原则
2.高校创新能力指标体系构建
二、高校科技创新能力的评价方法
美国控制论专家L.A.Zdahe于1965年首先提出了模糊集合理论(fuzzysettheory),1978年又进一步提出了与模糊集合理论相辅相成的可能性理论,随后模糊理论迅速发展,并在数理、经济、人文、工程等方面有了广泛应用。本文根据高校科技创新能力评价问题的特点和要求,借鉴已有研究成果,使用模糊积分评价高校科技创新能力。模糊积分综合评价方法的具体步骤如下:
1.模糊积分评价指标值的确定
(1)人力资源流。人力资源流包括教师流量以及高校科研吸引人才的能力两个方面:高校教师资源流量QM,指高校获得的师资数量;高校科研吸引力FM,指高校吸引人才的能力。
(2)财力资源流。财力资源流包括流入高校的资金总量以及高校对资金的吸引力两个方面:财力资源流量QY。指高校吸引的投资总额;财力资源吸引力FY。指高校吸引资金投资的能力。
(3)物力资源流。物力资源流包括流入高校的设备等物质总量以及高校对物力的吸引力两个方面:物力资源流量QR。指高校吸引各种设备、仪器、图书等投资总量或总额;物力资源吸引力FR。指高校吸引教育教学设备、仪器、图书等物质的能力。
(4)人才培养流。人才培养流包括高校向社会培养输送的各级各类人才以及高校人才培养对社会的吸引力两个方面:人才培养流量QP。指高校人才培养总流量;人才培养吸引力FP。指高校人才培养对社会的吸引力。
(5)科研成果流。科研成果流包括高校输入输出的科研成果总量及其吸引力两个方面:科研成果流量QA。指高校科研成果,促进科研成果的转化和应用;科研成果吸引力FA。指高校科研成果对社会的吸引力。
(6)社会服务流。社会服务流包括高校为社会经济服务所做出的贡献以及由高校的贡献作用所产生的吸引力两个方面:社会服务流量QT。指高校通过人才培养和科技推广为社会经济各个领域提供的所有服务;社会服务吸引力FT。指高校人才培养对社会的吸引力。
2.基于模糊积分评价法的高校科技创新能力估算
(1)高校教师变动的估算。高校教师的变动包括专任教师的自然增长率(主要是反映教师离退休的负增长率)和流入与流出。设为在一年内从高校外流入系统内的教师数量,为在一年内从高校内流出系统外的教师数量,πi为高校教师自然增长率,Ti为高校教师总数量。则有高校教师数量的变化为dQMi:
(1)
(2)高校教师资源吸引力参数的估算。设FMij为高校对社会系统人力资源(教师)的吸引力,FMji为社会系统对高校人力资源(教师)的吸引力,为社会系统对所有人力资源的吸引力之和。由于吸引力和流量(密度)成线形关系,因此,从高校外流入系统内人力资源(教师)QMij为:
(2)
(3)高校教师负熵流的估算。根据已被广泛用于社会经济领域的熵变的原理,熵流变化可以通过力与流的乘积表示,可得从高校外流入系统内的人力资源(教师)带来的负熵:
(3)
根据以上分析,运用同样的方法可以求得高校科技创新能力中的财力资源流、物力资源流、人才培养流、科研成果流、社会服务流。对于高校科技创新能力的不同发展阶段,需要运用模糊积分方法分别估算各自的负熵流及其对应的吸引力。而吸引力参数通常采用学校横截面数据获得。然后,可求得高校科技创新能力值Hs。
三、结论
本文构建了一套系统、量化、适用的高校科技创新能力评价指标体系。根据高校科技创新的实际情况,结合模糊积分评价方法提出了基于模糊积分的高校科技创新能力综合评价方法。认为高校应建立有利于连接主客体的科技创新环境,立足地方科技发展,增强科技创新人财物支持能力、人才培养能力,提高科技成果转化率和社会服务能力,并通过机制创新促进科技创新,增强高校科技创新能力。
参考文献:
[1]王章豹,徐枞巍等.高校科技创新能力综合评价――原则、指标、模型与方法[J].中国科技论坛,2005,2:55-59
[2]王光平,金浩.基于因子分析的高校科技创新能力的实证研究[J].河北师范大学学报(哲学社会科学版),2008,4:48-51
【关键词】城市科技创新专利因子分析
一、引言
二、城市科技创新能力评价模型的构建及实证研究
(一)专利视角下城市科技创新评价指标体系的确定
本文通过对国内有关专利评价指标体系文献资料的调研,以城市科技创新体系构成要素为基点,在遵循科学性、实用性、可操作性和指导性原则的基础上,立足于专利数量、质量和价值层面,构建专利视角下城市科技创新能力评价体系(见表1)。
(三)对样本数据进行实证分析
通过因子分析可以看出,选取特征值大于1的四个因子,就可以很好地代表17项二级指标。
签订技术项目数量和签订技术金额这2个指标在第四个因子上载荷比较大,可以将第四个因子命名为市场价值因子,即F4代表着市场价值因子。
各个因子计算公式如下:
(四)综合评价分析
综上所述,根据所得结果,然后加上四个因子的方差贡献率得表达式:(45.071*FAC1-1+19.352*FAC2-1+10.835*FAC3-1+9.980*FAC4-1)/85.237
就可以得到综合评分,外加上四项因子的得分,见表6。
三、结论与建议
通过上述排名可知,合肥市以总分0.32的得分排在了第一位,这说明合肥市在中部六省会城市中的科技创新能力最强,其次是长沙市、武汉市、郑州市、南昌市、太原市。太原市以总得分为-0.84的排名排在了第六位,这说明太原市的科技创新能力在中部六省会城市中是最差的,这主要跟以下几个方面有关系。
(一)科技创新意识
(二)科技创新发展速度
(三)科技创新潜力
(四)市场价值
签订技术项目数量和签订技术金额这2个指标反映着市场价值,代表着专利成果转化价值,而太原市的这项排名排在了中部六省份的最后一名,可见太原市专利转化成果还需要加强。
通过以上结论可以就如何提高太原市的科技创新能力提出相应的建议:1.太原市应该加大投资力度,提高太原市的科研机构、高校以及高新企业进行专利申请工作的重视,还要鼓励在校大学生进行专利的申请,进而提高专利的申请意识;2.政府应该通过设立奖金的方式来激发科技成果转化率,使得更多的专利技术应用到社会中去,从而创造社会价值,进而促进太原市的科技创新能力;3.政府应该鼓励发展专利中介服务机构,并搭建新的产学研协同创新平台,引导金融机构对专利技术项目给予信贷支持,这样就更能促进太原市科技创新能力的快速提升。
参考文献
[1]吴自斌.科学技术是政治文明发展的不竭动力[J].学海,2005(2).
[2]熊彼特.经济发展理论[M].北京:商务印书馆,1990.
[3]高洪深.区域经济学[M].北京:中国人民大学出版社,2002.
[4]杨华峰,邱丹,余艳.创新型城市的评价指标体系[J].统计与决策,2007,(6).
[5]金吾伦,李敬德,颜振军.北京如何率先成为创新型城市[J].前线,2006,(2).
[6]杨冬梅,赵黎明,闫凌州.创新型城市:概念模型与发展模式[J].科学学与科学技术管理,2006,(8).
[7]王仁祥,邓平.创新型城市评价指标体系的构建[J].工业技术经济,2008(1).
[8]石忆邵,卡海燕.创新型城市评价指标体系及其比较分析[J].中国科技论坛,2008(1).
[9]惠宁,谢攀,霍丽.创新型城市指标评价体系研究[J].经济学家,2009(2).l
[10]吴二娇,刘Z.广东省科技创新效率与经济增长的实证研究[J].科技管理研究,2009(7):215-217.
[11]徐小钦,黄馨,梁彭勇.基于DEA与Malmquist指数法的区域科技创新效率评价-以重庆市为例[J].数理统计与管理,2008(6):974-985.
[12]于成学.中国副省级城市科技创新效率评价与实证[J].科技管理研究,2010(1):61-63.
关键词硕士研究生科技创新能力灰色理论
中图分类号:G644文献标识码:A
EvaluationoftheScienceandTechnologyInnovationAbilityof
GraduateStudentsBasedonGreySystemTheory
WUZejiu
(DepartmentofMathematics,SchoolofScience,EastChinaJiaotongUniversity,Nanchang,Jiangxi330013)
AbstractFollowingthecomprehensive,scientificandoperationalprinciples,weconstructindicatorsofevaluationandconductthecomprehensiveevaluationonthescienceandtechnologyinnovationabilityofgraduatestudentsbyusingthegreymodel.AndwefindthekeyfactorswhichcontrolabilitypromotiontoprovidereferencewhenUniversityadministratorsformulaterelevantpolicies.
KeywordsGraduatestudents;scienceandtechnologyinnovationability;greysystemtheory
1高校硕士研究生科技创新能力评价指标体系的构建
硕士研究生科技创新能力是多因素、多指标的综合反映。充分借鉴多元智能理论,结合社会对创新型人才培养的需求,遵循全面性、可操作性、科学性原则,对硕士研究生科技创新能力指标体系进行分解,咨询十多位专家意见的基础上,经反复筛选与整合,最终构建了由5个评价模块(一级指标)、14个评价指标(二级指标)构成的硕士研究生创新能力综合评价指标体系,见表1。
表1高校硕士研究生科技创新能力评价指标体系
2高校硕士研究生科技创新能力的灰色评价模型
2.1确定参评数据序列和标准数据序列
对于高校硕士生科技创新能力评价,本文选用的评价指标体系由5个一级指标和14个二级指标组成,每所高校所对应的14个二级指标的评价数据形成一个参评数据序列。设有所学校,则参评数据序列描述为:
={(1),(2),…,(),()}
其中()表示第所学校的第个指标。以参评序列中的最优值作为标准数据,构成一个标准数据序列,记为:
2.2初始化处理
评价过程中,由于评价指标的量纲不同,数据在数量上差异性很大,无法进行关联评价计算,需对各指标的数据进行归一化处理。归一化处理模型为:①
()=,=1,…,,=1,…,
2.3计算灰色关联系数
定义标准数据序列中的任一指标数据()与参评数据序列中对应的指标数据()的灰色关联程度,即灰色关联系数()为:②
其中为分辨系数,为提高灰色关联系数间的差异显著性而人为给定,取值范围为0.1~1.0,一般取0.5。
2.4计算灰色关联度
因为关联系数()数目较多,信息不集中,不能够进行单元比较,为此将对其取平均值,定义此平均值为与序列之间的关联度,即=()。
3高校硕士研究生科技创新能力实证分析
3.1建立原始数据表
笔者选取南昌市5所高校A,B,C,D,E,并邀请高校行政管理人员,教师、在校硕士生进行打分和测评,所得数据取平均值,见表2。
表2高校硕士研究生科技创新能力评价指标及其数据
3.2对定性指标量化处理及初始化处理
采用以下赋值将定性数据转换为定量数据,由于主要讨论的是各评价学校的相对创新能力,因此转换不会改变评价结果。其中转换公式为:
表3新参评的序列数据
3.3确定标准数据序列并计算极差数据
以参评序列中的最优值做作为标准数据,计算出一个标准数据序列为:
={1,0.75,0,75,1,1,0.75,1,1,1,1,1,1,1,1}
利用标准数据,及公式()=()(),分别计算(),()(),()()()(),()(),计算结果见表4。
3.4计算关联系数
利用表4,得到关联系数,见表5。
表5关联系数
3.5计算关联度及排序结果
根据公式=(),得=0.646,=0.805,=0.855,=0.593,=0.575,关联度排序为>>>>。可以看出,科技创新能力最好的是C学校,其次是B学校,A学校一般,D学校较差,E学校最差。
基金项目:江西省社会科学规划课题(项目编号:12JYW01、12YJW01);江西省高等学校教改课题(项目编号:JXJG-12-5-6)
注释
关键词:研究型课程;教学模式;能力评价;考试方法;改革
研究型课程是一种全新的教学理念。它是指学生在老师的指导下,根据各自的兴趣、爱好和条件,从学习生活和社会生活中选择不同研究课题,用类似科学研究的方式,独立自主的开展研究,主动的获取知识、应用知识和解决问题,从中培养创造精神和实践能力的一种课程[1,2]。研究型课程教学中,老师不再是“讲台上的圣人”,而更多地起“场外教练”的作用;不仅仅传授知识,而是遵循认识规律,以学生为中心,设计教学过程、提供教学资源、提供学习建议,对整个学习过程进行控制,关键环节是对学生进行启发、激励、引导和指导,并及时对学习效果进行评价。
以提高教学质量和培养创新型人才为目标的研究型教学方法改革需要与之相适应的考核方法。如果传统的考核方法不改革,教学方法改革就很难深入。评价对教育教学实践具有不可忽视的导向、鉴定、改进、激励和管理作用,即所谓的“指挥棒”,完善考试与评价制度是推进研究型教学的重要影响因素。因此,要使研究型教学的推进工作顺利开展,就必须对考核和评价加以重视。
目前我国高校考试更多地表现为知识导向,而非能力导向,而高校除了要使学生掌握必要的专业知识外,更要培养学生的能力,特别是创新能力[3-6]。因此,能力的考核应该成为考试的重要内容。但是,大部分高校的考试内容依然侧重于对知识的掌握程度,注重知识的再现水平,而忽视了对学生运用知识能力的考察,造成学生死读书本、知识面窄、兴趣缺乏,只习惯于接受和承认已有的结论,往往是知其然而不知其所以然[7]。目前,高校考试在考试内容和形式上存在的缺陷,使考试不能很好地考察学生的综合能力,失去了能力导向的功能。
为此,笔者对研究型教学模式下面向能力评价的考试方法改革进行了认真的思考,提出具体的改革内容和实施方案,期待能够在教学过程中,全面地、科学地考查学生的知识水平和综合能力,给予学生公平、公正的综合评价,激励学生的学习兴趣和热情。
一、国内外考试方法现状分析
我国高校因教学环节的不同,考试方式、方法也不尽相同。通常采用的有:传统考试和标准化考试两种形式。传统考试一般凭经验命题、主观评分、题量较少、覆盖面窄、评分误差较大;标准化考试从命题到考试,从评卷到登分,各个环节都力求规范标准,减少或避免各种误差,能较准确地反映学生的真实成绩。但标准化考试很难考核出学生的分析和创造能力。开卷考试虽然可以避免学生死记硬背,能考核学生对知识的理解程度、分析问题和解决实际问题的能力,但因答案不统一,评阅试卷带来误差较大;闭卷考试相对命题简单、阅卷准确方便,但会导致学生死记硬背,很难考查对学生运用知识的灵活性与综合能力;口试拟题范围广,既能督促学生全面系统地复习,又能较准确而深入地检查学生掌握知识的广度、深度以及运用知识的能力水平,有助于培养学生口头表达能力,但考试时学生易紧张,很难深思熟虑,教师如有精力分散,则会影响评分的准确性;实践能考查学生的动手能力和分析解决问题的能力,但不好衡量,考核效率不高。
二、面向能力评价的考试方法改革内容
研究型教学模式下面向能力评价的考试方法,应由原来单一性的知识技能能力测评转向学生对知识的创造性运用、加工、组合和创造新知识的能力评价[4]。这种考试方法的改革,应从考试形式、命题方式、考试内容方面打破传统考试方法的局限性和不科学性。具体改革内容有:
1.考试形式改革。结合各学科、专业的特点和教学内容、教学方法改革的需要,积极推进多元评价方式改革,多层次的考试方式灵活组合,来全面评价学生的知识与能力获得,以促进学生对知识的掌握以及知识应用能力的提高,适应社会的需要。
2.命题方式改革。命题要突出能力的考核,为学生提供一定的自由发挥空间,充分调动学生自主学习的主动性与能动性。同时,考试命题要从学生培养目标全局出发,反应课程教学的目的。
3.考试内容改革。笔试考试,不论是开卷还是闭卷,内容均要注重学生对知识的理解和综合运用能力的测试;口试考试的内容,应该对学生口头表达能力、思辨能力、反应能力、心理素质等进行全面深入测试;操作考试内容,要重点考察学生的动手能力、学生间的相互配合和协作能力;课程论文,应该考核学生对图书馆资源利用的能力及写作能力;竞赛及设计报告,考察学生对课题研究的参与性、主动性和创新性,以及设计报告的撰写水平和口头汇报中的表达能力。
三、面向能力评价的考试方法实施方案
针对前面提出的改革内容,可采取的实施方案如下:
3.考试内容实施方案。笔试考试,试题内容的设计要体现研究型教学的要求,即试题必须具有研究性的特点。即使是概念题也必须是通过分析、理解相应的基本概念和基本理论才能作答。题目要有难易程度不同的区分,以便具有较好的区分度。既要有单一的知识点测试,又要有利用综合知识解决问题的考核,还要考虑考场纪律的现实情况。试题必须增加考生通过“东张西望”所获得信息的难度,即使采用选择、填空这种简答的作答形式,答题时必须附加说明选择理由,否则不给分,从而消除蒙题的可能。
口试考试,将课堂启发式教学提问变为课堂随机口试。口试题要根据教学大纲内容合理设置和以学生主动提出的问题为题。要求学生在课堂上主动作答来获取成绩,每人作答次数不限,哪节课作答不限,作答成绩不理想可以下次再答,直到满意为止,课堂教学全过程中不作答成绩则为零。口试题的设计必须按照教学大纲精心合理设置,抓住每次课的教学中心和重点,教师仅仅是引导、答疑和师生共同解惑。这种考评方式会使学生逐渐养成课前预习、课上学习、课后复习的良好学习习惯,同时有利于开展好研究型教学。
四、结语
“研究型课程教学模式下的面向能力评价的考试方法”,可以成为实现研究型教学的教学评价和教学目标的一种重要手段。这种考试方法贯穿整个教学过程中,从多个方面、采取多种形式对学生进行考核,发挥各种考核形式的长处,在整个课程学习过程中对学生综合能力体现给出公平、公正的评价。而且通过这种考试方式,进一步激发学生的学习兴趣和学习热情,真正达到“以考促教”、“以考促学”的目的。
[1]杜烁.中国高校俄罗斯地理课研究型课程教学模式研究[Z].辽宁师范大学硕士学位论文,2010.
[2]龙继林.基于学生实践与创新能力的研究型教学模式新探索[J].人力资源管理:学术版,2009,(12).
[3]陈兴文,白日霞,李敏.开展研究型教学培养大学生创新能力[J].黑龙江教育:高教研究与评估,2009,(1).
[4]黄晓东,何奎.研究型教学在工科专业课程教学中的实践[J].中国教育技术装备,2011,(6).
[5]展涛.我国研究型大学创新性人才培养模式探究[J].高等教育研究,2011,32(1).
关键词:多面Rasch模型;课堂教学能力评价量表;优化
大学教师课堂教学能力评价是提高教学质量的重要手段,其活动的开展离不开课堂教学能力评价量表这个载体。①目前,大学教师课堂教学能力评价量表在教学管理中得到了广泛应用,却没有表现出管理方所期待的价值:分数能够区分教师的课堂教学能力,兼顾课程难度和评委差异。产生这种现象的原因不能仅仅归结于评委误差,课堂教学能力评价量表的设计也是其中一个重要的影响因素。如何优化量表、提高量表的应用价值成为管理方迫切需要解决的问题。
已有研究者试图通过评价指标的优化来解决大学教师课堂教学能力评价量表优化问题,其研究包括三个方面。第一,引入平衡计分卡、产出分解法确定初始指标。[1][2]第二,通过克隆巴赫系数检验量表的信度、因子分析法检验指标的构建效度,改进权重设计等方法来优化量表。[3][4][5]第三,通过评价结果的反馈、数据标准化处理和选择教学和管理经验丰富、公平、公正的评教专家等方式提高量表的应用价值。[6][7][8]
上述研究成果大多数从指标本身出发研究大学教师课堂教学能力评价量表优化问题,忽视了量表的使用者。面试理论认为,面对相同的评分标准,评委对评分标准的理解和使用往往是不一致的[9],评委并未完全按照评分标准评分[10],不同形式的评分标准影响评分的一致性[11]。语言学研究发现,评分标准的内容、尺度和形式在一定程度上能解释评委评分差异。[12][13]在大学教师课堂教学能力评价中,Wang和Cheng利用多面Rasch模型分析了中山大学293名学生对30名任课教师表现的评分,发现学生严苛程度、难度和教师效能之间存在线性关系,评价者对评价结果的影响是显著的。[14]因此,从量表使用者角度分析大学教师课堂教学能力评价量表的设计内容、尺度和形式对评价结果的影响,进而优化量表是非常有必要的。
多面Rasch模型为量表优化提供了可行的方法,在大学教师课堂教学能力评价中应用非常少。本文将多面Rasch模型引入大学教师课堂教学能力评价量表的优化,在已有研究成果基础上作出了三点创新:第一,研究角度创新。研究角度从量表本身转向量表的使用者,拓展了研究的角度。第二,研究对象创新。利用访谈和扎根编码技术探讨了评委评分的心理过程,分析量表内容、尺度和形式对评分的影响。第三,研究结论创新。本文基于多面Rasch模型的假设和功能提出了量表优化的方法,具有普遍适用性。
一、理论模型与研究假设
能力测评理论可以分为经典测量理论和潜在特质理论。经典测量理论假设评委评分的行为像“打分机器”一样完全相同[15],测量误差相互独立,被测心理特质可以用原始分数来表示[16]。潜在特质理论认为能力是制约人们完成某一任务的若干潜在特质,正确做答的概率是个人潜在特质水平的函数[17],评委评分是考生能力和评委特点的函数[18]。因此,做答概率、个人能力和题目难度被定义在同一尺度上,评委具有各自独特的评分行为,测量的结果使得能力独立于特定的题目和评委。
潜在特质理论更适合用来评价大学教师的课堂教学能力。在大学教师课堂教学能力评价中,评委往往依据评分标准独立评分,有的评委评分明显宽松,有的评委正好相反。如果教师担任的课程难度比较大,又遇到了评分严格的评委,分数就会明显偏低;相反,如果教师担任的课程难度比较小,评委评分比较宽松,分数就会明显偏高。因此,原始分数不足以代表教师的课堂教学能力,矫正任务难度和评委差异后的结果能更加准确地表示教师的课堂教学能力。
多面Rasch模型是一种潜在特质理论模型,可以用来实现量表的优化。首先,多面Rasch模型可以用来识别量表的构念。多面Rasch模型的假设前提是单维性,意思是指所有题项测量了同一种潜在特质。如果量表是单维的,说明所有题项从不同的方面测量了同一个构念,分数能够加总并可以相互比较。[19]如果量表不是单维的,说明至少有部分题项测量的构念与其他题项不同,需要将部分题项排除或设计量表单独测量。[20]其次,多面Rasch模型可以用来检验量表的公平性。如果相同能力的群体由于不同的群体特征导致在同一题目上具有不同的正确作答概率[21],测验就产生了不公平。多面Rasch模型提供了项目功能差异检验的方法,可以针对不同题项检验是否存在不公平。最后,多面Rasch模型可以识别评分异常的题项。多面Rasch模型将原始分数分解为能力估计值、评委宽严度、题项难度和等级难度,能够分析每个题项对应的能力估计值、每个分值对应的能力估计值,识别评分产生异常的题项,为量表优化提供依据。
基于以上分析,本文提出如下假设:多面Rasch模型适合用于大学教师课堂教学能力评价量表的优化。
二、课堂教学能力评价量表存在问题的多面Rasch分析
本次研究从某高校的一个学院抽取了2014年11月至12月的107份课堂教学评价表,量表内容见表1。评委共有6位,被听课的教师有23位。其中,有2位评委分别只对两位不同的教师进行了评分,因评分次数太少而被剔除,其余4位评委的评分数据被保留。在被剔除的2位评委的评分数据中,1位教师只被评分一次,而没有被其他评委评分。因此,该教师的评分表也被剔除。
按照教师编号对22位教师的课堂教学评价数据进行分类整理。评委的编号为A、B、C、D,教师的编号为1、2、3…22。18位教师分别被4位相同的评委评分,其他4位教师被若干不同的评委评分。若同一位评委对某位教师多次评分,该教师的得分用这个评委评分的均值表示。例如,编号为1的教师被编号为A的评委评分两次,编号为A的评委对该教师的评分按照两次评分的平均值计算,教师最后的分数等于多位评委评分的均值。经过整理,我们得到了4位评委对22位教师的评分数据共77个,形成本次研究的样本。
(二)研究方法与工具
本次研究采用的工具是Winsteps3.72.3软件和Facets3.71.4软件。Winsteps软件和Facets软件都是多面Rasch模型分析工具,其原理是一致的。[22]Winsteps软件能实现单维性检验和项目功能差异性检验,Facets软件则不能实现这两项功能。Facets软件能将评委、课程和被评价人作为三个单独的面进行分析,体现课程差异和评委差异,Winsteps软件则将评委、课程和被评价人作为一个面来分析。因此,多面Rasch模型分析可以同时使用Winsteps软件和Facets软件来实现多种功能。
在运用多面Rasch模型之前,首先要对数据的整体拟合程度进行检验。运用Winsteps软件进行单维性检验,运用Facets软件计算样本误差均值和标准误。如果数据满足单维性假设,并且样本误差均值接近于0、标准误接近于1,说明数据的整体拟合程度比较高,可以运用多面Rasch模型对数据进行分析。[23]其次,证明数据拟合多面Rasch模型后,我们可以利用Winsteps软件进行项目功能差异检验。本文针对性别进行项目功能差异检验,用于识别产生项目功能差异的题项。最后,利用Facets软件分析能力与分数之间的关系,用于识别产生评分异常的题项。
(三)多面Rasch模型适用性检验
单维性检验用于检验问卷题项是否测量了相同的潜在特质,这是多面Rasch模型能够应用的前提。大学教师课堂教学能力评价量表一共有8个题项,总分按照8个题项得分加总计算。如果这8个题项可以归属于同一个潜在特质,可以认为这8个题项测量从不同角度测量了同一种教师课堂教学能力,总分可以用来表示教师课堂教学能力的高低。反之,则说明至少有部分题项与其它题项测量的并不是同一种能力,需要将部分题项排除或设计量表单独测量。[24]
Winsteps软件提供了残差主成分分析法来检验量表的单维性,检验结果见表2。如果剔除多面Rasch模型可解释部分后,残差仍有若干共同的潜在特质并且特征值(未解释的变异)大于2,说明存在第二个维度,量表不具有单维性。五个维度中未解释变异的特征值分别为1.8、1.6、1.3、1和0.8,都没有超过2,说明量表具有单维性。[22]因此,8个题项从不同的角度测量了教师的课堂教学能力。
Facets软件检验结果显示数据对Rasch模型的拟合程度比较高,结果见表3。样本观察值21.83,模型期望值为20.14,误差均值为0。样本标准差为3.96,模型拟合值的标准差为3.64,全样本标准误为1。因此,从样本误差均值和全样本标准误来判断,采用多面Rasch模型来分析数据是适合的。
(四)课堂教学能力评价量表存在的问题
1.2个题项存在性别上的不公平
测验的公平性可以用项目功能差异检验的结果来表示。如果教师课堂教学能力评价量表在性别上存在项目功能差异,可能会对处于劣势的群体不公平,影响他们提高教学质量的积极性。因此,测验开发和使用者需要进行项目功能差异检验,识别可能产生项目功能差异的题项,以便对量表进行优化。
Winsteps软件可以实现项目功能差异检验,检验结果见表4。DIF表示项目功能差异检验,DIFMEASURE表示某个群组答对特定题项的难度,DIFS.E表示标准误。DIFMEASURE越大,说明该群组答对该题的难度越大。DIFCONTRAST是两个群组答对特定题目的难度差异,WelchT和Prob表示难度差异的显著程度。男性组中第1个题项最难,第6个题项最容易。女性组中第5个题项最难,第8个题项最容易。第1题的DIFCONTRAST=-0.81Logits(t=-2.48,Prob=0.0155<0.05)、第4题的DIFCONTRAST=0.47Logits(t=2.12,Prob=0.0378<0.05),说明男性和女性在第1题上和第4题上难度有显著差异,可能存在因性别导致的不公平。
2.7个题项出现分数能力“倒挂”
测量学原理认为,分数代表能力,分数越高代表能力越强。多面Rasch模型假设随分数增加,能力呈“S”型曲线。[25]如果某个题项出现了较低分数代表的能力值高于较高分数代表的能力值,说明该题项出现了分数能力“倒挂”的现象。
Facets软件可以用来检验能力是否随分数增加而提高,并用*标记出现“倒挂”的题项。结果显示,除了题项1,其余的题项都出现了分数能力“倒挂”现象。题项2和8出现了3次“倒挂”,题项4、6和7出现了2次“倒挂”,题项3和5出现了1次“倒挂”。
以题项2为例进行分析,见表5。26分使用的次数最多,其次是24分和28分,28分使用了8次,22分使用了4次,25分使用了2次,20分、29分和30分只使用了2次,21分和23分没有被使用过。22分对应的能力值低于20分所对应的能力值,25分的能力均值低于24分的能力均值,30分的能力均值低于29分的能力均值。从等级间距来看,每增加一分所需能力值并不相等。通常原始分数直接比较时,我们认为一分代表相同的能力。但实际情况是,从25分增加到26分所需能力值最小,从28分增加到29分所需能力值最大。说明在不同的评分等级,一分代表了不同的能力,同时评委过多地使用了24、26和28分,对分数所代表的能力差异理解和把握不够准确。
三、课堂教学评价量表存在问题的原因分析
项目功能差异检验和识别评分异常的题项为量表优化提供了依据,但不能分析产生项目功能差异和评分异常的原因。因此,本文对评委进行了访谈,利用扎根编码技术分析产生评分异常的原因,提出了量表优化的方法。
(一)访谈提纲的设计
1.访谈提纲设计的依据
影响评委评分的因素是多方面的,评分量表对评委评分影响的研究非常少见,未发现有关大学教师课堂教学能力评价量表对评委评分影响的文献。在教学能力评价中,评委依据评分量表收集信息,并对信息进行解释、归纳、演绎并给出分数,与之接近的研究是有关面试的研究和英语作文评分的研究。因此,本文以面试和英语作文评分的研究成果为依据来设计访谈提纲。
评分量表对评委评分影响的研究主要分为三类。第一类是评分量表内容对评委评分影响的研究。有关面试的研究表明,测评要素越多,每个测评要素内部包含的属性越多,量表的使用效果越差。[26][27]第二类是评分量表尺度对评委评分的影响。英语作文评分的研究发现,小尺度评分量表的评分一致性要高于大尺度评分量表的一致性。[28]第三类是评分量表形式对评委评分影响的研究。面试研究发现,为每个评分等级提供典型行为描述,尽量通过媒介促使行为可视化能够提高评委评分的一致性程度和评价的准确性。[29][30]由此可以假设,教学能力评价量表题项太多、每个题项包括了不同的测量内容,每个题项分值过大、评分等级描述不够清晰会影响评委对量表的理解和把握程度。
2.访谈对象与访谈提纲内容
访谈提纲的内容围绕量表的内容、尺度和形式展开,要求评委讲述他们在评分过程中是如何使用量表的。评委以一门课程为例,先对照评分表记录表的课堂内容对该教师的教学能力作出整体评价,再对量表合理与不合理的地方进行评价,最后对每个题项给出评分的理由。
研究者需要了解三个方面的问题。在评分量表内容方面,包括您觉得8个题项多不多?您觉得这8个题项意思表达是否明确,是否会干扰您的评分?有什么可以改进的地方?在评分尺度方面,访谈的问题有:您觉得哪些题项分值设置是合理的,哪些是不合理的,原因是什么?在评分量表形式方面,访谈的问题有:您在这个题项给了××分,为什么不多给几分,或少给几分呢?您觉得将该题项划分成几个分数段,您是否会使用这些分数段去区分不同教师的能力?
访谈的对象是4位曾经担任过课堂教学评价的老师,包括前面提供评分数据的4位评委中的2位。如果能对4位评委进行访谈,研究结果更为可靠。由于条件的限制,无法对4位评委进行访谈,只能选择具有多年教学评价经验的教师进行类比,这也是在缺乏数据的情况下不得不采取的办法。
(二)访谈内容整理与编码
本次研究采取开放式访谈和研究者提问相结合的方式。评委先围绕量表的合理性作出评价,然后对每个题项给出评分理由,对于评分量表内容、尺度和形式方面没有涉及的问题由研究者提问作为补充。
编码采用扎根编码技术。评分量表内容编码为a1,a2…,其影响编码为a1-1,a2-2…,依次类推。量表尺度编码为b1,b2…,其影响编码为b1-1,b2-2等。量表形式编码为c1,c2…,其影响编码为c1-1,c2-2等。
经过整理后,部分访谈内容和编码摘录如下。
访谈编码结束后,对访谈编码进行汇总。将访谈者提到的内容按量表内容、量表尺度和量表形式归类,找出原因和结果的对应关系,见表6。
(三)量表对评分的影响分析
1.量表内容对评委评分的影响
题项的测量内容和性质影响评委评分。如果一个题项同时包含两个测量内容,评委既可能选择他
认为重要的测量内容(a2-2),也可能随意选择一个测量内容(a1-1),导致多个评委评价的对象是不一致的,甚至同一个评委对不同的教师选择了不同的测量内容进行评价。如果测量的内容本身不好把握(a1),评委对课程不熟悉、缺乏可参考的依据(c3),可能评委就选择他认为重要的测量内容对教师的整体表现进行评分,而不会按题项的测量内容给分。题项2和题项8出现分数能力“倒挂”现象的次数最多,题项3和5出现“倒挂”次数最少,可能与该题项测量内容容易观察有关。
2.量表尺度对评委评分的影响
评委给出的评分不仅仅体现了教师的能力,还受到题项重要性程度的影响。一般情况下,题项越重要,题项分值越高。如果评委认为某教师在一个题项上的表现非常好,足够给最高分,而该题项只有10分,那么评委也只能给10分。如果某教师在另外一个题项上表现一般,该题项最高分是15分,评委可能给出了12分,这个分数不仅仅是教师的能力,还包括了评委对该题项重要性程度的认可,结果是评委附加了新的评分标准(b1-1)。特别是评委认为重要的题项,分值比较低时,评委可能给表现不够好的教师高于评委心理预期的分数(b1),而非常好的教师分数也得不到较高的分数,分数区分度不够。题项6和8的分值为15分,是所有题项中分值最高的,也是分数能力“倒挂”次数最多的。
3.量表形式对评委评分的影响
量表只给出了各个题项的内容和尺度,未设置评分等级导致评委评分缺乏依据。评委有一个“心理量尺”(c1),评委用“心理量尺”给题项评分(c2),具体给出什么分数可能受到其他因素的影响(c1-1,c2-2),例如“人情”、“出场顺序”等。由于记忆容量有限和背景差异,评委可能根据他认为重要的题项来确定心理量尺(a1-1,a3-3),评委的“心理量尺”可能存在差异,评委之间缺乏统一的评分依据。加上外界因素的影响,同一个评委对不同的教师可能使用了不同的“心理量尺”,每个分数应对的能力实际上是不同的,就可能出现分数能力“倒挂”现象。
四、课堂教学能力评价量表优化的建议
(一)利用多面Rasch模型对量表进行检验
1.构念效度检验
根据单维性来判断量表的构念效度。如果检验结果显示量表具有单维性,说明量表的题项可以用于教学能力评价。如果检验结果显示量表不具有单维,说明量表中有部分题项不能用于教学能力评价,需要把部分题项剔除或将这些题项单独测量。本次研究的量表具有单维性,现有题项可以保留。
2.性别功能差异检验
性别功能差异检验用于检验量表的公平性。如果量表具有性别功能差异,我们需要分析产生性别功能差异的原因。如果是男性和女性本身能力差异造成的,我们需要设置不同的评分标准。如果是群体特征差异造成的,我们需要剔除产生性别功能差异的题项或设置不同的题项。在本次研究的量表中,题项1和4具有性别功能差异,需要进一步分析产生性别功能差异的原因,本次研究没有涉及到这个内容。
3.评分异常检验
评分异常的表现形式之一是分数能力“倒挂”。本次研究显示,部分题项出现了分数能力“倒挂”,需要从量表的内容、尺度和形式三个方面分析产生这种现象的原因。
(二)课堂教学能力评价量表优化的具体措施
1.简化每个题项的测量内容
研究结果显示,每个题项包括多个测量内容,题项之间测量内容交叉可能导致分数能力“倒挂”现象出现。因此,简化每个题项的测量内容,尽量保证一个题项只有一个测量内容,按测量内容的属性归类排列,便于评委明确评价对象,提高量表的使用效果。
2.分离尺度与权重
当题项的尺度包括权重在内时,评委的评分同时考虑了权重和能力。研究结果显示,如果评委不认同量表的尺度时,评委就会各自在内心重新设置尺度,评分时综合考虑“内心重新设置的尺度”与能力,分数与能力的偏离会更大。因此,分离尺度和权重是必要的。可以仿照体育评分的办法,每个题项的尺度都是相同的,但权重另外设置。例如所有题项都设置为10分,评委只在0-10范围内评分,每个题目的分值按照权重和尺度加权计算。
3.细化评分等级
研究结果显示,评委评分有自己的“心理量尺”,并未严格按照量表进行评分。由于评委之间的“心理量尺”存在差异和外界因素的影响,评委的“心理量尺”失去了可比性。因此,细化评分等级,为评委评分提供相互比较的依据,有利于减少分数能力“倒挂”现象。对于容易观察的测量内容,可以对每个评分等级进行关键行为描述。对于不容易观察的测量内容,可以对每个评分等级进行总体描述。在此基础上,管理方可以分类选择一些课程建立可视化的模拟培训库[26],加强对评委的培训和反馈。
注释:
①本文的量表均指大学教师课堂教学能力评价量表,教师均指大学教师。
[1]李长青.构建平衡计分卡理论的高校教学质量评价指标体系[J].高教探索,2014(6):137-141.
[2]吕少柳,刘晓.基于行动导向教学观的课堂教学质量[J].学理论,2010(31):242-243.
[3]钱存阳,李丹青,潘岚.课堂教学质量评价中的效度和信度分析[J].中国计量学院学报,2004(2):164-167.
[4]丁家玲,叶金华.层次分析法和模糊综合评判在教师课堂教学质量评价中的应用[J].武汉大学学报(社会科学版),2003(3):241-245.
[5]刘伟,孙林.基于支持向量机的课堂教学质量评价[J].合肥工业大学学报(自然科学版),2010(7):968-971.
[6]纪红.课堂教学质量评价的误区与对策[J].中州大学学报,2004(7):87-89.
[7]张克非.课堂教学质量评价数据客观性处理及反馈机制探究[J].教学与管理,2014(3):44-47.
[8]毕菁华.建立课堂教学质量评价体系的实践性探索[J].北京大学学报(哲学社会科学版),2007(5):295-297.
[9]PosthumaRA,MorgesonFrederickP,CampionMA.BeyondEmploymentInterviewValidity:AComprehensiveNarrativeReviewofRecentResearchandTrends[J].PersonnelPsychology,2002(55):1-82.
[10][30]UggerslevKL,SulskyLM.UsingFrameofReferenceTrainingtoUnderstandtheImplicationsRaterIdiosyncrasyforRatingAccuracy[J].JournalofAppliedPsychology,2008,93(3):711-719.
[11]MelchiersKG,LienhardtN.IsMoreStructureRealityBetter?AComparisonofFrameofReferenceTrainingandDescriptivelyAnchoredRatingScalestoImproveInterviewer’sRatingQuality[J].PersonnelPsychology,2011(64):53-87.
[12][28]关丹丹.两种评分量表的评分效应比较研究[J].教育研究与实验,2011(4):92-96.
[13]李航.评分员与评分量表间的交互作用对EFL作文评分结果与过程的影响[D].杭州:浙江大学,2012.
[14]WangWC,ChengYY.MeasurementIssuesinScreeningOutstandingTeachers[J].JournalofAppliedMeasurement,2001(2):171-186.
[15][23][25]LinacreJM.AUser’sGuidetoFacetsRasch-ModelComputerPrograms[M].Chicago,2014:279,185,204.
[16]漆书青,张厚粲.现代教育与心理测量学原理[M].北京:高等教育出版社,1998:33.
[17]L赫林,F德雷斯哥,K帕森斯.项目反应理论在心理测量中的应用[M].东北师范大学教育咨询中心,译.武汉:湖北教育出版社,1990:15.
[18]CasonGJ,CasonCL.ADeterministicTheoryofClinicalPerformanceRating[J].EvaluationandtheHealthProfessions,1984(7):221-247.
[19]WuM,AdamsR.ApplyingtheRaschModeltoPsycho-socialMeasurement:APracticalApproach[M].Melbourne,2007:21-23.
[20][24]王文中.Rasch测量理论与其在教育和心理之应用[J].教育与心理研究,2004(4):637-694.
[21]HollandP,ThayerD.DifferentialItemPerformanceandtheMantel-Haenszelprocedure[C]//PaperPresentedattheAmericanEducationalResearchAssociationAnnualMeeting.Francisco,1986.
[22]LinacreJM.AUser’sGuidetoWinstepsRasch-ModelComputerPrograms[M].Chicago,2011:601-602.
[26]SanchezJI,DeLaTP.ASecondLookattheRelationshipBetweenRatingandBehavioralAccuracyinPerformanceAppraisal[J].JournalofAppliedPsychology,1996,81(1):3-10.
关键词师德;科研评价;高校教师
中图分类号:G645文献标识码:B
1前言
科研是高校教师的基本职责之一,在当前“教研相长”的时代要求下,各大高校也根据各自学校的教研队伍构架制定了不同的科研评价标准,并将这些标准作为评价教师科研能力、职称晋升、评优评奖等工作的参考标准。高校教师越来越意识到科研的重要性,科研积极性大大提高。由于各高校的定位、专业、科研领域及科研方向的不同,评价标准难以实现所有专业科研评价的公平性,因而评价标准制定得越来越细化且多元化。我国传统师德观念认为:“师者,人之模范也。”师德不仅体现在课堂授课,更体现在教师的科研工作中,因为科研工作更强调科研个体的慎独精神。因此,对师德的评价应放在教师科研评价的首要位置。我国传统师德思想已有千百年的历史,且不断完善、进步,也激励和约束着当代教师的思想品德。孔子说:“其身正,不令而行;其身不正,虽令不从。”高校教师只有端正自己的科研态度,求真求实,才能言传身教、为人师表。
2传统师德思想对高校教师科研作风的指导作用
“弘扬科学精神,勇于探索,追求真理”是《高等学校教师职业道德规范》对新时期高校教师的要求。在经济发展活跃的当今,在繁忙教学任务之外能潜心做科研的教师并不多。《大学》的第一句就教导知识分子学习的目的在于“明明德”,然而不求德厚,只求位尊禄重,醉心于学术之名带来崇荣之心的大有人在[1]。对于高校教师科研思想导向的引导,各大院校在科研评价标准中均制定了行政规范,但规范只是硬性要求,对于自发性的行为规范应当加大鼓励力度。儒家传统思想强调“修身”,认为“修身”是一切行为规范的总则,对于道德行为规范强调“自发性”,而不是强制性。当前社会的经济形势,确实存在一定的经济利益诱惑,使一些教师的科研动机不纯粹。高校对教师科研评价中,不仅仅要从书面上形式性地审查教师的科研作风,更应强调科研作风的自律。以“学为人师,行为世范,自尊自律,清廉从教,以身作则”作为衡量教师科研素养的标准,从而建立完善的科研师德评价机制。
3传统师德思想对高校教师科研方向性和连续性的指导作用
科研工作是具有连续性的,这种连续性表现在两个方面:一是科研工作的周期长,需要几年甚至十几年的潜心钻研;二是科研工作研究方向的连续性,即科研工作者研究的方向和深度要有一定的连续性。从事科研工作的人员,不仅要具有扎实的理论基础和科研实验实践能力,还要有毅力和“乐业”精神。一些教师为了迎合评价标准而科研,为了业绩而科研,认为科研评价仅仅是业绩分数的累加,而回避这样的科研态度带来的经费浪费、环境污染、人力资源浪费等一系列学术弊端。教师的科研工作,不仅仅是对于某一领域的探索研究,更重要的是要将成型的科研方法、丰富的科研经验和具有验证性的实验结果充实到教学中去,在明确研究方向的同时,拓展自身视野,提高知识水平和专业能力。
4传统师德思想对高校教师科研带教评价的指导作用
传统师德思想中的“言传身教”在教师的科研评价过程中,很多评价标准围绕科研成果的数量和质量来进行,而越来越多的经验表明,大量的科研成果并不完全代表教师的科研态度、科研习惯和科研诚信等,在带教过程中却能够暴露一些科研恶习。我国自古就强调教师要以身作则、言传身教,孟子的“正人先正己”,荀子的“以善先人者谓之教”,陶行知的“教师应当以身作则”,等等,都强调了教师的“模范”作用。教师的科研思路时刻影响着学生科研思路的创建,而教师的实验动手能力、节约思想、慎独精神、实事求是等,也都时刻影响着学生的科研养成。因此,在科研评价的过程中,对学生科研素养的考验间接反映了带教教师的科研素养,能够成为客观评价教师科研水平的凭据之一。
传统师德思想中的“尊师重道”我国古代有很多尊师典故,如理学家杨时的程门立雪、儒商始祖子贡的尊师至诚、唐太宗李世民的教子尊师等,都体现了教育思想中的尊师美德。然而自古以来知识分子都有“择其善者而从之,其不善者而改之”的观念,什么样的教师值得尊重,什么样的教师能获得学生的尊重,这是在科研评价时不得不思考的问题。通常来说,在对教师的科研评价中,学生对教师的评价最为真实和多元化,因为学生能够时刻观察到教师的科研态度、科研方式、科研真实性等一系列能够反映教师科研水平的方面。而当前的大学生群体的思想更开放,对教师的选择性更具主观能动性,同时教师与学生之间存在双向选择,因此,学生对教师尊敬与否、对教师的客观评价都反映了教师的科研方向与能力。《师说》认为,“师”和“道”是密不可分的,所谓“道之所存,师之所存”。教师只有严格要求自己,提高自身科研水平,修于自身科研素养,才能使学生“亲其师而信其道”。
5结语
综上所述,对教师的科研评价标准不应仅仅拘泥于科研成果、奖项和论文数量,最重要的是要将教师的师德放在科研评价的首位,用儒家传统师德思想严格要求教师,使教师真正做到“修身”,做到“淡泊明志,宁静致远”。将儒家传统教育思想和师德师风评价融合到一起,让教师从信仰、本性上加强自身建设,提高道德水平,这样才能使高校的科研评价机制建立在公平正义的基础上,同时也促进我国的科研环境健康有序地发展。■
[1]庄梅兰.论师德在高校教师评价机制中的回归[J].教师教育论坛,2014(2):68-71.
[2]魏斌.高校青年教师师德师风建设内外因分析研究[J].教育探索,2011(5):125-126.
[3]杨玉浩,苏雄武,方义涛.传统文化背景下大学教师师德的时代内涵[J].河北农业大学学报:农林教育版,2016(16):