[摘要]公务员面试考官评分是影响公务员考试录用的重要因素,考官评分策略的形成与组合决定了考官评分决策。考官评分策略是多种评分心理行为基础上形成的多种评分方式的组合,实证研究表明公务员面试中考官使用了11种评分方式,形成“锚定策略”、“匹配策略”和“调整策略”3种评分策略。面试中不同考官对同一考生评分时采用的评分策略组合存在差异、同一考官对不同考生评分时采用了不同的评分策略组合,这些评分策略组合具有多样性、差异性和政治性。本文揭示了公务员面试考官评分策略的内在属性,归纳和提炼了公务员面试考官评分的规律和特殊性,为提高公务员面试考官评分信度和效度的理论研究和实践探讨提供了良好基础。
[关键词]公务员面试考官;评分心理行为;评分方式;评分策略
国内外对考官评分的研究主要集中于考官评分心理行为与评分方式两个角度,[1][2]研究表明面试考官存在特定的评分心理行为和评分方式。那么,公务员面试中考官存在怎样的评分心理行为这些评分心理行为表现出什么样的评分方式这些评分方式是如何组合的这种组合呈现出什么样的特点对面试评分决策有什么影响对于这些问题的探讨能够帮助我们认识分数背后的考官评分心理行为[3]、解释考官评分差异形成的原因,为公务员考官的选拔和培训提供依据,提高公务员面试的效度,确保公务员面试录用的公平性和科学性。
一、文献综述
(一)考官评分心理行为与评分方式研究的主要观点
经过梳理,本文将考官评分心理行为归纳为6种类型,形成6种不同的评分方式。
第一类表现为考官将面试中被测者的个人特质和自己内心的理想原型进行比较的过程。研究表明考官内心存在理想原型,[4]理想原型表现为考官心中目标岗位理想人选所具备的系列特质,[5]有些考官对不同职组使用了不同的理想原型,[6]有些考官对不同职组使用了相同的理想原型。[7]考官评分时,被测者的表现越接近于理想原型,面试评分越高,反之越低。
第二类是考官将被测者表现出来的个体特质与岗位所需个体特质进行比较的过程。岗位所需个体特质分为大众标准和特殊标准两种类型,大众标准指的是不同组织都普遍接受的个人特质,特殊标准指的是某个组织或职位所需的个人特质。[8]面试中,考官评分方式表现为考官以大众标准和特殊标准为参照给被测者打分,被测者个人特征与岗位所需个人特征的匹配程度越高,考官评分越高,反之越低。[9]
第三类是考官在预设的“评分区间”内,根据被测者的表现判断其所属区间值的过程。考官评分行为表现为考官内心预设“什么样的表现给多少分”的“评分区间”,[10]并根据面试刚开始形成的第一印象确定一个分数,[11]形成“基准值”。随着面试的推进,考官根据考生回答的内容对“基准值”进行调整,[12]一直调整到考官认为给出了合适的分数。
第五类是考官将被测者特质与自身特质相比较,判断二者间相似程度的过程。这种相似可以是考官与被测者在性别、种族等人口统计学特征方面的相似,也可以是人格、态度、价值观和动机方面的相似。[15]虽然考官与被测者的相似性可能不是工作所需的知识和能力,[16]但考官倾向于给与自己某些个人特征相似程度高的考生更高的评价。[17]
第六类是考官将被测者与其他被测者进行比较的过程。在面试中,考官倾向于给第一个被测者“中庸”的分数,[18]将被测试者和前面的被测试者进行比较,分析他们之间的能力差异,给出该被测试者的评分。因此,考官评分方式表现为考官在评分时往往以第一位被测者的表现为参照点,再将后续被测者的表现与它对比后进行评分决策。[19]
(二)研究评述
从目前已有文献来看,研究者对考官评分中可能存在的心理行为进行了较为全面的探讨,对每类评分心理行为形成的具体评分方式进行了分析,并在此基础上构建了考官评分方式的部分测量量表,为进一步研究考官评分决策奠定了良好的基础。
国外开发的考官评分方式测量工具适合被测者人数比较少的情况,[21][22]也没有体现公务员面试考官评分策略的特殊性。因此,直接将若干考官评分方式测量工具组合起来用于测量公务员考官评分策略是不合适的,考官评分策略的测量方法还需要改进。
综上所述,考官的评分策略是一个多维的概念,考官评分策略研究应该将考官多种评分心理行为和评分方式纳入同一个分析框架,以便更加全面体现考官评分策略的内容。同时,公务员面试考官的评分策略不同于其他面试考官评分策略,这就需要开发公务员面试考官评分策略问卷,以便更加准确体现公务员面试考官评分策略的特殊性。
二、公务员面试考官评分策略的测量
(一)问卷题项的采集
1.访谈设计
本次访谈以湖北省公务员面试考官为对象,采用半结构化方式进行,访谈的目的是通过访谈归纳和提炼考官在面试中可能采用的评分方式。遵循关键行为事件访谈的程序,访谈从开放式问题“谈谈你在面试过程中印象最深的考生”开始,要求被访谈者讲述这个考生的面试过程、被访谈者在面试过程中的心理过程、被访谈者评分情况并给出评分的理由、其他考官评分的情况、可能影响考生面试分数的因素等。对于被访谈者没有明确回答的内容,访谈者进行补充提问,一直到问题全部回答完毕。
湖北省公务员面试考官主要由政府部门处级以上干部和高校高级职称教师构成,因此访谈选取了5名曾经多次担任公务员面试考官的高校教师和5名曾经多次担任公务员面试考官的湖北省公务员局处级以上干部,全部访谈过程录音并转化为文字资料,共获得文字约8万字。
2.访谈数据处理
由两名人力资源管理专业的博士和三名硕士对记录的文字资料进行编码分析,保证每个编码只有一个涵义、语意清晰、归类明确。首先对文字资料内容进行归类,获得8个类别。再将每个类别中的文字资料编码,删除明显不属于考官评分策略的编码,对于不同语言表达同一个意思的语句进行合并后,共获得85个编码。删除语意模糊、归类不明确的编码,共获得78个编码。最后,将所有编码按类别汇总,用陈述语句表达出来,最后共获得17个陈述语句。
(二)问卷编制
编码和归类完毕后,请被访谈者对陈述语句的适合程度进行判断。首先请他们对语句表达的意思是否清晰进行判断,然后由编码者告诉被访谈者每个陈述语句编写的目的是什么,询问被访谈者这些陈述语句是否与现实情况相符。经过多次讨论和修订,最后筛选出17个陈述语句。
将最后筛选出的陈述语句设计成问卷,命名为公务员考官评分策略问卷。问卷共分为两个部分:第一个部分是个人基本信息,包括性别、年龄、工作单位性质、担任考官次数等。第二部分是考官评分策略,共17个题项。所有题项采用李克特5点计分法。“1”表示“完全不赞同”,“2”表示“不太赞同”,“3”表示“一般”,“4”表示“比较赞同”,“5”表示“完全赞同”。
(三)问卷效度检验
表1样本分布情况
个人基本信息类别人数百分比(%)
性别男32767.8
女15532.2
学历大专及以下173.5
本科28158.3
硕士13227.4
博士5210.8
工作单位性质政府机关36976.6
事业单位5511.4
高校5812
年龄39岁及以下8317.2
40-44岁9319.3
45-49岁12726.3
50岁及以上17937.1
担任考官次数1-4次10922.7
5-7次9519.8
8-10次7815.8
11次及以上20041.7
将2015年的208份问卷命名为样本1,将2014年的问卷命名为样本2。探索性因子分析要求问卷题项与样本数量之比达到1:5以上,样本数量至少为100。验证性因子分析要求观察变量与样本数量之比达到1:15,样本数量最好达到200以上。本次调研的问卷共有17个题项,验证性因子分析的样本数量大于255比较理想。因此,本文将样本1用于探索性因子分析、样本2用于验证性因子分析,这样能同时满足探索性因子分析和验证性因子分析的要求。
2.探索性因子分析
主成分因子分析法常用来对问卷的结构效度进行检验。先用全部题项进行主成分因子分析,得到KMO=0.813(p<0.01),说明题项之间的关系适合进行因子分析。我们利用最大方差法提取主成分,保留因素负荷大于0.45的题项并且删除多个因子上的因素负荷大于0.45的题项,按照特征值大于1提取公因子,经过反复正交旋转,结果显示6个题项应该被删除,它们是“外貌评分有影响”、“考生的政治激情对评分有影响”、“考生的语言表达对评分有影响”、“在面试中,我结合评分区间和考生表现打分”、“我参考前一个考生给后一个考生打分”和“相对岗位能力,考生的政治素质更重要”。删除这6个题项后,量表的KMO=0.784(p<0.01),说明问卷的共同因素有所下降但仍然适合进行因子分析。按照特征值大于1提取公因子,结果显示应该提取3个公因子,3个公因子的累计方差贡献率为55.4%,说明3个共同因素可以解释问卷全部题项55.4%的变异量,问卷具有良好的构建效度。
根据研究目标和各因子所包括题项的涵义进行抽象和概括,将考官评分策略提炼和细分为“锚定策略”、“调整策略”和“匹配策略”三个维度,具体内容见表2。
表2考官评分策略负荷矩阵
题项
序号评分方式题项因素负荷
锚定策略调整策略匹配策略
S1我心中有一个大致的评分区间。0.743
S2考生的政治素质影响评分。0.697
S3当考生出现与自己相似的想法和价值取向时,我会对其产生认同感,分数有所提高。0.787
S4当考生的想法或价值取向与自己不相符时,我不自觉降低其分数。0.64
S5我熟悉应聘岗位,考生表现与岗位要求的符合程度影响我的评分。0.634
S6面试中,其他考官与我之间打分差异比较大时,我会改变我心里的评分区间。0.795
S7当考生回答内容与标准答案差异较大时,我会给同情分。0.621
S8随着面试进程的推进,外貌对评分的影响减弱。0.588
S9我结合大众对公务员的一般素质要求对考生进行评分。0.721
S10我不太熟悉应聘岗位,我结合工作经验对考生进行评分。0.787
S11我会按参考答案踩点给分。0.554
特征值2.6441.7961.65
方差贡献率(%)24.03316.59814.728
累计方差贡献率(%)24.03340.63155.359
因子1包含S1、S2、S3、S4和S5共5个题项,表示考官根据自己的经验和偏好形成评分区间,考官根据考生的政治素质、考生与考官的相似度、考生表现与应聘岗位的差距确定该区间内的实际得分,我们将其命名为“锚定策略”。因子2包括S6、S7和S8,说明其他考官评分情况、考生的面试表现和考生的外貌会改变考官原有的评分区间,我们将其命名为“调整策略”。因子3包括S9、S10、S11共3个题项,表示考官对不太熟悉的岗位采用了大众标准并结合参考答案进行评分,考生的分数取决于考生与大众标准和参考答案的相符程度,我们将其命名为“匹配策略”。
3.验证性因子分析
我们利用Amos7.0软件进行一阶验证性因子分析和二阶验证性因子分析,运行结果见表3。一阶验证性因子分析的p(x2/df)>0.5,GFI>0.9,PFI>0.5,RFI>0.9,TLI>0.9,PGFI>0.5,RMSEA=0,ECVI=0.234。二阶验证性因子分析的拟合指数与一阶验证性因子分析的拟合指数相同,说明三个公因子在二阶上可以聚合为一个高阶因子,拟合度和稳定性较高,我们将其命名为考官评分策略。其中,“锚定策略”的标准化系数为0.791,“调整策略”的标准化系数为0.984,“匹配策略”的标准化系数为0.791,标准化路径系数在0.05水平下显著,说明“锚定策略”、“调整策略”和“匹配策略”能够反映考官评分策略的内容。
表3考官评分策略问卷的拟合指数
模型
GFITLIPNFICFIRMSEAECVIAIC
一阶验证性因子分析0.510.9861.0020.5921.0000.0000.23497.133
二阶验证性因子分析0.510.9861.0020.5921.0000.0000.23497.133
三、研究结论
(一)公务员面试中考官使用了多种评分策略
探索性因子分析和验证性因子分析结果表明考官在评分中组合使用了“锚定策略”、“调整策略”和“匹配策略”三种评分策略。全部研究样本显示(见表4),“锚定策略”均值最高,其次是“匹配策略”,最后是“调整策略”,说明考官评分中更倾向于使用“锚定策略”。独立样本t检验发现,2014年和2015年考官的“锚定策略”和“调整策略”评分策略没有显著差异,而“匹配策略”有显著差异,说明考官的“锚定策略”和“调整策略”是比较稳定的,而“匹配策略”是不稳定的。
表4考官评分策略的统计描述
2014年样本2015年样本全部研究样本
均值标准差均值标准差均值标准差
锚定策略3.64170.51063.63860.627223.640.5712
调整策略3.04590.571743.06770.721063.05680.6502
匹配策略3.459***0.571893.6905***0.608373.57480.60109
说明:***表示在0.01显著水平下两个样本具有显著差异。
(二)考官之间的评分策略组合方式存在差异
虽然公务员面试中考官同时使用了三种评分策略,但是三种策略的具体组合存在差异。以“锚定策略”和“匹配策略”为例,考官对这两种评分策略的使用情况可以分为高“锚定策略”组、低“锚定策略”组、高“匹配策略”组和低“匹配策略”组四种类型。研究表明(表5),34.9%的考官采取了高“锚定策略”、高“匹配策略”的组合方式,22.6%的考官采取了低“锚定策略”、高“匹配策略”的组合方式,12.5%的考官采取了高“锚定策略”、低“匹配策略”的组合方式,30%的考官采取了低“锚定策略”、低“匹配策略”的组合方式,说明考官虽然整体上更倾向于使用“锚定策略”和“匹配策略”,但考官之间的评分策略组合方式存在差异。
表5考官评分策略组合类型及比例
高“锚定策略”组低“锚定策略”组
高“匹配策略”组34.9%22.6%
低“匹配策略”组12.5%30%
说明:高“锚定策略”组中,考官选择“锚定策略”的分值高于该策略均值,反之则是低“锚定策略”组。高“锚定策略”组中,考官选择“锚定策略”的分值高于该策略均值,反之则是低“锚定策略”组。
在每种评分策略内部,考官之间的评分方式组合存在差异,我们用考官对每种评分方式的使用情况来表示(见表6)。例如,“锚定策略”包括5种评分方式,90.4%的考官比较赞同和完全赞同“我心中有一个大致的评分区间”,还有9.6%的考官持不太赞同态度。28.4%的考官比较赞同和完全赞同“当考生的想法或价值取向与自己不相符时,我不自觉降低其分数”,还有72.6%的考官持不太赞同或完全不赞同态度。整体而言,考官最倾向于使用的评分方式是“我心中有一个大致的评分区间”,最不倾向于使用的评分方式是“当考生的想法或价值取向与自己不相符时,我不自觉降低其分数”。因此,对于“锚定策略”而言,所有考官都使用了5种评分方式,但考官对5种评分方式的使用情况是不同的,考官之间的评分方式组合存在差异。
表6“锚定策略”所属评分方式的使用情况
序号评分方式题项持赞同和完全赞同态度的考官占全部考官的比例
S1我心中有一个大致的评分区间。90.4%
S2考生的政治素质影响评分。84.6%
S3当考生出现与自己相似的想法和价值取向时,我会对其产生认同感,分数有所提高。48.3%
S4当考生的想法或价值取向与自己不相符时,我不自觉降低其分数。28.4%
S5我熟悉应聘岗位,考生表现与岗位要求的符合程度影响我的评分。28.4%
(三)面试中考官对不同的考生使用不同的评分策略组合
“调整策略”研究显示,面试中考官受到考生外貌、考生在面试中的实际表现以及其他考官的影响会调整自己的评分区间。21.1%的考官比较赞同或完全赞同“其他考官与我之间评分差异太大时,我会改变我心里的评分区间”,在公务员面试中考官会把自己的评分与其他考官的评分进行比较,根据评分的整体情况调整自己的评分区间,表现为评分普遍比较低的考官会提高分数,评分普遍比较高的考官会降低分数。22.8%的考官比较赞同和完全赞同“当考生回答的内容与标准答案差异比较大时,我会给同情分”,说明这部分考官对能力比较差的考生的评分高于实际应得分数,考官根据考生的表现对自己的评分区间进行了调整。70.5%的考官认为面试过程中外貌影响评分,但随面试过程的推进,外貌的影响减弱,考官根据考生的外貌使用不同的评分区间。因此,由于受到考生外貌、考生在面试中的实际表现以及其他考官的影响,“调整策略”中评分区间产生变化,同一考官对不同考生进行评价时,考官利用不同评分区间的“调整策略”结合“锚定策略”和“匹配策略”组合形成差异化的评分策略。
(四)公务员面试考官评分策略具有政治性
四、总结与研究展望
由于数据限制,本文没有对以下问题进行研究:(1)公务员面试考官评分策略是否影响面试的信度和效度。本研究提出公务员面试中考官评分存在11种评分方式,构成三种评分策略,但这三种评分策略是否影响面试的有效性和稳定性,本文还未涉及,这是下一步研究需要解决的问题。(2)考官三种评分策略对面试的信度和效度分别有何具体影响。“锚定策略”表明考官有着特定的评分区间,“调整策略”表明考官改变了内心的评分区间,面试中考官会改变自身的评分策略,“锚定策略”和“调整策略”对面试信度和效度的影响可能会不同,到底有何不同还有待于进一步证实。(3)考官评分策略的选择受到哪些因素的影响。已有研究表明考官评分方式与考官个人特征有关,这些研究集中于考官个人特征与考官是否使用“与我相似”这种评分方式,例如考官的性别、教育程度、工作经验等[23][24],暂未发现其他个人特征是否影响其它评分方式的研究,本文也未涉及到这个问题,未来研究可以将考官个人特征与多种评分方式结合起来,更加全面探讨考官个人特征与评分策略之间的关系,以便识别哪些因素影响考官评分策略的选择和使用。
[参考文献]
[1]KikerDS,MotowidloSJ.EffectsofRatingStrategyonInterdimensionalVariance,Reliability,andValidityofInterviewRatings.JournalofAppliedPsychology,1998,83(5).
[2]陈学军.面试考官的权重策略对评分和录用的影响[J].应用心理学,2009,15(4).
[3]王文中.Rasch测量理论与其在教育和心理之应用[J].教育与心理研究,2004(4).
[4]VanVianenEM,VanSchieEC.M.AssessmentofMaleandFemaleBehaviourintheEmploymentInterview.JournalofCommunity&AppliedSocialPsychology,1995,5(4).
[5]AndersonN,ShackletonV.DecisionMakingintheGraduateSelectionInterview:AFieldStudy.JournalofOccupationalPsychology,1990,63(1).
[6][7]JacksonDN,PeacockAC,HoldenRR.ProfessionalInterviewers’traitInferentialStructuresforDiverseOccupationalGroups.OrganizationalBehaviorandHumanPerformance,1982,29(1).
[8]RynesS,GerhartB.InterviewerAssessmentsofApplicantFit:AnExploratoryInvestigation.PersonnelPsychology,1990,43(1).
[9]Kristof-BrownAL.PerceivedApplicantFit:DistinguishingbetweenRecruiters’perceptionsofPerson-jobandPerson-organizationFit.PersonnelPsychology,2000,53(3).
[10]KataokaHC,LathamGP,WhyteG.TheRelativeResistanceoftheSituational,PatternedBehavior,andConventionalStructuredInterviewstoAnchoringEffects.HumanPerformance,1997,10(1).
[11]JudgeTA,HigginsCA,CableDM.TheEmploymentInterview:AReviewofRecentResearchandRecommendationsforFrutureresearch.HumanResourceManagementReview,2000,10(4).
[12]BarrickMR,DustinSL,GilukTL.CandidateCharacteristicsDrivingIInitialimpressionsduringRapportBuilding:ImplicationsforEmploymentInterviewValidity.JournalofOccupationalandOrganizationalPsychology,2012,85(2).
[13]TsaiWei-Chi,HuangTun-Chun,YuHui-Hui.InvestigatingtheUniquePredictabilityandBoundaryConditionsofApplicantPhysicalAttractivenessandNon-verbalBehavioursonInterviewerEvaluationsinJobInterviews.JournalofOccupationalandOrganizationalPsychology,2012,85(1).
[14]GilmoreDC,BeehrTA,LoveKG.EffectsofApplicantSex,ApplicantPhysicalAttractiveness,TypeofRaterandTypeofJobonInterviewDecisions.JournalofOccupationalPsychology,1986,59(2).
[15]KockFD.EffectsofRater-rateePersonalitySimilarityonRatingofTaskOrientatedWorkBehaviour.InternationalJournalofPsychology,2012,47.
[16]McCarthyJM.AreHighStructuredJobInterviewsResistanttoDemographicSimilarityEffectsPersonnelPsychology,2010,63(2).
[17]GravesLM,PowellGN.SexSimilarity,QualityoftheEmploymentInterviewandRecruiters’evaluationofActualApplicants.JournalofOccupationalandOrganizationalPsychology,1996,69(3).
[18]谷向东,李铮.领导干部竞争性选拔中考官评分者信度研究[J].中国人力资源开发,2012(7).
[19]徐建平,周瀚,李文雅等.结构化面试中面试官的评分及影响因素[J].心理科学进展,2014,22(2).
[20]ArveyRD,CampionJE.TheEmploymentInterview:ASummaryandReviewofRecentResearch.PersonnelPsychology,1982,35(2).
[21]KristofAL.ApplicantImpressionManagement:DispositionalInuencesandConsequencesforRecruiterPerceptionsofFitandSimilarity.JournalofManagement,2002,28(1).
[22]BarrickMR,ShafferJA,DeGrassiSW.WhatYouSeeMaynotBeWhatYouGet:RelationshipsamongSelf-presentationTacticsandRatingsofInterviewandJobPerformance.JournalofAppliedPsychology,2009,94(6).
[23]WexleyKN,YoutzMA.RaterBeliefsaboutOthers:TheirEffectsonRatingErrorsandRaterAccuracy.JournalofOccupationalPsychology,1985,58.
[24]PosthumaRA,MorgesonFP,CampionMA.BeyondEmploymentInterviewValidity:AComprehensiveNarrativeReviewofRecentResearchandTrendsoverTime.PersonnelPsychology,2002,55(1).