2011年9月22日,星期四

行动计划 AP101摘要#10:了解IQ分数差异:考官错误




为什么不同测试或同一测试在不同时间经常在智商得分上出现显着差异?的解释很多。以前的IAP 应用心理计量学101报告和摘要 谈到了许多原因。 点击这里 查看或链接到这些报告。

在第一 AP101报告,我建议您在阅读以下材料之前先阅读以下内容,其中提到考试管理和/或评分错误(考试者错误)是造成评分差异的可能原因。下面的简要报告解决了该主题。


测试程序和管理错误(检查员错误)

尽管大多数心理学家都对智力测验的标准化管理进行了严格的研究生培训,但有关遵守标准化管理和评分程序的现有研究一直(不幸地)报告说,对于新手和经验丰富的心理测验者,检查员错误的发生频率都有足够的规律性,值得关注。

拉莫斯(Ramos),阿方索(Alfonso)和谢默霍恩(Schermerhorn)(2009)总结了关于考官错误的现有研究,并报告说,大多数研究报告报告了足够的平均考官错误,可以使个人的智商得分发生显着变化。报告的最常见错误类型包括:未记录响应,使用了不正确的基础和上限规则,报告了不正确的全局IQ得分,不正确的子测验得分,特定项目的得分分配不正确以及个人年龄的计算不正确。在Wechsler相关研究中,Ramos等人的评论发现研究报告 每个测试记录的平均错误率从7.8到25.8错误,几乎90%的检查员犯了一个错误,而在一项研究中,所审查的测试记录的2/3导致了满刻度智商的改变。检验员错误似乎不像Ramos等人所针对的仪器 ’在WJ III认知能力测验中,每项测验记录的平均错误率为4.63错误。

在有经验的心理学家和正在接受研究生培训的学生中,WAIS-III的口头,表现和全面评分的得分差异分别高达25、22和11点,这证明了验证准确的管理和评分的重要性非常明显。智商得分(Ryan&Schnakenberg-Ott,2003)。尽管检查员报告了他们对评分准确性的信心,但Ryan和Schnakenberg-Ott报告的平均水平与标准(准确)测试记录相符,分别仅为26.3%(口头智商),36.8%(性能智商)和42.1%(全面智商) )。

这种级别的检查员错误令人震惊,尤其是在重要决策方面(例如,基于IQ得分的生死Atkins 先生 / ID 决策;是否有资格参加干预计划;是否有资格获得社会保障残疾基金)。考官的经验水平似乎不是一个解释性变量。最近,在调查单个子测验(WISC-IV词汇)时,Erodi,Richard和Hopwood(2009)报告说,在评估低能力和高能力受试者时可能会出现更多错误。

已经提出了许多测试开发以及专业培训和监测建议(请参见Erodi等,2009; Hopwood& Richard, 2005;Kuentzel等。 2011;拉莫斯(Ramos)等人,2009年; Ryad&Schnakenberg-Ott,2003年),其中一些已通过经验证明了准确性的提高(请参见Kuentzel,Hetterscheidt&Barnett,2011年)。

考官考试管理和评分错误可能是IQ-IQ得分差异不一致的原因。显然,在尝试解释任何智商得分或试图调和测试之间的智商-智商得分差异之前,第一步将是所有检查者都要仔细检查其得分。另一个明智的步骤是寻求由另一位经验丰富的考官对分数测试记录进行独立审查。对于Atkins做出的决定,应尝试确保原始IQ测试记录的副本安全以进行独立检查。如果存在任何明显的错误,则应予以更正并重新计算新分数。只有这样,心理学家才可以得出结论,即在一个个体的不同时间从不同的智商测试或同一测试版本得到的分数之间的一致性或差异。’s life-span.

Atkin中使用的任何智能测试结果’听证会必须接受原始测试方案的独立审查(对于旧的历史测试结果而言这是不可能的),以确保避免可能导致所报告的IQ得分显着不同的管理或评分错误。这对于阿特金至关重要’法院经常使用严格的特定智商的案例“bright line”降低分数以确定是否存在智力障碍。

以下是此简要报告主要来源的摘要。双击图像放大。


















-使用Kevin McGrew的iPad的BlogPress进行iPost

产生者: 标签生成器


没有评论: