显示带有标签的帖子 WJ III NU. 显示所有帖子
显示带有标签的帖子 WJ III NU. 显示所有帖子

2014年6月7日星期六

关于C-LIM框架在智能测试中的有效性的更多研究

另一篇文章添加到 文化语言解释矩阵研究文献。点击图片放大。可以找到文章的副本 这里.

"结论

从这项研究和先前的研究得出的主要结论是,语言需求是选择和解释认知能力测验时的重要考虑因素。这项研究的意义不仅限于对C-LIM的重新分类,还强调了C-LIM最初成立的潜在动机之一。—在选择,管理和解释认知能力测验之前,考虑学生的语言背景和能力的重要性。综合考虑学生的语言能力的评估应考虑到学生的语言能力(即会话能力)可能不能准确地表示学生的学术语言能力(Cummins,2008)。因此,由于教育与智商之间的关系,收集有关学生学术语言能力的信息将是有益的(Matarazzo&赫尔曼(1984)。在未来的研究中,学生的接受和表达语言能力可能是值得追求的,因为学生在课堂上的会话能力水平可能会误导教育者和心理学家,以为学生已经以与他相同的频率和深度接触英语。或她的同龄人(Cummins,2008)。此外,如本研究结果所建议,在评估认知能力时考虑语言能力的影响应继续得到经验证据的支持,而不是学校心理学家继续通过语言样本和学生访谈来依赖非正式的语言能力度量来获取有关语言能力的信息(Ochoa,Galarza,& 走 nzalez, 1996).

第二个结论是,尚不清楚如何以一种在理论上和实践上都有意义的方式来定量表示文化负载。一个重要但尚未得到解答的问题是:“从业人员在决定可能影响从认知电池选择和解释测试的文化影响时要考虑哪些变量?” Flanagan和Ortiz(2001)将文化负荷定义为“给定测试要求对主流文化有特定知识或经验的程度”(第243页)。但是,这个广义的定义并未确定实践者在实践中可能会考虑做出的有关学生的经历是否与主流文化显着不同的决定的特定变量。鉴于这些悬而未决的问题,有可能需要重新思考导致创建C-LIM及其分类系统的基础推理(如Styck所建议)&沃特金斯(Watkins),2013年),特别是在文化负载方面。特别是,重要的是要考虑实际发生的情况和可能发生的情况,因为这是C-LIM的预期用途。”

 

 

2014年2月26日,星期三

伍德考克-约翰逊四世(WJ IV)NASP 2014简介和概述研讨会幻灯片

(点击图片放大)

上周我和 Fred Schrank博士 南希·马特博士r,推出了新的 伍德科克-约翰逊四号电池全国学校心理学家协会 (NASP)在华盛顿特区举行的2014年年度大会。 我们提供了一个三小时的入门和概述研讨会。  NASP成员可以下载我们在NASP网站上提供的讲义。 据我了解,NASP最终将提供对研讨会视频的访问权限,该视频将使NASP成员可以查看并获得CEU积分(我对此不是100%的确定;请向NASP查询-不要给我发送电子邮件)。

由于我们介绍的信息现已公开,因此我们三位合著者希望向他人提供我们的介绍信息。 下面是三个演示文稿标题幻灯片。 每个后面都有指向我的链接 SlideShare帐户 (如果您想查看所有列出的三个以及所有其他PPT模块,请单击此链接),可以在其中查看幻灯片放映。 您会注意到,由于测试安全性问题以及即将发布的技术手册中各种技术信息的预发布性质,因此并未包括在研讨会上介绍的所有幻灯片。

请享用。 另外,作为《世界司法期刊》的合著者,我们都对该文书有经济利益。 在幻灯片的第1部分中有一个披露声明。 我的个人利益冲突披露声明可在以下网址找到: 心灵中心 网络门户。

其他信息可以在官方网站上找到 四世河滨出版 网页。 


 (点击这里 对于第1部分)


 (点击这里 对于第2部分)


 (点击这里 对于第3部分)

2013年12月21日,星期六

Gv 画廊名人堂:自举重采样

这是我对统计程序的简化Gv解释,称为 引导重采样。您可以通过特殊阅读 WJ III NU的ASB。点击图片可放大。

 

 

2013年5月20日,星期一

WJ III / 威斯康星州-III智力测验的聚类分析:OBG帖子


这是OBG(老歌,老歌)帖子,具有新的更新链接

在一个 先前的无耻插头,我简要总结了最近发布的基于WCH-III / 威斯康星州-III跨电池数据集的基于CHC的验证性因子分析研究的结果(Phelps,McGrew,Knopik&福特,2005年)。遵循最喜欢的类比口头禅(“探索数据集的方式不止一种”),我忍不住对数据进行了更为宽松的探索性分析。

考虑到数据的多元结构的Gv表示,我最喜欢的探索工具之一是 层次聚类分析 (有时称为“穷人”因素分析)。无需详细说明,我将前面描述的数据集用于 沃德的聚类算法。请注意,必须注意的是,聚类分析将为随机数据提供整洁的聚类树状图....因此,必须小心不要过度解释结果。但是,我发现聚类分析的约束较为宽松,尤其是测试聚类(和低阶聚类)持续崩溃,不断扩展为越来越广泛的高阶聚类,这非常令人发指--结果通常表明存在不同的广义( II层)或中层(根据Carroll的3层模型)。

我按现状显示当前结果(点击这里查看或下载)。博客作者将需要咨询以前的帖子以收集必要的信息,以解释 CHC 因子代码和名称,通过WJ III测试测得的能力等。

至少可以说,提出了一些有趣的假设。尤其是,我继续对更高阶的双重认知处理模型结构(在CHC分类法内)的可能性感兴趣,即 自动与受控/故意处理

2012年12月25日,星期二

我们做什么'我们从CHC COG-ACH关系研究的20年中学到了:回到未来,超越CHC

我在会议上提交的论文草稿 第一理查德·伍德考克认知评估研究所 (过去的春季在塔夫茨大学)现在可以通过点击 这里。下面列出了12个数字中的三个...作为嘲讽:)。最终论文将由 WMF 出版社.

 

2012年7月24日,星期二

宣布了新的WIIIP 2.0:Woodcock解释和教学干预软件


WIIIP 2.0

版权所有2012 Business Wire, Inc.

美国商业资讯

2012年7月23日,星期一 2:00 PM GMT

霍顿·米夫林 Harcourt推出下一代评估系统

解 是针对特定技能缺陷的理想选择;扩展到ELL学生

波士顿

全球 教育领袖霍顿·米夫林·哈考特(HMH)今天宣布, Riverside部门发布了下一代Woodcock Johnson 评估产品套件- 伍德科克口译和教学干预计划(TM)(WIIIP)2.0。新系统为用户提供了 在许多方面做出合理的临床和教学决策所必需的工具 Woodcock Johnson评估套件中的解决方案。而一些临床 市场评估仅提供评分机制,即WIIIP 2.0 再走两步,为用户提供解释指导和指导 每个学生的干预措施。 WIIIP 2.0还将干预措施扩展到 英语学习者(ELL),使教育工作者有能力克服语言障碍 并正确评估每个学生。

已建 为了扩大早期版本的优势,WIIIP 2.0提供了更新 基于研究的干预措施的数据库-总计超过500个。评估 然后将帮助教育工作者分析结果以正确识别 基于认知的成就与预期成就之间的差异 能力水平。如果发现学习差距,WIIIP 2.0将提供独特的 干预措施以确保满足每个学生的需求。

WIIIP 2.0在现有功能的基础上增加了以下功能:

   *包含的新干预措施 Cattell-Horn-Carroll(CHC)认知因素,代表了数十种新 干预或适应。
   *具体的新干预措施 适用于英语学习者(ELL)。
   *两项的项目级数学程序 数学测试,有助于发现数学知识和 接受形成性干预措施,以解决任何未开发的潜在问题 mathematics skill.
   *可以打印的三个报告 西班牙语,其中包括摘要,成绩报告和能力简介 report.

“这个 WIIIP的新版本令人兴奋,不仅因为它提供了新的干预措施, 但是由于非母语人士可以从中受益。”吉姆·尼科尔森说, HMH测试与评估部门Riverside总裁。 “ 2.0版反映了当今学校心理学家的需求, practitioners."

的 伍德考克·约翰逊产品系列包括十多个评估, 这些都沉浸在多年的研究和基于证据的探究中。

“不 WIIIP 2.0只能满足当今的需求,它可以提供评估 专业人士通向未来的桥梁-评估干预 链接,” WIIIP 2.0作者Fred Schrank博士说。“ 伍德科克-约翰逊 这套产品仍然处于评估干预环节的最前沿, 并且创建了WIIIP的更新和增强版本来满足需求 从事现代服务或向现代服务导航的评估专业人员 delivery 楷模."

WIIIP 当前的1.1用户可以通过工具包或可下载的升级程序获得2.0版本。对于 有关此产品或Woodcock Johnson套件其余部分的更多信息 评估,请访问 http://www.riversidepublishing.com .

关于 霍顿·米夫林·哈考特

霍顿 Mifflin Harcourt是一家全球性学习公司,其使命是变革 通过培养充满激情和好奇的学习者来生活。在世界上最大的 K-12以前的教育解决方案的提供商,也是其历史最悠久的公司之一 出版社,HMH结合了前沿研究,卓越的编辑和 技术创新,以改善教学环境和 解决复杂的扫盲和教育挑战。 HMH的互动式 以结果为导向的教育解决方案被120万人中的6000万学生使用 国家及其著名和获奖的小说,非小说类儿童书籍 全世界的读者都喜欢参考书目。欲获得更多信息, visit www.hmhco.com .

联系: 霍顿·米夫林·哈考特
比安卡 Olson, 617-351-3841
导向器, 企业传讯
比安卡[email protected]   

可以找到此公告的PDF副本 这里.

利益冲突披露: 我,凯文·麦格鲁(Kevin McGrew)是《 WJ III》的合著者。

2012年7月5日,星期四

AP101简报13:CHC一致的学术才能集群:回到未来


这是先前标题下发布的一组分析的延续  在SLD上下文中实现智能测试的可视化图形工具: 形成性概念和工具.  建议您阅读上一篇文章,以获得必要的背景和上下文,这里不再赘述。

第三 method SLD识别方法 (POSW; 优势模式 weaknesses主要由 弗拉纳根and colleagues, 以及 海尔及其同事和纳格列里 (see 弗拉纳根& Fiorrello, 2010 以进行概述和讨论)。  这些POSW第三种方法SLD模型的中心概念是,具有可能的SLD的个人必须显示出经验或理论上证明与该人缺乏的成就领域最相关的认知能力的认知缺陷。 也就是说,个人的认知缺陷与个人的学术缺陷是一致或一致的,在其他认知/成就优势的背景下,这些优势表明了非SLD领域的优势。 我经常将其称为 特定领域或能力和成就的综合体。

这些模型中固有的是 才能-成就的一致性或一致性.  重要的是要注意,才智是 与一般智力或智商相同。 在这种情况下,才智借鉴了已经存在了数十年的历史/传统才智概念。 理查德·斯诺和同事 (IMHO)撰写了有关此能力定义的最佳信息。 能力包括 认知的和服的 一个人的特征(请参阅 超越智商项目 )。  但是对于这个特定的职位,我仅关注能力的认知部分,简单来说,这代表了特定的CHC狭义或广义认知能力的最佳组合,这些能力与特定狭义或广泛认知中的成功高度相关成就领域。

与不同成就领域最相关的CHC狭窄或广泛能力是什么? 该信息由Flanagan及其同事(以各种形式 跨电池书籍和章节),最近在结构化的实证研究中 麦格鲁和温德林(2010 )。  这些基于CHC的COG-ACH关系摘要为评估专业人士提供了有关特定的广泛或狭窄的CHC能力的信息,这些能力与sudomain在阅读和数学以及写作(在较小程度上)最相关。 此外,McGrew和Wendling(2010)的综合报告提供了有关发展考虑因素的信息-也就是说,CHC能力对于不同成就领域的相对重要性随年龄的变化而变化。 McGrew和Wendling(2010)给出了三个年龄段(6-8岁; 9-13岁; 14-18岁)的研究结果。

在这种情况下,我进行了一系列分析(请参阅上面提到的第一篇文章作为推荐的背景读物g)以McGrew和Wendling(2010)的发现作为初始起点,并使用逻辑,经验和理论方面的考虑来确定两个示例性成就领域在相同三个年龄组中的最佳WJ III认知测验预测指标集。 从那以后,我就确定了两个成就领域(基础阅读技巧-BRS;数学推理-MR)中最好的认知预测器。 然后,我在WJ III NU规范数据中进行了每组精心选择的预测变量测试,并针对6岁至18岁之间的每个年龄段运行了多个回归模型。 我保存了每个预测变量的标准化回归系数, 按年龄绘制它们。绘制的原始标准化系数显示出清晰的系统发展趋势,但由于采样误差而出现明显的“反弹”。 因此,我使用非线性平滑函数生成了平滑曲线...该平滑曲线代表总体参数的最佳估计。 这项技术先前已用于探索WJ-R / WJ III集群与成就之间关系的各种研究中(请参见 麦格鲁(1993) and McGrew和Wrightston,1997年 举例说明和方法说明)。 以下是用于预测WJ III基本阅读技能群集的两个重要预测指标(言语理解;视觉听觉学习)的原始标准化系数和平滑曲线的图。 [点击图片放大]。显然,语言理解和视觉听觉学习的相对重要性随着年龄的增长而系统地增加/减少。

接下来的两个图显示了基于CHC的能力倾向聚类的最终平滑结果,用于预测WJ III基本阅读技能和数学推理聚类。

查看两个数字后,可以讨论很多内容。 以下是一些评论和想法。
  • 我所说的组成 CHC 一致的学术才能集群 进行理论和经验(CHC-->ACH研究综合)的意义。例如,在BRS和MR中,Gc-LD / VL能力(言语理解力)在所有年龄段都是显着的,并且随着年龄的增长,重要性逐渐增加。 在BRS中,视觉听觉联想记忆(Glr-MA; Vis-Aud。Learning)在学年早期(6至9岁)非常重要,但随后在预测模型中不再重要。 在MR模型中找不到此功能(测试)。  Gf 能力(定量推理-RQ,数字矩阵;通用顺序推理-RG,分析-综合)在各个年龄段对于预测数学推理成绩都很重要。  实际上,两者的相对重要性都随着年龄的增长而增加,特别是对于Gf-RQ(数字矩阵)的度量。 这两个Gf测试在BRS图中找不到。 相反, Ga能力(声音融合;声音意识)在BRS模型中很重要。 Gs 和 GSM -WM (一般领域 认知效率变量)同时存在于BRS和MR模型中。
  • 与WJ III通用智力能力(GIA-Std)集群相比,CHC一致的学力才能集群的解释方差量(多个R平方;图中的表)更高。.  在MR的最老年龄尤其如此。 当然,由于多重回归的性质,这些值会利用机会因素,并且在独立样本交叉验证中可能会有所缩小(是的...我可以将样本分成两半以进行开发,然后交叉验证模型。 。但我没有)。 
  • 这些按年龄划分的图比McGrew提供了更精确的CHC能力与成就之间关系的发展性质的图。&Wendling(2010)和Flanagan及其同事评论。 这些发现表明,在选择针对推荐人的选择性评估的测试时(请参阅McGrew&温德林(Wendling),2010年)至关重要的是,审查员必须了解CHC-ACH关系研究的发展性。 一些特定的狭窄CHC测试显示了各个年龄段的如此巨大变化,这一事实表明: 那些实施基于CHC的能力达成一致SLD模型的人员在确定应为一致性模型的能力部分检查哪些CHC能力时,必须谨慎,不要使用“一刀切”的方法。  在某些年龄段可能非常重要的能力在其他年龄段可能不重要(例如,在WJ III BRS能力倾向群集中进行的Vis-Aud。学习)。 
  • 以上结果进一步证实了McGrew的结论&Wendling(2010)指出,要开发更多以“智能”为参照对象的选择性评估策略,需要认识到这一过程需要对 CHC 能力X Ach域X年龄的三向交互 (发展状况)
这些结果表明,智力评估领域,特别是在与教育有关的评估方面,应“回到未来。"  1977年的WJ和1989年的WJ-R电池都包括学术能力组(SAPT; 点击这里 读取McGrew的两本WJTCA书中的相关精选文本)作为WJ / WJ -R的一部分 务实的决策差异模型.  特别是,请参阅 I型能力成就差异 第二个特征。 





WJ 和WJ-R SAPT是整个范本样本中四个最佳预测测试的差分加权组合。 请参见下面的两个图,它们显示了所使用的加权方案。 由于现在缺乏计算机化的标准表和评分功能,因此所有年龄段均使用了一套平均测试权重。

[WJ SAPT权重]




 As I 写于1986年 ,“ 由于它们的加权权重系统不同,WJTCA的学业才能群应该提供一些在心理教育评估领域可获得的最佳课程特定的期望信息”(第217页)。 伍德洛克(1984)),以捍卫SAPT 学校心理学评论明确指出,这些集群的组成是为了进行最佳的能力-成就比较。 He stated 日 在 "四个学业能力分类中的每一个所包含的认知技能的混合代表了与那些可以通过WJ认知子测验获得的成就技能的最佳匹配 ”(第359页)。 但是,当时WJ SAPT的价值并未得到充分的重视,这在很大程度上是由于IQ-ACH差异模型限制了评估专业人员按计划使用这些度量(McGrew,1994)。 不幸的是,这导致他们在WJ III中被淘汰,并被预测成绩(PA)选项取代,该选项根据基于WJ III的七个独立测试的基于年龄的最佳权重,提供了特定成就领域的成就预测GIA-Std群集。 尽管绩效评估的指标比GIA-Std更有效,更强,但基于PA的方法从未引起许多评估专家的关注……出于多种原因(此处未涵盖)。

正如我在1994年重申的那样,在讨论WJ-R SAPT(与以前相同的链接)时,“ WJ TCA-R差分智能集群的目的是提供对 当前 成就水平。 如果一个人在测量与特定成就领域相关的认知能力的个人测试中得分较低,并且这些测试包括在能力倾向集群中,那么该人当前的成就期望也应降低。 比起WJTCA-R或其他测试得出的任何基础广泛的得分,较窄的WJTCA-R不同的能力簇将更准确地传达此预期信息”(第223页)。

最初的WJ和WJ-R SAPT是 作为一致性/一致性概念的一个明确定义的综合SLD识别模型的一部分,Flanagan等人,Hale等人和Naglieri最终提出了这种方法。 它们是作为更一般的心理教育的一部分提出的 务实的决策模型.  但是,很明显,WJ和WJ-R SAPT领先于他们的时代,因为它们在哲学上与当代第三种方法的能力实现一致性/一致性组件的能力部分保持一致 SLD 楷模.  In a sense, 的 field has now caught up with 的 WJ /WJ-R operationalization of 才能 clusters 和 的 y would now serve an important role in 的 才能-consistency SLD 模型。 我认为,它们代表了可操作的最佳可用衡量方法 特定领域的才能 for different 成就 domains, which is 在 heart of 的 new SLD 模型。

是时候让SAPT回来了...回到未来...as 的 logic of 的 ir design is a nice fit with 的 才能 component of 的 才能-achievement 一致性/concordance SLD 模型。 现在该领域已准备好进行此类概念化和开发的措施。


但是,现在可以通过本(和之前)帖子中介绍的方法和分析来改进原始概念。 它们可以通过两种方法进行改进:

1.   CHC 一致的能力倾向集群(又名CHC设计者能力倾向).  Creating  4-5个测试集群是成就子域的最佳预测指标 应该利用现有的CHC COG->选择初始测试池以包含在预测模型中时的ACH关系文献.  现有的研究文献还应指导最终模型中变量的选择...不应让模型受预测的原始经验驱动。 这与WJ和WJ-R SAPTS不同,WJ和WJ-R SAPTS主要是基于经验标准(组合预测最大的成就差异)而设计的,尽管通过事后CHC镜头观察时,它们的构成通常具有相当大的理论意义。

2.  提供不同CHC SAPT中测试的基于年龄的发展权重.  WJ III的作者通过WJ III计算机评分软件实施了一种构建基于年龄的差分加权GIA g分数的方法时,提供了必要的创新以使其成为可能。 相同的技术可以很容易地应用于权重不断变化的CHC设计的SAPTS的开发(根据上述模型中的平滑曲线)。 该技术可用。

最后,我完全认识到,使用增量方差分区多元回归方法开发基于CHC的SAPT的过程存在很大的局限性。 In other papers (g +特异 使用SEM因果模型进行能力研究)我一直对这种方法持批评态度。 该方法在此处以“智能”方式使用.....预测因子的初始库的选择受CHC COG-ACH现有文献的指导,并且不允许变量盲目地进入最终模型。 本文(和之前的文章)的目的是证明设计CHC一致的学术才能集群的可行性。 我正在用其他方法进行其他分析,以扩展和改进这套形成性分析和结果。

建造它,他们就会来。



2012年5月28日,星期一

在SLD上下文中实施智能测试的视觉图形工具:形成性概念和工具

这篇文章中的幻灯片是初步的发现和形成性思想,它们将经过一段潜伏期,并有望最终出现在演示文稿和手稿中。正在开发该材料以帮助充实智能 选择性转诊评估 用于RTI治疗抵抗者,并提供信息以帮助实施各种 SLD 的第三种方法一致性/一致性模型。我相信,如果人们对数字进行足够的研究,这些数字就可以说明一切。熟悉全套的WJ III认知测验(包括诊断增补)会有所帮助,因为它可以使人破译测验名称的缩写。此外,还需要熟悉第三种方法一致性/一致性SLD模型的一般概念(请参阅 弗拉纳根& Fiorello, 2010)。另外,您需要熟悉 CHC 术语代码 了解每个测试被归类为测量的内容。

下面是Flanagan和Fiorello,2010年提出的第三种方法SLD模型的直观表示。 [点击图片可放大]



这些结果来自我对WJ III规范数据的艺术+科学探索性数据分析,这些数据由 麦格鲁和温德林(2010)。分析包括(a)使用WJ III认知测试的选定子集(一次一次使用向后消除变量;一次一次使用变量的后向消除)对两个阅读和两个数学成就子域(此处仅列出两个)进行多元回归预测。最后输入,以确保它们仍然不是应该保留在最终模型中的重要预测变量),(b)通过6-18岁之间的第一个未旋转的主成分计算所有认知测试g负荷,以及(c)多维WJ III认知预测因子的完整集合的比例缩放(MDS-Guttman Radex模型)。

提出了可视化的图形摘要,希望激发人们关于如何使用这些演示方法的思考,以使考官能够以数据为基础(但数量是有目的的),理论和逻辑进行智能的选择性推荐参考评估决策。

利益冲突警告。我是《 WJ III》的合著者。

点击图片放大。


















下面是第三种方法与上面的幻灯片之间的概念链接。




MDS 说明模型。









前三张幻灯片和第三种方法SLD模型之间的概念链接




由Kevin McGrew的iPad使用BlogPress发布
www.themindhub.com

2012年3月1日,星期四

行动计划 101简介#12:使用IQ部件分数作为SLD和MR / ID 诊断中一般智力的指标

   
           历史上的概念 一般情报(g ), 由全球情报测试电池组负责 全尺寸 智商得分对于具有以下特征的个体的定义和分类至关重要 特殊学习障碍(SLD) 以及具有 智障(ID)。  最近,当代的定义和操作标准提高了智能测试能力 综合 要么 部分分数 在SLD的诊断和分类中扮演更重要的角色,而在ID中则更重要。
            In 的 case of SLD , 第三方法 一致性 定义在(a)识别 一致性 低成就与相关的认知能力或加工障碍之间的关系;(b)个人必须表现出相对的认知和成就优势的要求(请参见 菲拉内罗弗拉纳根& Ortiz, 2010 )。  在第三种方法SLD方法中,没有强调全局IQ分数。
            In contrast, 的 11 版本 协会智障:定义,分类和支持系统 手册(AAIDD,2010年)将通用情报和全球综合智商得分作为对以下方面的定义的核心 智力功能. 这并非没有挑战。 例如,AAIDD ID 定义具有 被批评 因为过分依赖通用情报的构建,而忽略了当代心理学计量学理论和实证研究,这些研究已经集中在多维的智力层次模型上(即, 卡特尔-洪恩卡罗尔或CHC理论 )。
潜在的限制“作为一般智能障碍的ID”定义是由 智障残疾人确定委员会,在 国家研究委员会 报告“智力低下: 确定获得社会保障福利的资格” (Reschly, Meyers & Hartel, 2001). 这个国家专家委员会的结论是“在接下来的十年中,可能会更进一步地调整智力测验以及从中得出的IQ分数以及Horn-Cattell和Carroll模型。 结果,未来几乎可以肯定会更多地依赖零件分数,例如 GC Gf ,以及传统的复合IQ。 也就是说,传统的综合智商可能不会下降,但是与过去相比,将会更加重视零件得分”(Reschly et al。,2002,p.94)。 委员会指出“每当质疑一个或多个部分分数(子测试,量表)的有效性时,检查员还必须质疑该测试是否’的总分适合指导诊断决策。 总考试成绩通常被认为是客户的最佳估计’的整体智力功能。 但是,在某些情况下,总的测试成绩可能并不能完全代表整体认知功能,这对于某些人以及对他们而言都是如此。” (p. 106-107).
           在SLD和ID诊断和分类中,对智能测试电池复合零件评分的日益重视,提出了许多测量和概念问题(Reschly等,2002)。 例如,统计学上的显着差异是什么? 有什么有意义的区别? 当质疑整体智商时,哪些适当的认知能力应作为一般智力的代理? 总测验分数应为多少? 
适当的认知能力 只会是这里讨论的唯一问题。 这个问题解决 哪个组件或零件的分数与一般智力更相关(g)—也就是说,组成部分的分数很高 g装载机? 传统的共识是 GC (结晶的智力;理解知识) Gf (流体情报或推理) 是最高的 g负荷措施和构造,并且在诊断ID时最有可能成为身份提升的候选人(Reschly等,2002)。 尽管并非总是明确说明,但第三种方法一致性SLD定义指定个人必须证明“至少具有一般认知能力或智力的平均水平”(Flanagan et al。,2010,p.745),这是一个隐含地暗示认知能力和成分得分较高的陈述。 g-ness。
表1旨在为在SLD和ID的诊断和分类中使用零部件评分提供指导(单击图像放大并使用浏览器缩放功能) 查看;建议你 点击这里 来访问表格的PDF副本。并对其进行放大)。 表1总结了具有令人满意的心理测量特征(即国家规范样本,复合材料足够的信度和效度)的,全面的,国家规范的,单独管理的情报电池 g-得分)用于ID和SLD的诊断。



综合 g-得分 列列出了每个情报电池提供的全球一般情报得分。 这个分数是一个人的最佳估计的一般智力,目前与AAIDD的ID诊断最相关。  All 综合 g表1中列出的-scores满足 詹森s(1998) 心理测量误差 标准作为一般智力的有效估计。  As per 詹森s 测试次数 标准,所有智能电池 g-复合材料基于 最少九个 测试样本 至少三个 主要认知能力领域。  As per 詹森s 各种测试 标准(即信息内容,各种心理操作的技能和要求),从CHC理论的角度来看,电池的能力范围覆盖范围会有所不同四个(CAS,SB5),五个(KABC-II,WISC-IV,WAIS-IV),六个(DAS-II)和七个(WJ III)(奥尔蒂斯Flanagan& Alfonso, 2007; 基思& Reynolds, 2010 )。   根据詹森(Jensen,1998)的建议, 用于估计的特定测试集合 g 应该以尽可能少的测试数量尽可能接近地成为所有类型的心理测试的代表样本,并且应该尽可能平均地代表各种测试 (第85页)。 用户应咨询以下来源 弗拉纳根et al. (2007)基思和雷诺兹,2010年) 确定每个智能电池如何近似詹森的最佳设计标准,测量的特定CHC域以及每个电池组合中CHC域的比例表示 g-得分。
表1中还包括每个电池提供的组成部分的比例(例如,WAIS-IV语言理解指数,感知推理指数,工作记忆指数和处理速度指数),其后分别是 -电池 g-加载。[1]  Examination of 的 g现有电池的综合得分的高低(请参阅表1的最后三列)表明了传统的假设,即 Gf GC 是通用情报的最佳代理 掌握所有情报电池.[2] 
在SB5的情况下,所有五个复合零件得分在 g-装载(h2 = .72至.79)。 没有一个SB5复合零件得分比其他SB5得分更好地暗示了一般的一般智力(当不使用整体IQ得分时)。 另一个极端是WJ III,其中流体推理,理解知识,长期存储和检索聚类得分最高 g-WJ III中基于部分得分的解释的代理。 WJ III视觉处理和处理速度群集不是复合零件评分,应该强调其为一般智能的指标。 在所有包含处理速度组件分数的电池(DAS-II,WAIS-IV,WISC-IV,WJ III)中,各自的处理速度量表始终是通用情报的最薄弱的代表,因此不会被视为良好的智能产品。一般情报估计。 
           同样清楚的是,不能假设测得能力的相似名称的合成物应具有相似的相对 g-不同电池内的状态。  For example, 的 Gv 达斯 -II(空间能力),SB5(视觉空间处理)中的(视觉空间或视觉处理)集群相对较强 g-在各自的电池中进行测量,但对于WJ III视觉处理集群则不能说相同的方法。 更有趣的是WAIS-IV和WISC-IV相对值的差异 g-加载类似听起来不错的索引分数。 
例如,工作记忆指数最高 gWAIS-IV中的加载组件分数(与感知推理指数并列),但在WISC-IV中仅排名第三(四分之三)。  工作内存索引由WAIS-IV中的数字跨度和算术子测试以及WISC-IV中的数字跨度和字母序号子测试组成。 据报道,算术子测试是阶乘复杂的测试,可能会利用流体智能( Gf -RQ—定量推理),定量知识( Gq ),工作记忆( GSM ),以及可能的处理速度( s ;基思& Reynolds, 2010; 菲尔普斯,麦格鲁,诺皮克& Ford, 2005 )。    算术子测试的阶乘复杂特性(实质上使它的功能像迷你算子一样,g 代理)将解释为什么WAIS-IV工作内存指数是一个很好的代理 g 在WAIS-IV中,但不在WISC-IV中。 WAIS-IV和WISC-IV工作记忆指数量表尽管命名相同,但是 测量相同的结构。

A 严重警告 是那个 g无法比较不同电池的负载。  g当分析中包含的各种措施的组合发生变化时,载荷可能会发生变化。 不同的“风味” g 可能导致(Carroll,1993; 詹森,1998)。比较的唯一方法 g电池的极性经过适当设计 交叉或联合电池 分析(例如,在普通样品中分析的WAIS-IV,SB5和WJ III)。
上面和下面的智能电池示例说明,那些使用组成部分分数作为人的估计的人’的一般智力必须了解其组成和心理测验 g-每个智能电池内组件的得分得分。 并非所有不同智能电池中的所有零部件得分都是相同的(关于 g-ness)。 同样,并非所有类似命名的基于因子的综合评分都可能测量相同的相同结构,并且电池内部的度数可能会有所不同 G- 内斯。 对于因子分析中的因子命名,以及基于因子的智力测验综合评分,这并不是一个新问题。 悬崖(1983) 描述了这个 名义上的谬误 用简单的语言—“如果我们命名某事,这并不意味着我们了解它” (p. 120). 




[1] 如表1的脚注所示,所有综合得分 g凯文·麦格鲁(Kevin McGrew)通过在每本智能电池技术手册(请注意WJ III的例外情况)中输入已发布的相关矩阵的最小数量(涵盖的最大年龄范围)来计算负载(以获得WJ III的例外) g负荷估算。 对于每个智能电池,可以为每个年龄区分的相关矩阵计算和报告这些值。 但是,此表的目的是提供尽可能最佳的 平均 在每个智能电池的整个寿命范围内的价值。 弗洛伊德(Floyd)和同事发表了年龄差异的文章 g 达斯 -II和WJ III的装载。 这些值未使用,因为它们基于 主要公因子 分析方法, 分析测试之间的可靠共享方差。 尽管主要因素和 主成分 通常,载荷将在相同的相对位置订购量度,主因数载荷通常会较低。 鉴于不完善的清单综合量表分数是在实践中使用的分数,因此也可以使计算 g表1中报告的载荷在这项工作中使用了主成分分析。同样的理由用于不使用较高阶的潜在因子负荷 g每个测试电池的SEM / 终审法院 分析中的因素。 CFA分析得出的负荷代表了基础理论能力结构与 g 清除测量错误。 此外,电池技术手册(或独立的期刊文章)中报告的最终CFA解决方案通常会使测试变得相当复杂(加载多个潜在因子),这种测量模型与清单/观察实践中使用的综合评分。 高阶潜在因子加载 g因子通常会基于清单指标而与主成分负载有很大不同,无论是绝对大小还是相对大小(例如, 正在加载 g 在WJ III技术手册中,这与清单变量基于 表1中报告的负载) 
[2]h2 值是用于比较相对数量的值 g-每个智能电池中组成部分中存在的方差得分。

2011年5月13日,星期五

使用WJ III电池进行CHC狭窄能力评估:IAP Applied Psychometrics 101#12

我很高兴发布以下工作文件:  行动计划 应用心理计量学101#12: 使用WJ III电池进行CHC狭窄能力评估.

下面是摘要:

  • 最近,《学校心理学》(PITS)特刊“took stock”CHC研究的过去20年(牛顿&McGrew,2010年)。 McGrew和Wendling(2010)在这期特刊中回顾了现存的CHC认知成就关系研究,并得出结论:“主要行动是在狭窄的能力水平上” (p, 669).  McGrew和Wendling得出结论,如果目标是更好地理解,评估和发展针对阅读(例如,语音,理解)和数学(例如,计算,解决问题)子区域的干预措施,则缩小范围更好。 广泛的(第二层)CHC能力(例如,流体推理-Gf;听觉处理-Ga)可以最好地预测和解释广泛的学术领域(例如,总阅读量或广泛阅读量)。 但是,狭窄的(第一层)能力最好地预测和解释狭窄的学术领域(例如,阅读理解力)。
  • 本工作文件的目的是列出(a)WJ III测试作者提供的基于规范的狭窄CHC能力集群和(b)其他临床窄集群的列表(测试作者未在已发布的WJ III中提供)。 第二个目的是列出可能来自其他主要情报或成就电池的补充测试或综合,以用于补充所列的WJ III窄能力集群。  

本文档来自两个最近的演讲,其中我总结了当代研究,这些研究调查了广泛和狭窄的CHC能力与阅读和数学成绩之间的关系。 观众参与者,尤其是 佐治亚州学校心理学会 大会上,建议我需要制定一份有关WJ III相关资料内容的摘要表。 这份报告是对那些人承诺的“可交付成果”。 谢谢佐治亚州的学校心理学家。 该报告具有一些额外功能(例如Schenider&McGrew,正在发布CHC v2.0模型和定义-将于今年秋天在Flanagan中发布&哈里森(Harrison)的第三版 当代智力评估 )。  此奖励功能是一组简短的定义,建议读者在发布时阅读完整的章节以获取更多详细信息。

感谢您提供反馈意见,因为这是一项正在进行的工作。 我希望在此发生任何反馈/评论 CHC 列表服务器 (n = 1282且还在不断增长),因为与博客平台的评论功能相比,它可以更动态地交流思想。

谢谢。  请享用。


-使用我的Kevin McGrew的iPad使用BlogPress的iPost


产生者: 标签生成器
Technorati标签: , , ,

2011年5月1日,星期日

IQ's阅读:支持推理能力的速度(Carroll's 回覆 ; 喇叭's CDS)

情报中的“新闻中”文章 走 ldhammer等。 为推理速度提供支持。我在文章中通过 智商读物 博客功能。

似乎没有主要的个人情报机构来衡量这种结构。 《 WJ III》(利益冲突披露,我是《 WJ III》的合著者)的作者希望我们的“决策速度”测试代表这种能力中的某些能力。迄今为止,我们还不能证明这种解释的有效性。这可能是由于两个因素。首先,我完成的所有WJ III后分析都发现DS测试与检索流畅度和快速图片命名测试相辅相成。 RF和RPN的变迁非常强大。...我将其解释为反映了NA(命名工具)或通常称为RAN的狭窄能力,但是根据阅读研究,我更喜欢将其称为“词汇访问速度” Perfetti。 DS测验倾向于与其他两个测验“闲逛”,并且似乎在某种程度上利用了这种词汇访问能力的速度,这很可能是由于在确定哪两个是测验者之前,被测者需要快速访问常见对象的含义在概念上相同。

DS测试可以测量一些RE差异的另一种可能性,但是由于WJ III分析的测试集中缺少其他有效的RE指标,因此无法进行验证。

有人在寻找好的论文/论文吗?我可以设想进行一项研究,该研究可以对允许的感知速度(P),词汇访问速度(NA)和推理速度(RE)因素进行规范,其中还包括WJ III RF,RPN和DS测试。

双击图像放大







-使用我的Kevin McGrew的iPad使用BlogPress的iPost

产生者: 标签生成器


2011年1月2日,星期日

第四次世界大战的MDS分析

我不是一个秘密 多维缩放的忠实粉丝 (MDS,尤其是Guttman's Radex)模型,作为认知测试因素分析的补充。在浏览一些电子文件时,我发现了WISC-IV的最新3D MDS 分析。以下是抽象和最终的3D模型。单击图像可将您带到该图像的较大版本。








对于那些感兴趣的人 内容/刺激维度 我提出的认知能力评估设计和解释矩阵的原因是我将MDS应用于WJ III和各种Wechsler电池的数据。完整的“超越CHC理论可以在以下位置找到演示文稿 先前的帖子.



-使用我的Kevin McGrew的iPad使用BlogPress的iPost

2010年12月30日,星期四

2010年12月2日,星期四

IQ测试电池发布时间表:Atkins 先生 / ID Flynn Effect备忘单

随着我参与咨询 阿特金斯MR / ID 死刑 在这种情况下,经常提出的话题是 规范过时 (又名 弗林效应)。与其他人交谈时,我常常很难说出各种测试修订版的确切发布日期,因为我不仅要跟踪Wechsler电池(这是Atkins报告中的主要IQ测试)。我经常想知道其他人是否对我的专业知识表示怀疑...但是大多数人没有意识到,智商电池不仅仅是韦克斯勒的成人电池...,尤其是大量儿童通用电池和其他电池跨越童年和成年时期。因此,我决定为自己准备一份备忘单。我可以打印该备忘单并将其保存在文件中。我以简单的形式将其组合在一起Q电池发布时间表。下面是该图的图像。双击放大。

需要理解的重要一点是,当开始认真讨论试验中的弗林效应时,在计算一组测试规范的过时程度时,通常不使用测试发布日期。而是使用对测试进行标准化/标准化的年份的最佳估计,该估计未包括在此图中(您需要找到此信息)。例如,WAIS-R于1981年出版...但是该手册指出规范是在1976年5月至1980年5月发生的。因此,在大多数弗林效应诉讼中,1978年(规范期的中期) )通常被使用。这使跟踪所有主要单独管理的IQ电池的专家难以回忆起这些信息。

希望对您有帮助...如果没有其他...您必须承认它很漂亮:) 点击图片查看





-使用我的Kevin McGrew的iPad使用BlogPress的iPost

2010年11月13日,星期六

创造 new psychometrically sound test score 综合s - 的 合成器







是否曾经想过将来自智力或成就电池的两个或三个测试合并到测试的作者/发布者未提供的集群组合中?

大多数评估临床医生都有。不幸的是,目前还没有心理上合理的方法。如将来的文章中所述,计算单个测试比例或标准分数的算术平均值以生成伪复合材料是一种心理计量 不,不 导致分数不准确,并带有严重的心理缺陷。为了根据来自不同子测试的标准分数计算可辩护的综合分数,用户将需要进行乏味的计算,其中包括有关所需新聚类的所有测试之间的相互关系的信息,不同测试的标准偏差(除非所有测试均在进行中)一个通用的量表),以及每个测试的个体可靠性。仅从测试电池中收集技术手册中所需的信息就花费了太多时间。

输入 合成器 通过 乔尔·施耐德博士。必须看到并玩耍才能相信!







免费 合成器 是由伍德考克·穆诺兹基金会(Woodcock-Munoz-Foundation)昨天发布的。的 WMF 网页上的描述 是:

W. 乔尔·施耐德(Joel Schneider)博士的“ 合成器”是一种工具,旨在为使用Woodcock-Johnson的评估专业人员提供评估工具®III规范更新Compuscore和Profiles程序,版本3.1(WJ III NU)和Woodcock解释和教学干预程序,版本1.0(WIIIP),采用用户友好的统计方法来创建自定义的综合评分

因此,对于 WJ II NU,现在有一种在心理上可以辩护的方法来创建特殊簇。但这仅仅是程序的开始和第一级使用。施耐德(Schneider)博士拥有多种功能,可让用户创建因子分析得分,基于规范或 合成器 创建复合材料(例如,检查一组变量的预测能力以预测基本的阅读技能等)等。

该程序对所有测试专业人​​员(不是使用WJ III NU的专业人员)的独特和创新价值在于,该程序加载了各种基于心理计量学的功能,其中包括说明其工作方式和基础基本统计学的教学视频。 。我认为该程序是研究生水平的智力测试课程中非常强大的指导工具。学生可以使用不同的测试变量进行“假设假设”情景,并查看不同的决定如何导致不同的心理测验结果(例如,通过多元回归得出的不同预测水平)。可以模拟和比较因果建模方案。这些示例仅涉及程序功能的表面。

如果没有其他内容,与该程序相关的PDF手册值得一读...有关基本心理计量学概念的知识很多。

Schneider博士的免费软件具有很高的创新性。恕我直言,这是智力测验解释和教学的一项重大创新:基本心理计量学概念。

是的-该程序仅适用于WJ III NU。但这是免费的。 WMF 与施耐德(Schneider)博士一起工作,因为他认为有必要“推开”智能测试说明和解释的范围。结果,WMF为Schneider博士提供了访问所有电子WJ III NU数据文件的权限,这些数据文件提供了必要的必要的测试特征信息(如本文章的引言中所述),以创建心理上可辩护的综合评分。目的是推动智能情报测试领域的发展-其他测试作者和发布者将查看嵌入在智能测试中的概念。 合成器 作为将其纳入各自的测试电池和软件的想法。

合成器 应该被认为是一个原型,可以作为智力测验解释方面的新创新以及当前和未来智能测验用户关于基本心理计量学概念的教学的潜在说明性“引爆点”。目标是影响WJ III NU以外的领域。 WJ III NU心理测验胆量为Schneider博士提供了一种实施他的创新思想的手段-希望能证明可以并且应该做些什么来全面改善智力测试实践。

当然,能够创建任何想要的集群并非没有警告。编制新的综合评分应仅基于可靠的临床,理论或研究证据。从这个意义上说,该程序是一种愚蠢的工具,离不开用户的专业知识和技能-毕竟,“如果给猴子斯特拉迪瓦里斯的小提琴而音乐不好-不要怪小提琴 。”

最后,Schneider博士独特的方法来教授使用该程序的基础知识,可以在他的新博客中找到(从头开始的心理测验),他通过视频教程解释了统计和心理计量学概念……令人惊讶。签出并为频繁访问添加书签(或将其放入RSS feed阅读器中)

[利益冲突披露 -我是凯文·麦格鲁(Kevin McGrew),是《 WJ III NU》的合著者。我也是WMF的研究总监]。




-使用我的Kevin McGrew的iPad使用BlogPress的iPost