显示带有标签的帖子 WJ-R. 显示所有帖子
显示带有标签的帖子 WJ-R. 显示所有帖子

2015年10月15日,星期四

WJ向WJ IV GIA和CHC集群的演变


点击图片可放大

各种版本的WJ认知电池(WJ,WJ-R,WJ III,WJ IV)的长期用户都知道该电池随着时间的推移不断发展。 上面是一张大表的一部分,总结了GIA(g评分)和各个版本中广泛的CHC群集中包含的相同和不同的测试。 完整的表格表明WJ并没有保持静止,每个新版本都根据研究和理论进行发展。  

当考官想比较来自以下方面的分数时,就会有完整表格的实际好处: 《 WJ》不同版本中名称相似的聚类分数-不同分数可能部分是由于 跨版本集群。 我希望这是有帮助的。

完整的表格可以是 在这里下载。 该表改编自
D.Cormier,K.McGrew, Bulut,O.,Funamoto,A.(2015年)。 探索学龄期广泛的卡特尔-洪卡罗尔(CHC)认知能力与阅读成绩之间的关系, 稿件已提交出版。

2012年12月25日,星期二

我们做什么'我们从CHC COG-ACH关系研究的20年中学到了:回到未来,超越CHC

我在会议上提交的论文草稿 第一理查德·伍德考克认知评估研究所 (过去的春季在塔夫茨大学)现在可以通过点击 这里. Three of 的 12 数字s are included below......as a tease :). 的 final paper will be published 通过 WMF出版社.

 

2012年11月25日,星期日

CHC认知成就研究20年的意义:回到未来以及超越CHC

[点击图片放大]
 
关键从我第一次演讲时的幻灯片 理查德·伍德考克认知评估研究所 现在发布在 幻灯片分享. 我以为我以前曾发布过这些内容,但似乎找不到它们。  So 他们来了 第一次(或第二次)。 以下是我也提交的论文摘要,最终由 WMF出版社.


已经学到了很多 CHC CHC COG-->期间的ACH关系 过去20年(麦格鲁& Wendling’s, 2010).  本文基于现有研究,首先阐明了 definitions of 能力, 认知能力, 成就能力才能.  之间的差异 一般领域特定领域CHC预测学校成绩的指标。   卡夫曼的承诺’s “intelligent” 情报 通过两种方法说明了测试方法 基于CHC的选择性引荐为重点的评估(SRFA).  接下来,一些新 智能 test design (ITD)原则进行了描述, 通过一系列采用各种方法的探索性数据分析证明 数据分析工具(多元回归,SEM因果建模, 多维缩放)。  ITD 原理和分析得出了建造 发育敏感的CHC一致性 学术能力集群,可以在以下方面发挥重要作用的措施 SLD的当代第三种方法(优势和劣势模式) identification. 
需要超越 COG的简单概念化COG-->讨论并证明了ACH关系和SLD识别模型 通过CHC COG的介绍和讨论-->交流电H因果SEM模型。  另一个 例如确定和量化建议 认知能力成就特质复合体 (CAATC)。  当前PSW第三方法SLD的修订 提出了将集成CAATC的模型。  最后,需要纳入 认知复杂度 测试 and 综合分数 在CHC域内 在设计和组织智能测试电池(以改善 提出了对学校成绩的预测)。  本文提出的各种建议代表了 (a)呼吁以新方法回归旧观念(回到未来)或(b)接受新的想法,概念和 需要心理学家超越主导者范围的方法 人类认知能力的CHC分类法(即 超越CHC)。




2012年9月10日,星期一

AP101简介#16:超越CHC:CHC内部域复杂度优化措施

[注意:  这是较大论文的工作草案(CHC认知成就研究20年的意义: 回到未来,超越CHC)将在第一个 塔夫茨大学理查德·伍德考克当代认知评估研究所开幕大会(2012年9月29日):  CHC理论和认知评估的发展。] 对WJ III测试战的工作知识将使本简介更容易理解,但这不是必需的。

B超越CHC:  ITD—CHC内部域复杂度优化 Measures
            优化中 CHC措施的认知复杂性
我最近开始认识到 不伦瑞克对称 派生的 柏林情报机构(BIS) 模型可以在应用智能研究中发挥作用,特别是对于增加预测指标的情况 通过最大化这些关系 通过匹配维度上的预测标准空间来建立关系 认知的 complexity.  What 是 认知的 complexity? 它为什么如此重要? 更重要的是,它应该扮演什么角色 设计智能电池以优化CHC COG-交流电H relations?
认知性 复杂性通常是通过检查单个测试负载来实现的 主成分分析中的第一个主成分(詹森, 1998).  The high G-测试的基本原理是测试性能更高 cognitively 复杂 “调用更广泛的基本认知过程 (Jensen,1998; Stankov,2000,2005)”(McGrew,2010b,第452页)。  High g装货 测试通常是MDS(多维缩放)radex模型的中心 (点击此处查看AP101简要报告#15: 认知能力成就特质示例)—但是这种同构不会 always hold.   大卫·洛曼(David Lohman),是 理查德·斯诺(Richard 雪)’s,已广泛使用MDS方法来研究情报,并且拥有一个 最好地掌握了什么认知复杂性,如 hyperspace of MDS 数字s, contributes 至 understanding 情报 和 intelligence 测试。  According 至 Lohman (2011), those tests closer 至 的 center are more 认知复杂due 五 possible factors—大量的认知成分过程;积累 加快组件差异:更重要的组件流程(例如, 推理);注意控制和工作记忆的需求增加;和/或 或对自适应功能(组装,控制和监视)有更多要求。 Schneider’s (in press) 抽象级别 广泛的CHC因素的描述类似于 认知复杂性。  He uses 的 simple 100米栏成绩的示例。  According 至 施耐德 (in press), one could independently measure 100 米冲刺速度,然后停滞不前,越过障碍(两者 能力的例子)。  However, 进行100米的比赛并不是两种狭narrow的能力的总和。 更多的是狭义能力的非加法组合和整合。 这个比喻抓住了 认知复杂性—在认知测量领域,这是任务 在成功完成任务时,罗曼列举了五个因素中的更多因素 performance.
至关重要 重要性是对因素或 能力域的广度(即, broad 要么 狭窄) 同义的 with 认知复杂性.  更多 重要的是,认知复杂性并不总是一个测试设计概念(因为 由Brunswick Symmetry和BIS模型定义) 明确地 纳入 "智能"情报 test design (ITD)。  许多测试已经纳入了这一概念 他们的设计计划中的认知复杂性,但是我相信这种类型的 认知复杂性与CHC内部域的认知不同 这里讨论的复杂性。
对于 例如,根据考夫曼和考夫曼(2004)的观点,“在开发KABC-II时, 作者没有努力发展‘pure’五个CHC的测量任务 broad 能力.  在 理论, Gv 任务应排除 Gf 要么 s例如,以及其他广泛能力的测试,例如 GC 要么 l,仅应衡量该能力而已。 但实际上, 像KABC-II这样的认知能力综合测试可以衡量问题 在不同环境下和不同条件下解决 复杂 有必要评估 高级功能”(第16页;增加了斜体)。 虽然考夫曼’强调重要性 CHC接地的智力测试电池中认知复杂的测量方法 描述将复杂的措施定义为 阶乘复杂或 来自多个CHC领域的能力的混合度量.  The Kaufman’也可以解决认知问题 非CHC神经认知三嵌段功能性Luria的复杂性 当他们指出重要的是要提供神经认知模型 评估“动态整合这三个模块” (Kaufman &Kaufman,2004年,第13页)。   对神经认知整合(以及因此的复杂性)的强调是 也是最新Wechsler电池的明确设计目标。 如WAIS-IV手册(Wechsler,2008年)所述, “尽管评估和划分更多内容有明显的优势 认知功能领域狭窄,几个问题值得关注。 首先,认知功能是相互关联的, 在功能和神经方面,使其难以测量纯域 认知功能” (p. 2).  Furthermore, “measuring psychometrically 纯 factors of discrete domains 可能对研究有用,但不一定会产生信息 在实际应用中具有丰富的临床意义或实用性(Zachary, 1900)” (Wechsler, p. 3).   Finally, 埃利奥特(Elliott,2007)同样主张承认的重要性 基于神经认知“复杂 信息处理”(第15页;增加了斜体)。 DAS-III,可进行描述于CHC中的测试或复合材料测量 域,在测试设计中同样重要。
ITD 这里阐述和提出的原则是努力发展 认知上复杂的测量 在广泛范围内 CHC domains—也就是说,无法通过能力融合来实现复杂性 跨越CHC广泛的领域,而不是尝试直接链接到神经认知 network integration.[1]  基于Brunswick对称性的BIS模型 提供了通过开发和分析实现此目标的框架 通过关注认知来测试复杂性 内容 运作方面。 
图12 展示了大多数关键WJ III的二维MDS Radex模型的结果, 狭窄的CHC认知和成就集群(适用于来自 到成年后期大约6岁)。 [2]   The current 图12中结果的解释重点仅在于程度 of 认知复杂性 (proximity 至 的 center of 的 数字) of 的 broad 和同一域内的WJ III狭窄群集( 内容和操作方面 不是当前材料的重点)。  Within a domain 的 最广泛的 三测 父母 聚类由黑色圆圈表示。[3] 两次测试的广泛类由灰色设计 circles.  Two test 狭窄 后代 广泛领域内的集群是 由白色圆圈指定。  All 域中的群集通过以下方式连接到最广泛的父广泛群集: lines. 至关重要的 信息是各自父母的域内认知复杂性 和兄弟姐妹集群,以它们与中心的相对距离表示 of 的 数字. 一些有趣的结论 are apparent. [点击图片可放大]

首先,作为 可以预期,WJ III GIA-Ext集群几乎完美地集中在 figure—它显然是认知上最复杂的WJ III集群。  相比之下,三个WJ III Gv集群 在认知复杂性方面比所有其他具有 没有特定的Gv集群显示明显的认知复杂性优势。   As 预期的是,测得的阅读和数学成绩集群主要是 认知上复杂的措施。  However, 那些与基本情况打交道的成就集群 技能 (数学计算—MTHCAL;基本阅读技巧—RDGBS) are 不太复杂 应用 集群(阅读理解-RDGCMP;数学推理-MTHREA)。 
最多 图12中有趣的发现是差异性认知复杂性 CHC域中的模式(至少有一个父级和至少一个父级 offspring cluster).  对于 example, 的 较窄的知觉速度(Gs-P)后代簇在认知上更为复杂 而不是广泛的父Gs集群。  The broad Gs集群由视觉匹配(Gs-P)和决策速度组成 (Gs-R9; l-NA)测试,用于衡量不同的窄能力的测试。 相反,感知速度簇(Gs-P) 由两个测试组成,这两个测试都测量相同的窄 能力(感知速度)。  这个 finding 乍看之下似乎有点反常理,就像人们期望的那样 由测量不同内容和操作的测试(Gs集群)组成 (包括以上定义和讨论在内)比其中一项更为复杂 相同的窄能力(Gs-P)的两个量度。 但是,一项任务必须分析两者 感知速度测试,以了解尽管两者都被分类为 测量相同的窄能力(感知速度),两者都不同 stimulus 内容认知操作.  视觉匹配需要处理数字刺激。 划掉要求处理 visual-figural 刺激。  These are two different 内容方面 在BIS模型中。  划掉视觉图形刺激在空间上更具挑战性 而不是视觉匹配中的简单数字。  此外,视觉比对测试要求应试者快速 查找并发现并标记两个相同的数字对。 相反,在淘汰测试中 为对象提供目标的视觉图形形状,然后对象必须 快速扫描一行复杂的视觉图像,并标记两个与 the target. 有趣的是,其他 unpublished  我已经完成的分析,视觉 匹配测试通常是对定量成就测试进行加载或分组 而Cross Out经常显示加载Gv因子。 因此,任务分析 内容 认知的 operations WJ III感知速度测试表明,尽管两者都是 被归类为Gs-P的狭窄指标,它们在任务上明显不同 requirements.  更多 important, 的 结合感知速度群集测试,似乎需要更多 认知过程比广义Gs簇复杂。 这一发现与阿克曼(Ackerman)一致, Beier 和 Boyle’s(2002)的研究表明,感知速度具有 通过识别以下四个子类型来扩展因子水平 感知速度(即模式识别,扫描,内存和复杂性; see McGrew 2005 和 施耐德 &McGrew,2012年,关于 速度能力的分层组织模型)。 基于Bruinswick对称/ 国际清算银行认知 复杂性原则,人们会预测一个由两个组成的Gs-P集群 相同任务的并行形式(例如,两个视觉匹配或两个交叉 测试)的认知复杂度将不如广义Gs。 这可能是正确的提示 假设存在于对Gsm-MS-MW域结果的检查中。
WJ III GSM 群集是数字反转(MW)和单词记忆的组合 (MS) 测试。 相比之下,WJ III 听觉记忆跨度群集(AUDMS; GSM-MS)群集在认知上要少得多 与Gsm相比更复杂(请参见图12)。  就像在上下文中描述的感知速度(Gs-P)集群一样 处理速度家族集群,听觉内存跨度集群是 由具有相同内存跨度(MS)窄能力的两个测试组成 分类(单词记忆;句子记忆)。 为什么这个狭窄的集群不那么复杂 它广泛的母体Gsm集群,而Gs-P和Gs则相反吗? 任务分析表明,两个记忆 跨度测试比两个感知速度测试更相似。 单词记忆和句子记忆 测试需要相同的认知操作—只需按顺序重复一次, 与主题说话的单词或句子。  这与WJ III感知速度群集不同 分类的窄Gs-P测试最有可能同时调用通用和不同 认知成分操作。  Also, 内存跨度群集测试由来自相同BIS内容的刺激组成 方面(即单词和句子;听觉语言/语言)。  相比之下,Gs-P视觉匹配和 淘汰测试涉及两个不同的内容方面(数字和 visual-figural).
在 相比之下,WJ III工作记忆簇(Gsm-MW)在认知上更强 比父Gsm群集复杂。  这个 发现与先前的WJ III s /感知速度和WJ III一致 Gsm /审核内存跨度讨论。  The WJ III工作记忆簇由倒数和听觉组成 工作记忆测试。  Numbers Reversed 需要从一个BIS内容方面处理刺激—numeric stimuli. 相反,听觉工作 记忆需要处理来自两个BIS含量因素的刺激—numeric 和听觉语言/语言;数字和单词)。 两项测试的认知操作 also differ.  两者都需要持有 主动工作记忆空间中的刺激。 反转数字则需要简单 以相反的顺序复制数字。  相反,听觉工作记忆测试需要存储 数字和单词在单独的块中,然后产生 每个块(数字或单词)的前向顺序,在一个块之前 the other. 更加依赖分裂 注意在听觉工作记忆测试中最有可能发生。 
综上所述, 图12中显示的结果表明它是 可能发展 聚类分数在相同的认知复杂度上有所不同 broad CHC domain.  更重要的发现是,将聚类分类为宽还是窄并不能提供有关度量认知复杂性的信息。 认知上的复杂性,如 将聚类分为宽泛还是窄窄分类无法提供有关度量认知复杂性的信息。 认知复杂性e Lohman感,可以在CHC域中实现,而无需诉诸混合 跨CHC域的能力。  最后, 狭窄的簇在认知上可能更复杂,因此可能更好 复杂的学校成绩的预测指标,而不是广泛的集群或其他狭窄的指标 clusters. 

含义 用于测试电池设计和评估策略
认可 认知复杂性作为一项重要的ITD原则表明,推动 在当代测试电池中或在 跨电池评估的构建,未能认识到 认知复杂性。  I plead guilty 至 通过我在WJ III的设计中的作用为这一重点做出了贡献 广泛关注CHC域构建体的广泛表示—most WJ III 狭窄的CHC集群需要使用第三本WJ III认知书( 诊断补充;伍德科克,麦格鲁,马瑟& Schrank, 2003). 同样地,有罪的人被控罪 CHC因子在原始模型开发中的代表性 跨电池评估原则(Flanagan&麦格鲁(McGrew),1997年;麦格鲁& Flanagan, 1998)。 
也是 我的结论是 窄一点更好结论 麦格鲁和温德林(2010) 可能需要修改。   重温麦格鲁和温德林(2010) results suggest that 较窄的CHC集群更能预测 学业成绩之所以如此之所以不一定是因为范围狭窄, 但是因为它们在认知上更加复杂.  我提供一个假设,即更正确的原则是 认知复杂measures 更好。   我欢迎专注于新的研究 测试这个原理。
在 回想起来,鉴于WJ III星团的宇宙,宽窄融合 智能电池配置(或跨电池评估)的方法可能 be more 适当。  Based exclusively 根据图12所示的结果,将出现以下簇 那些可能会更好地出现在“front 结束” of 的 WJ III 要么 a 选择性测试构建评估—考官应该去的那些集群 首先考虑每个CHC广泛领域:  Fluid Reasoning (Gf)[4],理解知识 (Gc),长期检索(Glr),工作记忆(Gsm-MW),音素意识3 (Ga-PC)和感知速度(Gs-P)。  No 虽然狭窄的可视化集群是 在认知上比Gv和Gv3集群稍微复杂一些。 以上表明,如果广泛的集群是 Gs,Gsm和Gv的域所需的,然后进行除“front end”或特色测试和群集需要管理 必要的Gs(决策速度),Gsm(文字记忆)和Gv(图片) Recognition) 测试。

利用ITD测试设计原则 优化CHC内部集群的认知复杂度表明, WJ III测试的不同重点和配置可能更多 appropriate. 建议 高于WJ III群集复杂度优先级或特征模型可能会允许 从业人员管理学校成绩的最佳预测者。 我进一步假设这种认知 基于复杂度的宽窄测试设计原理最可能适用于 坚持主要关注的其他智能测试电池 测试是两个或更多能力的最纯粹指标 在所提供的广泛的CHC解释方案之内。 当然,这是一个经验性的问题 求助于其他电池的研究。  更多 有用的类似MDS Radex跨电池认知复杂度分析 情报数据集。[5]

参考文献 (不包含在这篇文章中。 完整的论文将在不久的将来宣布并可供阅读和下载)



[1]这个 并不意味着认知复杂性可能与 the 人类连接体 或不同的大脑网络。我为当代感到兴奋 脑网络研究(Bressler&梅农,2010年;科尔,亚尔科尼,雷波夫斯, Anticevic &勇敢,2012年;托加,克拉克,汤普森,沙特克,& Van 喇叭, 2012;范登赫维尔&Sporns,2011),特别是那些 证明了神经网络效率与工作记忆之间的联系, 控制注意力和临床疾病,例如注意力缺陷多动症(Brewer,Worunsky, Gray, Tang, Weber &Kober,2011年;鲁兹,史格格,邓恩,& Davidson, 2008; McVay & Kane, 2012). The 顶额-额叶整合(P-FIT) 理论 智力与CHC相关联,尤其令人着迷 心理测量指标(Colom,Haier,Head,Álvarez-Linera,Quiroga,Shih,&荣格,2009年;迪里,彭克,&约翰逊,2010年;海尔,2009年;荣格& Haier, 2007年),并且可以与CHC认知优化的心理测量方法联系起来。
[2] 只要 包括阅读和数学类,以简化 结果和事实,如先前所报道的,阅读和写作措施 在多变量分析中通常无法很好地区分—and thus 的 w CHC理论中的领域。
[3]GIA-Ext也用黑色圆圈表示。
[4] 尽管WJ III流体推理3群集(Gf3)稍微靠近 center of 的 数字, 的 difference from 流体推理(Gf) 是 不 large 和 时间效率将证明需要进行两次测试的Gf集群。
[5] 它 重要的是要注意认知复杂性的分析和解释 这里讨论的是特定于 仅在WJ III电池内。度 WJ III认知集群中的认知复杂度与 其他智能电池的综合得分只能通过 跨电池MDS复杂性分析。

2010年12月2日,星期四

智商测试电池发布时间表:Atkins 先生 / ID Flynn Effect备忘单

随着我参与咨询 阿特金斯MR / ID 死刑 在这种情况下,经常提出的话题是 规范过时 (又名 弗林效应)。与其他人交谈时,我常常很难说出各种测试修订版的确切发布日期,因为我不仅要跟踪Wechsler电池(这是Atkins报告中的主要IQ测试)。我经常想知道其他人是否对我的专业知识表示怀疑...但是大多数人没有意识到,智商电池不仅仅是韦克斯勒的成人电池...,尤其是大量儿童通用电池和其他电池跨越童年和成年时期。因此,我决定为自己准备一份备忘单。我可以打印该备忘单并将其保存在文件中。我以简单的形式将其组合在一起Q电池发布时间表. Below 是 an image of 的 数字. Double click on it 至 enlarge.

需要理解的重要一点是,当开始认真讨论试验中的弗林效应时,在计算一组测试规范的过时程度时,通常不使用测试发布日期。而是使用对测试进行标准化/标准化的年份的最佳估计,该估计未包括在此图中(您需要找到此信息)。例如,WAIS-R于1981年出版...但是该手册指出规范是在1976年5月至1980年5月发生的。因此,在大多数弗林效应诉讼中,1978年(规范期的中期) )通常被使用。这使跟踪所有主要单独管理的IQ电池的专家难以回忆起这些信息。

希望对您有帮助...如果没有其他...您必须承认它很漂亮:) 点击图片查看





-使用我的Kevin McGrew的iPad使用BlogPress的iPost

2010年4月21日,星期三

智商测试DNA指纹:WJ III / 英美烟草三世与WJ-R / BAT-R的比较

这是另一个 智商的角落 “ 智商测试CHC DNA指纹” 测试比较系列。  这个 particular CHC指纹 数字 compares 的 CHC composition of 的 respective full scale 至tal composite 智商分数 from 的 WJ III / 英美烟草三世 以及这些电池的早期版本。 WJ-R / BAT-R.

有关此IQ全局IQ得分功能的开发,使用和解释的背景信息,请访问 先前的帖子 并在 智商测试CHC DNA指纹 博客侧栏上的部分。 可以在以下找到更多 智商的角落 姐妹博客...的 ICDP博客。

我现在比较一下 R / III 版本 WJ / BAT 如我所见的心理报告中的电池,以前曾对受试者进行过 WJ-R 后来经过修订 WJ III (对于讲西班牙语的人,我已经看到 BAT-RBAT-III---点击这里 有关WJ III ... 英美烟草三世西班牙语版本的更多背景信息。 

在这种情况下 WJ-R / BAT-R,完整的IQ合成称为 广泛的认知能力 (BCA)群集。  名称在 WJ III / 英美烟草三世一般智力 (GIA)集群。 名称的更改不是表面上的。 术语“一般智力最新 WJ III / 英美烟草三世 反映了这样一个事实,即全球智商综合得分旨在作为对一般智力理论结构的最佳统计估计(g),使用不同的测试砝码。

使用 主成分分析, 一种 g因子从这七个中提取 WJ III / 英美烟草三世 标准认知电池测试(各个年龄段), g系数加权(按年龄计算-它们随年龄的变化而略有变化), g重量用于 权衡七个测试对GIA-Standard综合聚类得分的贡献. 对于14个GIA扩展测试聚类得分,完成了相同的过程。 该过程将在 WJ III / 英美烟草三世 技术手册/报告,以及免费在线摘要 评估服务公告技术摘要.

在这种情况下 WJ-R / BAT-R,相应的7项测试BCA标准和14项BCA扩展集群得分均基于每组得分的简单算术平均值,因此得出 平均加权 全球智商得分。

因此,全球之间的差异 WJ-R / BAT-RWJ III / 英美烟草三世 智商得分可能是各个得分的函数,反映了Gf-Gc广泛能力的不同贡献。 CHC理论模型 构成电池的基础。

下面是 智商测试CHC DNA指纹 两个版本的比较 WJ-R / BAT-R WJ III / 英美烟草三世. 呈现的权重 WJ III / 英美烟草三世 是所有年龄段的中位数(平均)体重。 先前参考 会计准则委员会 (请参见上文)包括按年龄划分的特定体重表。

[double click on 数字 至 enlarge]

尽管各个全球智商得分的CHC组成没有显着变化,但是CHC能力存在足够的差异,这表明根据他们是否接受了相同的测试,可能会为同一个人产生略微不同的全球智商得分。 WJ-R / BAT-R 或者 WJ III / 英美烟草三世 (假设适当的管理,评分等)。 与心理测验智力理论(又称CHC理论)一致, WJ III / 英美烟草三世 总体智商得分(GIA-Stnd; GIA-Ext)的权重越高,则其表现越强 g加载的Gf(流体智力/推理),Gc(结晶智能或理解知识)和Glr(长期存储和检索)的度量。 相比之下,认知能力要求较低且与知觉(Gv,Ga),速度(Gs)和短期记忆(Gsm)功能相关的能力对个体的贡献较小 WJ III / 英美烟草三世 全球智商GIA得分高于 WJ-R / BAT-R.

如果在比较WJ的各个R / III版本的分数时发现明显差异,则检查人员应查看Gf-Gc CHC测试/集群资料,以确定某些(或全部)分数差异是否与从同等加权的全球智商得分(WJ-R / BAT-R)到差分加权(WJ III / 英美烟草三世)全球智商得分。 从理论上讲,一个人可以在每个电池上获得非常相似的测试水平分数,但是在这种情况下,因为“并非所有分数都相等”(在一般智力或g的估计中)。 WJ III,全球GIA 智商分数可能会发生变化。

其他 智商测试CHC DNA指纹 比较可以通过 点击这里. 将来会有更多。

[利益冲突说明: 我是WJ III / 英美烟草三世的合著者]

Technorati标签: , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , ,

2008年10月24日,星期五

随着时间的推移,WJ测试的可靠性

“测试不会一次到另一次改变:人们会改变。某些特征可能会有相当大的变化,而其他特征则相对很少。重新测试研究评估的是人们变化的趋势,而不是测试质量的某些方面。不能反映人类特征的这种变化的测试将是对这些特征的不敏感衡量”(McGrew,Werder,&伍德考克(199) 99)。

结束了 国家航空航天局 Listserv 嘎ry Canivez博士 在回答有关K-ABC和WJ得分变化的帖子时提出以下问题-“有人对WJ或KABC-2评分的长期稳定性有参考吗?我会对此类研究的参考感兴趣。”

报告中有一项非常复杂的重测研究。 WJ-R技术手册 (麦格鲁·沃德& 鹬, 1991) (点击这里查看/下载)。不幸的是,它在测试技术手册中……购买测试后,常常会忽略该文档。可以在以下文章中找到其他信息。

  • McArdle,J.J.,FerrerCaja,E.,Hamagami,F.,&Woodcock,R.W。(2002)。在整个生命周期内对多种智力能力的增长和下降进行纵向比较结构分析。发展心理学,38(1),115-142。 (点击查看)
我敦促从业心理学家阅读这些报告。是的..它们很难消化。他们没有报告简单的重测相关性。相反,它们是复杂的研究设计,旨在识别和划分随时间变化的测试分数差异的来源。某些测试的分数会随着时间变化...这就是您想要的...因为它反映了 性状变异....一些特征会随着时间而改变(就像我们的体重随着时间而改变...不幸的是,朝上使用)。通过测试测得的其他特征随着时间的推移更加稳定...因此,分数的变化可能会较小。

然后,当然,一个人的 (浓度,焦虑,疲劳等)在任何测试时刻都可能影响测试性能...并且测试对这些状态(例如Gsm,Gs)的敏感度可能会反映这些临时状态的波动。这反映了 状态方差...这并不是该措施的问题...该措施可以准确反映该人当时的行为。不幸的是,学校的心理学家(以及其他进行心理测试的人)通常接受测量培训,只谈论简单的测试-再测试可靠性研究和结果....这对我们的职业不利。我们需要更好地了解我们的仪器。正确设计的重测研究(重测间隔可变)可以帮助您识别和区分测试分数差异的不同来源,并将其分配给稳定或不稳定的变化分数差异的适当来源。

请特别阅读WJ-R技术手册摘录。这是我在本文中包含的两个来源中最易读和易懂的内容。

Technorati标签: , , , , , , , , , , , ,

2008年8月13日,星期三

一些CHC特定能力在学校学习中很重要:对g +特定能力研究的思考


[双击图像放大]


早在1997年,我与Dawn Flanagan,Tim Keith和Mike Vanderwood一起发表了第一篇 g +特异--->成就 文章中 学校心理学评论。我最近通过常用的库资源在高低处搜索了本文的pdf副本,但结果空白。我终于将副本扫描成pdf文件。可以通过以下方式查看本文的副本: 点击这里.

该文章中包括右图(双击以放大图)。我一直喜欢这个数字,因为它阐明了为什么 “拒绝吧” (针对智力测验子测验分析)研究需要根据以下方面的进展重新进行研究:(a)智力理论(CHC理论),(b)测量智力结构(Gf-Gc或CHC接地的电池),以及(c)统计方法(SEM与多元回归)。该图总结了1997年文章中的许多介绍性文字。坦白说,这份出版物是我最自豪的出版物之一。为什么?

首先,结果表明,某些特定能力对于理解阅读和数学成绩很重要 超越了 g (一般情报)。 恕我直言,这是一个非常重要的发现……并导致我们为 “只是说也许” 位置(例如:认知测验的优缺点描述的解释-S / W测量至少2项测验的综合结果-集群分数)。甚至 Dan Reschly博士,通常是与学校心理学中的反智商运动有关的人,在同一本SPR特别刊物的回应文章中指出(关于我们的1997年文章):
  • “关于重新考虑特定能力与一般能力结论的必要性,这些论点颇具说服力。显然,某些特定能力似乎具有改善个别诊断的潜力。 (Reschly,1997年,第238页)。
其次,这项“母亲”研究导致了一项有关g +特定能力研究的系统程序,该程序继续表明,某些广泛/狭窄的CHC能力对于理解阅读和数学成就的重要性超出了其影响范围。 g (一般情报)。可以找到以下文章列表: 点击这里. 点击这里 如果您想查看在IQ角上发布的所有g +种特定技能的帖子。现在有足够多的此类研究,当与CHC结合使用时,g 对多个回归研究进行建模,使我最近能够完成研究综合的形成性工作(CHC认知成就与荟萃分析项目相关)(我最终将在手稿中进行总结)。对所有研究的评论继续支持“只是说也许”的立场。

有趣的是,尽管不涉及阅读和数学成绩,但该著名杂志上的最新文章 情报 为g +特有的“也许说”位置提供了额外的支持。 CHC组织的文章 里夫(2004) 证明了特定的认知能力确实很重要(超越和影响了 g),以了解和解释特定领域知识的发展(k)。里夫(Reeve)的文章对文献进行了很好的回顾,并在许多方面反映(并扩展和增强了)我们在1997年的原始文章中提出的论点。我敦促对g +特殊能力辩论感兴趣的人仔细阅读Reeve的文献评论以及他的发现。鉴于样品的尺寸非常大(来自著名的n = 300,000+ 项目人才 项目)

最后,如果没有对“祖母”文章给予应有的赞誉,我会被遗忘,该文章首先激发了我们(McGrew等人,1997)最初的g +特异能力项目,并且在里夫(Reeve)中似乎也起了重要作用( 2004)研究。阅读以下文章后,我们便开始了最初的研究:
  • Gustafsson,J.-E.,&Balke,G。(1993)。总体能力和特定能力可以预测学校的成绩。多元行为研究,28,407–434. (点击这里查看)
现在已经足够了。我相信,现在有足够的研究证据表明,除了了解已获得的知识和学校成绩以外,还有更多的知识要理解。 g (一般情报)。当使用适当有效和全面的智力模型(CHC理论)以及适当设计和分析的模型时,发现某些特定的广泛或狭窄的特定能力很重要……而且其影响大小也不小。除了简单的全面了解,还需要更多了解学校运作 g型得分。

当然,如果一个人不相信 g (例如。, 约翰·霍恩(John 喇叭) 职位),那么狭窄和广泛的CHC能力就显得更为重要(如非g CHC组织了整合在上述研究综合中的多元回归研究。但是,这是另一个帖子(或一系列帖子)。

2008年7月18日,星期五

韦克斯勒算术测试:Gq或Gf的量度?

那是什么 韦克斯勒 算术 测试措施?为什么几十年来它的解释如此变化?为什么现在(根据CHC理论)最近将其归类为Gsm(短期记忆-工作记忆; MW)和Gf(流体推理-定量推理; RQ)的混合量度 跨电池评估要点 书(Flanagan,Ortiz和Alfonso,2007年)? [点击这里 如果您需要有关CHC理论以及主要功能,定义和缩写的更多信息,请访问[]

在准备我最近在 第三届全国学校心理学神经心理学会议,我查阅了《跨电池基础知识》第二版。我在第310页上注意到,与先前的算术测试的跨电池分类相反,它是Gq(定量知识-数学成就; A3)和Gf(流体推理-定量推理; RQ)的主要度量[注意 -作为第一本跨电池书籍的合著者,我参与了这些先前的分类 (ITDR:McGrew和Flanagan,1998年)特定于韦斯勒的可拆分交叉电池书(Flanagan,McGrew& Ortiz, 2000),现在已更改为Gsm和Gf。

首先,有一个历史记录。在ITDR和Wechsler跨电池书籍中,主要的Gq分类基于一系列设计的CHC / Gf-Gc 交叉电池(联合) 因素研究。二级Gf分类是基于逻辑内容分析的分类,为此,没有可用的CHC / Gf-Gc跨电池因子分析支持该分类。

CB Essentials第二版中第310页的评论指出,Gsm和Gf分类基于 “ 第四次世界大战技术和解释手册(Psychological Corporation,2003年)中的因子分析,以及Keith,Fine,Taub,Reynolds和Kranzler(2006年)中提出的因子分析结果。” 我的问题是这些支持分析都是 电池内 (仅适用于WISC-IV)验证性因子分析研究(CFA),因此在分析中未包括CHC指标的完整范围,尤其是其他Gq标记。如果您想看以前的文章,我对Keith等人的观点有所不同。算术分类 点击这里。 与XBA Essentials书籍作者之一的个人交流表明,Gf分类也旨在反映内容有效性证据。

为什么在使用电池内CFA进行CHC测试分类时会遇到问题?如果您想讲长话,可以阅读有关以下内容的优缺点的信息: 内- 交叉电池 上面列出的前两本XBA书籍中的CFA研究。如果您想就此问题进行短期学习,可以 查看在线PPT节目 我刚刚上传了该文件,从概念上说明了电池内CFA研究的局限性……更重要的是,CHC设计的跨电池(联合)CFA研究的优势是根据CHC理论对测试进行分类。

迄今为止,我知道9种不同的Wechsler / 伍德科克-约翰逊 CHC / Gf-Gc设计的跨电池研究。所有9个研究都包括Gq的其他标记(数学成就测试)。在所有这些分析中,Wechsler算术测试对Gq都有很大的显着载荷(平均载荷在.70年代中期)....none在Gf上。在一项研究中 (菲尔普斯等,2005) s的次级负载很小。在所有这些跨电池研究中,算术都没有显示出显着的Gsm因子负载。您可以查看这些由CHC设计的跨电池发现的摘要,以及Keith等人的文章。 (2006年)模型,该模型基于当前(且我认为不准确)的算术Gf分类(由于在Gf因子上加载了0.79) 以下连结.

我的两分钱。 我认为,最好的分析方法认为Wechsler算术测试主要被解释为Gq(数学成就A3)的量度。我认为从业人员不应将此测试解释为对Gf的主要或强烈度量(流体推理-定量推理; RQ)。这并不意味着可能不涉及RQ。数据表明,如果涉及RQ,则方差量是微不足道的,并且与Gq-A3相形见。

利益冲突披露 -我是《 WJ III》的合著者,因此对Wechsler电池的竞争对手有经济利益。我再也没有从我合着的两本跨电池书籍中获得任何特许权使用费。

2008年1月11日,星期五

通过认知和语言测验预测WJ III阅读/数学

这是我的更新 CHC 认知能力和 阅读数学 研究项目ts(请访问以前的帖子以获取背景信息)。

我最近跑了 多元回归分析 在里面 WJ III 规范数据[利益冲突说明 -我是《 WJ III》的合著者,在这里我使用了整套的WJ III认知测验(原始的WJ III和WJ III 诊断补充 测试)和WJ III口语测试来预测WJ III(a)个别阅读测试,(b)阅读类,(c)个别数学测试和(d)数学类。

结果摘要表现已包含在CHC中 阅读数学 先前发布的摘要视觉图形思维导图。如摘要文件中所述,我在WJ III规范样本(6-8岁; 9-13岁; 14-19岁)中的三个不同年龄组上运行了逐步多元回归模型(后退)。我指定模型包括五个预测检验。由于可能的预测标准污染,在预测数学推理和定量概念测试(属于MR群集的QC测试的一半,包括数字系列类型的项目)。最后,回归模型是在每个年龄组中计算的相关矩阵上进行的,其中去除了年龄差异(基于年龄 标准分数s were used). 的 EM缺失数据算法 在矩阵计算期间被调用。然后将这些矩阵用于多元回归分析。

WJ III测试的描述和解释可通过以下链接获得: 先前的帖子 (第一个链接位于 “结果:第一阶段” 先前帖子的部分)

汇总表包括最终的标准化回归权重以及测试的编码,尽管这些测试未最终出现在最终的回归模型中,但往往在某些步骤中接近输入回归模型(基于对模型的检查)。 偏相关 在每一步)-叫他们 伴娘 测试。

该材料正在作为我正在完成的演讲的一部分 国家航空航天局 2008研讨会。对这些结果的解释,结合精选的综述和综合 CHC- 与非CHC组织的COG-ACH相关研究将在该研讨会上进行介绍,并最终发布该研讨会上精选的PPT幻灯片(在此博客中观看公告)。

请确认这些结果有 受到同行评审。结果以“原样”呈现,没有任何解释。如上所述,对此材料的解释将成为NASP研讨会的一部分。此外,此资料将包含在对 WJ III不断发展的知识网(EWOK),我计划在研讨会之前(或之后)进行更新。

尽情享受分析摘要的乐趣。我希望此信息的发布能激发其他CHC / WJ III学者和评估专家的假设产生和讨论。我敦促有兴趣的人对 CHC列表服务器...由于CHC 列表服务器提供了比静态博客“评论”帖子更动态的让与学习体验。

您可以通过以下两个链接直接过去并下载报告。


Technorati标签: , , , , , , , , , , , , , , ,

供电 抄写员.

2007年12月4日,星期二

两次WJ测试的处理速度(Gs)发育增长

我只是略读了Kail和Ferrer(2007; 儿童发展-点击这里查看)适合与年龄相关的(发育)增长的不同数学模型 WJ-R(Woodcock-Johnson-修订) 视觉匹配 划掉 测试。本文没有立即的实际应用。我对这篇文章感兴趣,因为它涉及WJ III的两项测试(利益冲突说明 -我是《 WJ III》的合著者。由于第一作者,我也阅读了这篇文章。凯尔。他(恕我直言)是研究动物生长发育本质的顶尖研究人员之一 认知处理速度(Gs).

文章摘要如下。

作者得出的结论是,二次模型和指数模型符合视觉匹配和交叉检验的增长模式,可以测试最好的结果。的 二次模型是最佳拟合模型。作者利用这一发现说明了这种分析如何有助于探索认知速度增长的基础机制(s)。

例如,作者注意到 “这些二次方的参数通常在质量上像在这里获得的参数:非线性变化是通过线性增加与非线性(幂函数)减少相结合而实现的。” 然后,他们指出其他具有类似二次方生长模式的生理/脑功能-例如, 总脑容量和总脂肪 在童年和青春期,所有这些都表现出相同的二次变化模式。作者认为,这样的发现可能暗示所有人都可能有 “常见的(未指定的)生物学基础。”

有趣的东西...但是对于应用程序智能测试领域不是那么实用。但是,我认为两项测试表明 相同的发展方式 可能会被解释为支持两者的解释 s 测试就像测量相同的潜在认知结构。

正如我在其他地方所写的,约翰·霍恩(John 喇叭)经常谈论人类能力构造的不同类型的有效性证据-结构(因子分析),遗传或遗传力,神经认知,标准结果和 发展的。从WJ-R和WJ III的EFA / 终审法院(结构)研究中我们知道,视觉匹配和交叉加载在共同的 s 因子。逻辑内容分析表明,它们都是狭义的度量 s P的能力知觉速度)。我认为,VM和CO都显示出相同的纵向发展模式,这一发现与现有的EFA / 终审法院结构研究相结合,发现这两项测试始终是一个共同因素,我认为这支持了逻辑狭义(第I层)的有效性。 )两种测试的分类作为 糖蛋白.

我仅花了两分钱,就从这一主要是理论上的研究中提取了信息/从实践中提取了信息。

抽象
  • 本研究的主要目的是检查纵向模型,以确定最能描述儿童和青春期加工速度发展变化的功能。在一个样本中,对儿童和青少年(N 5503)进行了两次平均时间间隔的两次心理测验,测试了处理速度:视觉匹配和消除。在另一个样本中,儿童和青少年(N 5 277)每6个月在Cross Out上进行四次测试。使用代表不同增长假设的六个纵向模型检查了两项任务中与年龄相关的性能变化。线性,双曲线,逆回归和过渡模型得出的数据拟合度相对较差;指数模型和二次模型的拟合度更好。讨论了后面这些模型的启发式价值。
供电 抄写员.

Technorati标签: , , , , , , , , , , , , ,