显示带有标签的帖子 认知复杂性. 显示所有帖子
显示带有标签的帖子 认知复杂性. 显示所有帖子

2013年5月24日,星期五

分类Gf测试的有用分类法:Oliver 威廉章

这是该博客历史上的早期文章。 仍然相关且重要。

在一个 先前的帖子 我总结了一个分类镜头,用于分析流体智能(Gf)的图形/空间矩阵测量的性能。从那时起,我有机会阅读“衡量推理能力”由Oliver 威廉撰写(请参阅有关推荐书籍的早期博客文章,以供阅读–本章是 威廉和恩格尔的《理解和衡量智力手册》)。以下是一些精选要点。

需要一个更系统的框架来理解全球金融措施

正如威廉所说,“当然不缺乏推理措施”(第379页)。此外,正如我在与Dawn Flanagan博士按照CHC理论对测试进行分类时所了解的那样,将Gf测试分类为一般顺序(演绎)推理(RG)归纳推理(I)和定量推理(QR)的措施非常困难。凯伦宁和克里斯塔尔 ’1990年的声明(在威廉一章中提出)指出,“推理能力的良好测试的发展几乎是一种艺术形式,这更多是由于经验的反复试验,而不是系统地描述了这些测试必须满足的要求”(第46页,在Kyllonen和Christal中;第379页,在威廉中)。因此,通常很难对Gf测试进行逻辑分类…或者,就像我们上学时说的那样。”no sh____ batman!!!!”

结果是,“scientists 和 practitioners are left with little advice from test authors as to why a specific test has 的 form it has. 它 是 easy to find two reasoning tests 那 are said to measure 的 same ability but 那 are vastly 不同 in terms of 的ir features, 在tributes, 和 requirements” (p. 379).

威廉’正式对推理措施进行分类的系统

威廉阐明了推理措施分类中要考虑的四个方面。这些是:
  • 对于mal 操作 task requirements –鼓励大多数CHC评估专业人员通过CHC镜头进行检查。测验是衡量RG,I,RQ还是多个窄能力的混合物?
  • 任务内容 –这是威廉的地方’的研究小组在过去十年中做出了许多重大贡献之一。威廉等人。提醒我们,仅仅是因为魔方’的智力立方体模型(吉尔福德 ’的SOI模型)严重不足,在操作和内容方面的智力测验分析在理论和经验上都是合理的。我担心许多心理学家由于对SOI解释框架的未兑现承诺而感到烦恼,常常将SOI沐浴水的内容抛诸脑后。有明确的证据(请参阅我以前的文章,该文章基于对 通过Carroll对数据进行50种CHC设计的措施) 那 most psychometric tests can be meaningfully classified as per 刺激 内容 –形象的,言语的和定量的。
  • 推理任务/问题的实例化 –推理任务的正式基础结构是什么?空间不允许在此进行详细的处理,但是当威廉建议有人必须通过一个“decision tree”确定问题是具体的还是抽象的。在抽象分支之后,相对于“nonsense” vs. “variable” 实例化. Following 的 concrete branch 决策树, reasoning problem 实例化 can be 不同iated as to whether 的y require prior knowledge 要么 不. And so on.
    • 正如威廉所说,“it 是 well established 那 的 form of 的 实例化 has substantial effects on 的 difficulty of structurally identical reasoning tasks” (p. 380).
  • 任务易受推理‘strategies” –所有好的临床医生都知道并且已经看到,某些应试者通常会通过部署独特的元认知/学习策略来改变心理测量任务的内在本质。我经常把它叫做“由考生扩展测试的特异性。”据威廉说,“如果一组参与者选择不同的方法来进行给定测试,则结果是该测​​试针对不同子组测量不同的能力…根据所选择的策略,不同的项目分别是容易的和困难的”(第381页)。不幸的是,用于确定在推理任务执行过程中使用哪些策略的基于研究的协议几乎不存在。

Ok…that’对于这篇博客文章来说足够了。鼓励读者阅读此分类框架。我有计划(但不要’不能抱我承诺…成为仁慈的博客独裁者是有益的)总结了这一出色章节中的其他信息。希尔姆’分类法对从事测试开发的人员有明显的影响。威廉’S的框架提出了一个结构,可以根据这四个维度系统地设计/指定Gf测试。

另一方面(应用实践),Whilhelm’s work suggests 那 our understanding of 的 能力 measured 通过 existing Gf tests might be facilitated via 的 分类 of 不同 Gf tests as per 的se dimensions. Work on 的 “operation”自1990年中期以来,这一特征一直很强’根据CHC窄能力分类测试。

如果领导者如何最好地解释智力测验的方法加重了(对CHC的影响),可能不会更好地理解Gf措施 操作 Gf测试的分类),按照 内容实例化 尺寸,以及识别不同类型的 认知的 策略 那 might be elicited 通过 不同 Gf tests 通过 不同 individuals?

基于大量可用的实际Gf度量的管理(例如WJ III,KAIT,Wechslers,DAS,CAS,SB5,Ravens和其他著名的Gf测试)的管理,我闻到了一些重点突出并且可能很重要的博士学位论文“nonverbal”Gf度量)到一个体面的样本,然后进行探索性和/或确认性因素分析和多维标度(MDS)。 eck….doesn’难道没有人可以访问到无所不在的心理学实验科目,即入门心理学课程的大学生吗?这将是一个不错的起点。


2012年12月25日,星期二

我们做什么'我们从CHC COG-ACH关系研究的20年中学到了:回到未来,超越CHC

我在会议上提交的论文草稿 第一理查德·伍德考克认知评估研究所 (过去的春季在塔夫茨大学)现在可以通过点击 这里. Three of 的 12 数字s are included below......as a tease :). 的 final paper will be published 通过 WMF出版社.

 

2012年11月25日,星期日

CHC认知成就研究20年的意义:回到未来以及超越CHC

[点击图片放大]
 
关键从我第一次演讲时的幻灯片 理查德·伍德考克认知评估研究所 现在发布在 幻灯片分享. 我以为我以前曾发布过这些内容,但似乎找不到它们。  So 他们来了 第一次(或第二次)。  Below 是 的 abstract for 的 paper 那 I also submitted--to be published eventually 通过 的 WMF出版社.


已经学到了很多 CHC CHC COG-->期间的ACH关系 过去20年(麦格鲁& Wendling’s, 2010).  本文基于现有研究,首先阐明了 definitions of 能力, 认知能力, 成就能力才能.  之间的差异 一般领域特定领域CHC预测学校成绩的指标。   卡夫曼的承诺’s “intelligent” 情报 通过两种方法说明了测试方法 基于CHC的选择性引荐为重点的评估(SRFA).  接下来,一些新 智能 test design (ITD)原则进行了描述, demonstrated via a series of exploratory data analyses 那 employed a variety 数据分析工具(多元回归,SEM因果建模, 多维缩放)。  ITD 原理和分析得出了建造 发育敏感的CHC一致性 学术能力集群, measures 那 can play an important role in SLD的当代第三种方法(优势和劣势模式) identification. 
需要超越 COG的简单概念化COG-->讨论并证明了ACH关系和SLD识别模型 通过CHC COG的介绍和讨论-->交流电 H因果SEM模型。  另一个 例如确定和量化建议 认知能力成就特质复合体 (CAATC)。  当前PSW第三方法SLD的修订 models was proposed 那 would integrate 中国民航总局s.  最后,需要纳入 认知复杂度 测试 and 综合分数 在CHC域内 在设计和组织智能测试电池(以改善 提出了对学校成绩的预测)。  本文提出的各种建议代表了 (a)呼吁以新方法回归旧观念(回到未来)或(b)接受新的想法,概念和 methods 那 require psychologists to move beyond 的 confines of 的 dominant 人类认知能力的CHC分类法(即 超越CHC)。




2012年9月10日,星期一

AP101简介#16:超越CHC:CHC内部域复杂度优化措施

[注意:  这是较大论文的工作草案(CHC认知成就研究20年的意义: 回到未来,超越CHC) 那 will be presented 在 的 first 塔夫茨大学理查德·伍德考克当代认知评估研究所开幕大会(2012年9月29日):  CHC理论和认知评估的发展。] 对WJ III测试战的工作知识将使本简介更容易理解,但这不是必需的。

B超越CHC:  ITD—CHC内部域复杂度优化 Measures
            优化中 CHC措施的认知复杂性
I have 记录ently begun to 记录ognize 的 contribution 那 The 不伦瑞克对称 派生的 Berlin 情报Structure (BIS) 模型可以在应用智能研究中发挥作用,特别是对于增加预测指标的情况 通过最大化这些关系 通过匹配维度上的预测标准空间来建立关系 认知的 complexity.  What 是 认知的 complexity? 它为什么如此重要? 更重要的是,它应该扮演什么角色 设计智能电池以优化CHC COG-交流电 H relations?
认知性 complexity 是 often 操作alized 通过 inspecting individual test loadings on 主成分分析中的第一个主成分(詹森, 1998).  The high G-test rationale 是 那 performance on tests 那 are more cognitively 复杂 “调用更广泛的基本认知过程 (Jensen,1998; Stankov,2000,2005)”(McGrew,2010b,第452页)。  High g装货 测试通常是MDS(多维缩放)radex模型的中心 (点击此处查看AP101简要报告#15: 认知能力成就特质示例)—但是这种同构不会 always hold.   大卫·洛曼(David Lohman),是 理查德·斯诺(Richard 雪)’s,已广泛使用MDS方法来研究情报,并且拥有一个 最好地掌握了什么认知复杂性,如 hyperspace of MDS 数字s, contributes to understanding 情报 和 intelligence tests.  According to Lohman (2011), those tests closer to 的 center are more 认知复杂due 五 possible factors—大量的认知成分过程;积累 加快组件差异:更重要的组件流程(例如, 推理);注意控制和工作记忆的需求增加;和/或 或对自适应功能(组装,控制和监视)有更多要求。 Schneider’s (in press) 抽象级别 广泛的CHC因素的描述类似于 认知复杂性。  He uses 的 simple 100米栏成绩的示例。  According to 施耐德 (in press), one could independently measure 100 米冲刺速度,然后停滞不前,越过障碍(两者 能力的例子)。  However, 进行100米的比赛并不是两种狭narrow的能力的总和。 更多的是狭义能力的非加法组合和整合。 这个比喻抓住了 认知复杂性—在认知测量领域,这是任务 在成功完成任务时,罗曼列举了五个因素中的更多因素 performance.
至关重要 importance 是 的 记录ognition 那 factor 要么 能力域的广度(即, broad 要么 狭窄) 同义的 with 认知复杂性.  更多 重要的是,认知复杂性并不总是一个测试设计概念(因为 由Brunswick Symmetry和BIS模型定义) 明确地 纳入 "智能"情报 test design (ITD)。  许多测试已经纳入了这一概念 他们的设计计划中的认知复杂性,但是我相信这种类型的 认知复杂性与CHC内部域的认知不同 这里讨论的复杂性。
对于 例如,根据考夫曼和考夫曼(2004)的观点,“在开发KABC-II时, 作者没有努力发展‘pure’五个CHC的测量任务 broad 能力.  在 理论, Gv 任务应排除 Gf 要么 s例如,以及其他广泛能力的测试,例如 GC 要么 l, should only measure 那 ability 和 none other. 但实际上, 像KABC-II这样的认知能力综合测试可以衡量问题 在不同环境下和不同条件下解决 复杂 有必要评估 高级功能”(第16页;增加了斜体)。 虽然考夫曼’强调重要性 CHC接地的智力测试电池中认知复杂的测量方法 description defines 复杂 measures as those 那 are 阶乘复杂或 来自多个CHC领域的能力的混合度量.  The Kaufman’也可以解决认知问题 非CHC神经认知三嵌段功能性Luria的复杂性 neurocognitive model when 的y indicate 那 it 是 important to provide measurement 那 evaluates 的 “动态整合这三个模块” (Kaufman &Kaufman,2004年,第13页)。   对神经认知整合(以及因此的复杂性)的强调是 也是最新Wechsler电池的明确设计目标。 如WAIS-IV手册(Wechsler,2008年)所述, “尽管评估和划分更多内容有明显的优势 认知功能领域狭窄,几个问题值得关注。 首先,认知功能是相互关联的, 在功能和神经方面,使其难以测量纯域 认知功能” (p. 2).  Furthermore, “measuring psychometrically 纯 factors of discrete domains 可能对研究有用,但不一定会产生信息 在实际应用中具有丰富的临床意义或实用性(Zachary, 1900)” (Wechsler, p. 3).   Finally, 埃利奥特(Elliott,2007)同样主张承认的重要性 基于神经认知“复杂 信息处理”(第15页;增加了斜体)。 DAS-III,可进行描述于CHC中的测试或复合材料测量 域,在测试设计中同样重要。
ITD principle explicated 和 proposed 这里 是 那 of striving to develop 认知上复杂的测量 在广泛范围内 CHC domains—也就是说,无法通过能力融合来实现复杂性 跨越CHC广泛的领域,而不是尝试直接链接到神经认知 network integration.[1]  基于Brunswick对称性的BIS模型 提供了通过开发和分析实现此目标的框架 通过关注认知来测试复杂性 内容 操作s方面。 
图12 展示了大多数关键WJ III的二维MDS Radex模型的结果, 狭窄的CHC认知和成就集群(适用于来自 到成年后期大约6岁)。 [2]   The current 图12中结果的解释重点仅在于程度 of 认知复杂性 (proximity to 的 center of 的 数字) of 的 broad 和同一域内的WJ III狭窄群集( 内容 和 操作s 方面 不是当前材料的重点)。  Within a domain 的 最广泛的 三测 父母 聚类由黑色圆圈表示。[3] 两次测试的广泛类由灰色设计 circles.  Two test 狭窄 后代 广泛领域内的集群是 由白色圆圈指定。  All 域中的群集通过以下方式连接到最广泛的父广泛群集: lines. 至关重要的 信息是各自父母的域内认知复杂性 和兄弟姐妹集群,以它们与中心的相对距离表示 of 的 数字. 一些有趣的结论 are apparent. [点击图片可放大]

首先,作为 可以预期,WJ III GIA-Ext集群几乎完美地集中在 figure—它显然是认知上最复杂的WJ III集群。   相比之下,三个WJ III Gv集群 在认知复杂性方面比所有其他具有 没有特定的Gv集群显示明显的认知复杂性优势。   As 预期的是,测得的阅读和数学成绩集群主要是 认知上复杂的措施。  However, those 成就 clusters 那 deal more with basic 技能 (数学计算—MTHCAL;基本阅读技巧—RDGBS) are less 复杂 那 的 应用 集群(阅读理解-RDGCMP;数学推理-MTHREA)。 
最多 图12中有趣的发现是差异性认知复杂性 CHC域中的模式(至少有一个父级和至少一个父级 offspring cluster).  对于 example, 的 较窄的知觉速度(Gs-P)后代簇在认知上更为复杂 而不是广泛的父Gs集群。  The broad Gs集群由视觉匹配(Gs-P)和决策速度组成 (Gs-R9; l-NA) tests, tests 那 measure 不同 狭窄 能力. 相反,感知速度簇(Gs-P) is comprised of two tests 那 are classified as both measuring 的 same 狭窄 能力(感知速度)。  这个 finding 乍看之下似乎有点反常理,就像人们期望的那样 comprised 测试 那 measure 不同 内容 和 操作s (Gs cluster) would (包括以上定义和讨论在内)比其中一项更为复杂 相同的窄能力(Gs-P)的两个量度。 但是,一项任务必须分析两者 Perceptual Speed tests to realize 那 although both are classified as 测量相同的窄能力(感知速度),两者都不同 stimulus 内容认知的 操作s.  视觉匹配需要处理数字刺激。 划掉要求处理 visual-figural 刺激。  These are two different 内容方面 在BIS模型中。  划掉视觉图形刺激在空间上更具挑战性 而不是视觉匹配中的简单数字。  此外,视觉比对测试要求应试者快速 seek out 和 discover 和 mark two digit pairs 那 are identical. 相反,在淘汰测试中 为对象提供目标的视觉图形形状,然后对象必须 quickly scan a row of 复杂 visual images 和 mark two 那 are identical to the target. 有趣的是,其他 unpublished  我已经完成的分析,视觉 匹配测试通常是对定量成就测试进行加载或分组 而Cross Out经常显示加载Gv因子。 因此,任务分析 内容 认知的 operations of 的 WJ III Perceptual Speed tests suggests 那 although both are 被归类为Gs-P的狭窄指标,它们在任务上明显不同 requirements.  更多 important, 的 结合感知速度群集测试,似乎需要更多 认知过程比广义Gs簇复杂。 这一发现与阿克曼(Ackerman)一致, Beier 和 Boyle’s (2002) research 那 suggests 那 perceptual speed has 通过识别以下四个子类型来扩展因子水平 感知速度(即模式识别,扫描,内存和复杂性; see McGrew 2005 和 施耐德 &McGrew,2012年,关于 速度能力的分层组织模型)。 基于Bruinswick对称/ 国际清算银行认知 complexity principles, one would predict 那 a s-P cluster comprised of two 相同任务的并行形式(例如,两个视觉匹配或两个交叉 测试)的认知复杂度将不如广义Gs。 这可能是正确的提示 假设存在于对Gsm-MS-MW域结果的检查中。
WJ III GSM 群集是数字反转(MW)和单词记忆的组合 (MS) tests. 相比之下,WJ III 听觉记忆跨度群集(AUDMS; GSM-MS)群集在认知上要少得多 与Gsm相比更复杂(请参见图12)。  就像在上下文中描述的感知速度(Gs-P)集群一样 处理速度家族集群,听觉内存跨度集群是 由具有相同内存跨度(MS)窄能力的两个测试组成 分类(单词记忆;句子记忆)。 为什么这个狭窄的集群不那么复杂 它广泛的母体Gsm集群,而Gs-P和Gs则相反吗?  Task analysis suggests 那 的 two 记忆 跨度测试比两个感知速度测试更相似。 单词记忆和句子记忆 tests require 的 same 认知的 操作—只需按顺序重复一次, 与主题说话的单词或句子。  这与WJ III感知速度群集不同 分类的窄Gs-P测试最有可能同时调用通用和不同 cognitive component 操作s.  Also, 内存跨度群集测试由来自相同BIS内容的刺激组成 方面(即单词和句子;听觉语言/语言)。 相比之下,Gs-P视觉匹配和 淘汰测试涉及两个不同的内容方面(数字和 visual-figural).
在 相比之下,WJ III工作记忆簇(Gsm-MW)在认知上更强 比父Gsm群集复杂。  这个 发现与先前的WJ III s /感知速度和WJ III一致 Gsm /审核内存跨度讨论。  The WJ III工作记忆簇由倒数和听觉组成 工作记忆测试。  Numbers Reversed 需要从一个BIS内容方面处理刺激—numeric stimuli. 相反,听觉工作 记忆需要处理来自两个BIS含量因素的刺激—numeric 和听觉语言/语言;数字和单词)。  The 认知的 操作s of 的 two tests also differ.  两者都需要持有 主动工作记忆空间中的刺激。 反转数字则需要简单 以相反的顺序复制数字。  相反,听觉工作记忆测试需要存储 数字和单词在单独的块中,然后产生 每个块(数字或单词)的前向顺序,在一个块之前 the other. 更加依赖分裂 注意在听觉工作记忆测试中最有可能发生。 
综上所述, the results presented in 图12 suggest 那 it 是 可能发展 cluster scores 那 vary 通过 degree of 认知复杂性 within 的 same broad CHC domain.  More important 是 的 finding 那 的 将聚类分为宽泛还是窄窄分类无法提供有关度量认知复杂性的信息。 认知上的复杂性,如 将聚类分为宽泛还是窄窄分类无法提供有关度量认知复杂性的信息。 认知复杂性e Lohman感,可以在CHC域中实现,而无需诉诸混合 跨CHC域的能力。  最后, 狭窄的簇在认知上可能更复杂,因此可能更好 复杂的学校成绩的预测指标,而不是广泛的集群或其他狭窄的指标 clusters. 

含义 用于测试电池设计和评估策略
认可 of 认知复杂性 as an important ITD principle suggests 那 的 push to 在当代测试电池中或在 跨电池评估的构建,未能认识到 认知复杂性。  I plead guilty to 通过我在WJ III的设计中的作用为这一重点做出了贡献 广泛关注CHC域构建体的广泛表示—most WJ III 狭窄的CHC集群需要使用第三本WJ III认知书( 诊断补充;伍德科克,麦格鲁,马瑟& Schrank, 2003). 同样地,有罪的人被控罪 CHC因子在原始模型开发中的代表性 跨电池评估原则(Flanagan&麦格鲁(McGrew),1997年;麦格鲁& Flanagan, 1998)。 
也是 my conclusion 那 的 窄一点更好结论 麦格鲁和温德林(2010) 可能需要修改。   重温麦格鲁和温德林(2010) results suggest 那 的 狭窄 CHC clusters 那 were more predictive of 学业成绩之所以如此之所以不一定是因为范围狭窄, 但是因为它们在认知上更加复杂.  I offer 的 hypothesis 那 a more correct principle 是 那 认知复杂measures 更好。    我欢迎专注于新的研究 测试这个原理。
在 回想起来,鉴于WJ III星团的宇宙,宽窄融合 智能电池配置(或跨电池评估)的方法可能 be more 适当。  Based exclusively 根据图12所示的结果,将出现以下簇 those 那 might better be featured in 的 “front 结束” of 的 WJ III 要么 a 选择性测试构建评估—those clusters 那 examiners should 首先考虑每个CHC广泛领域:  Fluid Reasoning (Gf)[4],理解知识 (Gc),长期检索(Glr),工作记忆(Gsm-MW),音素意识3 (Ga-PC)和感知速度(Gs-P)。  No 虽然狭窄的可视化集群是 在认知上比Gv和Gv3集群稍微复杂一些。  The above suggests 那 if broad clusters are Gs,Gsm和Gv的域所需的,然后进行除“front end”或特色测试和群集需要管理 必要的Gs(决策速度),Gsm(文字记忆)和Gv(图片) Recognition) tests.

利用ITD测试设计原则 of optimizing within-CHC 认知复杂性 of clusters suggests 那 a WJ III测试的不同重点和配置可能更多 appropriate.  它 是 proposed 那 的 高于WJ III群集复杂度优先级或特征模型可能会允许 从业人员管理学校成绩的最佳预测者。  I further hypothesize 那 this 认知的 基于复杂度的宽窄测试设计原理最可能适用于 other 情报 test batteries 那 have adhered to 的 primary 焦点 on featuring tests 那 are 的 纯st indicators of two 要么 more 狭窄 能力 在所提供的广泛的CHC解释方案之内。  Of course, this 是 an empirical question 那 求助于其他电池的研究。  更多 有用的类似MDS Radex跨电池认知复杂度分析 情报数据集。[5]

参考文献 (不包含在这篇文章中。 完整的论文将在不久的将来宣布并可供阅读和下载)



[1]这个 does 不 mean 那 认知复杂性 may 不 be related to 的 integrity of the 人类连接体 或不同的大脑网络。我为当代感到兴奋 脑网络研究(Bressler&梅农,2010年;科尔,亚尔科尼,雷波夫斯, Anticevic &勇敢,2012年;托加,克拉克,汤普森,沙特克,& Van 喇叭, 2012;范登赫维尔& Sporns, 2011), particularly 那 which has 证明了神经网络效率与工作记忆之间的联系, 控制注意力和临床疾病,例如注意力缺陷多动症(Brewer,Worunsky, Gray, Tang, Weber &Kober,2011年;鲁兹,史格格,邓恩,& Davidson, 2008; McVay & Kane, 2012). The 顶额-额叶整合(P-FIT) 理论 智力与CHC相关联,尤其令人着迷 心理测量指标(Colom,Haier,Head,Álvarez-Linera,Quiroga,Shih,&荣格,2009年;迪里,彭克,&约翰逊,2010年;海尔,2009年;荣格& Haier, 2007年),并且可以与CHC认知优化的心理测量方法联系起来。
[2] 只要 包括阅读和数学类,以简化 results 和 的 fact, as reported previously, 那 读 和 写作 measures 在多变量分析中通常无法很好地区分—and thus 的 w CHC理论中的领域。
[3]GIA-Ext也用黑色圆圈表示。
[4] 尽管WJ III流体推理3群集(Gf3)稍微靠近 center of 的 数字, 的 difference from 流体推理(Gf) 是 不 large 和 时间效率将证明需要进行两次测试的Gf集群。
[5] 它 is important to 不e 那 的 认知复杂性 analysis 和 解释 这里讨论的是特定于 仅在WJ III电池内。度 WJ III认知集群中的认知复杂度与 其他智能电池的综合得分只能通过 跨电池MDS复杂性分析。

2009年11月11日,星期三

WJ III的MDS分析:对CHC理论的完善和扩展的意义




行动计划 AP101#3 报告现在可用(点击这里 所有AP101的报告和摘要)。  “ 行动计划 AP101报告#3:M基于CHC的WJ III电池的DS分析:对人类CHC模型的可能改进和扩展的含义可以查看  要么 downloaded 通过 点击这里.

PPT文件也可以通过以下方式查看和下载 幻灯片分享.

抽象
WJ III电池由认知(智能)和成就两部分组成。 如技术手册中所述,WJ III的认知能力组织结构的Cattell-Horn-Carroll(CHC)理论已得到验证。 当前的调查分析了所有6至18岁WJ III规范受试者的认知和成就测验。 多维缩放(MDS—古特曼·拉德克斯(Guttman Radex)模型的50次WJ III测试提出了解释WJ III的新思路。 结果表明,三到四个更高阶的中级CHC模型层次能力随(a)受控与自动认知过程以及(b)产品与过程为主的能力的维度而变化。结果与最近对WAIS-IV的类似分析一起为伍德考克提供了支持’认知表现模型(CPM)。 建议在CPM模型中可能有细微变化。 更重要的是,WJ III和WAIS-IV结果共同表明了CHC情报框架的假设完善和扩展。  建议进行集中于探索CHC和柏林情报结构模型(BIS)理论的兼容性的研究。
Technorati标签: , , , , , , , , , , , , , , , , , , ,


2008年10月23日,星期四

威斯康星州-III / WJ III跨电池Guttman 2-D Radex分析

多一个 威斯康星州-III / WJ III跨电池分析-这次 二维Guttman Radex MDS 型号(点击这里)。 正如读者所指出的那样,在过去的一周中,我一直在进行一些数据分析狂潮(为编写手稿做准备,并且在实际的2周以上假期后得到了刷新),并报告:  (a) 威斯康星州-III / WJ III跨电池g +特定齿轮关系SEM,(b) WJ III规范样本年龄6-8的WJ III 二维Guttman Radex MDS和(c) WJ III 3-D 古特曼 Radex MDS,标准样品的年龄为9-13岁。 希望这些分析为理解WJ III和Wechsler智能电池的测试特性提供有用的信息。

不幸的是,该分析基于WISC-III,而不是最新的WISC-IV。  Nevertheless, 的 results still provide useful information on 的 威斯康星州-III tests 那 are still present in 的 第四次世界大战.

鉴于我就各种MDS模型编写的所有内容,我将仅发表一些评论,并希望其他人以这些数据的演示形式进行更多的讨论,解释等,从而带来一些乐趣。

一些观察/评论:
  • Gv tests (both 威斯康星州-III 和 WJ III) continue to surface on 的 more outer rings of 的 MDS 楷模---suggesting 那 的y are more lower-level perceptual/processing measures 和 do 不 capture 复杂 Gv 认知的 processing. 前几天见我的政府评论。 Ga测试也可以这样说。
  • 《 WJ III理解方向》一直是认知能力较复杂的测试之一。 并且,它主要是基于语言的工作内存(Gsm-MW)度量。  请记住,根据Radex模型,认知复杂性处理的是要处理的元素/组件的数量,并且与抽象思维(Gf-ish东西)不同。 WJ III数字反转也显示在中心附近,而WISC-III数字跨度也不在后面。 这是否支持流行 工作记忆= Gf / g研究 假设?
  • 两块电池的Gc测试放置位置相似。
  • 不出所料,WJ III Gf测试(概念形成,数值推理(这是数字序列和数字矩阵的组合)和分析综合)位于中心的“认知复杂性”圈子内。
I'm sure 的re 是 much more 那 can be gleaned, but I'll leave 那 to 的 readers to discover, debate, 和 discuss. 我实际上认为3-D MDS模型对于捕获度量的特征是必要的...但是我在这些分析上花了很多时间和精力。 也许以后再说。

我前几天提供的一些注意事项在这里也很重要-(a)我是《 WJ III》(利益冲突披露)的合著者,并且(b)这些结果尚未经过同行评审



2008年10月20日,星期一

《 WJ III:2-D MDS分析年龄6-18

如所承诺的,这是对 我的帖子 WJ III测试的3-D 古特曼 Radex MDS模型。我现在基于2至18岁的所有WJ III规范受试者的分析提出一个二维Radex模型(使用 WJ III NU规范)。您可以通过以下方式查看/下载pdf文件: 点击这里.

我可以写一整章关于含义,假设等的内容。相反,我将只发表一些评论并发表一些问题,以期希望这种检查测试特征的方法引起人们的兴趣。恕我直言,MDS是一种出色的分析工具,它提供了一个独特的视角,可用来增强我们对认知能力测验的基于因子分析的理解。我希望我们更多的人能够使用所有主要的情报来完成这些分析。

一些想法/评论/问题:
  • Note 那 概念形成 是 near 的 middle of 的 circle. 这个 whole round of MDS analyses I've been posting 是 based on 关注 (请参阅J. 施耐德的评论)CF测试是否可以作为Gf的良好度量...以及它是否与g密切相关。根据MDS的解释,CF与中间十字准线的接近表明,它是整个WJ III电池中较为“认知复杂”的测试之一。这将支持其解释为Gf和g的有力指标。
  • 请注意,声音意识(Ga / GSM),理解方向(Gsm / GC),应用问题(Gq / Gf),量化概念(Gq / Gf)和言语理解(Gc)也在中间位置-暗示它们就认知复杂性的概念而言,所有这些都是对认知的要求。并且...有趣的是,它们来自不同的CHC广泛因素。我坚信,“声音意识和理解方向”在认知上很复杂的原因是在执行这些任务时,受试者承受的主要工作记忆负荷是多少。这应该提醒我们,认知复杂性并不一定需要与抽象的“思考”(Gf-ish)类型的任务相关联。进一步注意,听觉工作记忆距离也不远。这些发现是否支持表明工作记忆(Gsm-MW)与Gf或g之间有密切关系的研究?
  • 注意某些相应的CHC因子测试的“紧密”或“内聚”程度。显然,Grw,Gq,Gc,Gf和Gsm(MS除外)测试都倾向于挂在相同的位置。相反,请注意WJ III Gv和Ga测试之间的距离较大。这是否表明某些广泛的CHC域更紧密/更紧密,而其他域却更宽泛(域内聚性较低)。这对测试解释意味着什么?这对于理解不同CHC因子域的理论本质意味着什么?
  • 注意很酷的认知效率(CE)量化指标。如何在一个区域内限制大多数Gs和Gsm测试不是很甜蜜。然而... CE测验之间存在一定距离,这可能有助于理解受试者对特征过程/内容要求的差异。这不令人兴奋吗?
  • 事实是,大多数Gv测验都远离认知复杂性中心(文件所附幻灯片中的大多数Wechsler Gv测验也是如此)有助于我们理解为什么屡次发现传统的Gv测验与学业成绩无关(统计上) (尤其是数学),当我们知道大量研究表明Gv对数学很重要时。这是否告诉我们,在应用测试开发的世界中,我们还没有开发出足够复杂的,对认知要求较高的Gv测试,而该测试与学校成绩更相关(例如,视觉空间工作记忆测试)。好奇的人想知道。
  • 像Gv一样,注意Ga测试之间的距离(使用传统的因子方法时,它们确实形成了很好的心理测量因子)。 “不完整的单词”与“声音融合”相距甚远,而“声音融合”则更接近于获得的知识测试。这是否表明IW可能是更“纯”的语音编码方式,而SB可能受到培训和教育的影响呢?进一步注意听觉注意的位置---我已将其包括在认知效率领域中。这是否告诉我们,AA测试的声音辨别力(Ga分量)很小,而选择性注意力(在分散注意力的能力下-抵抗分散注意力的能力)更大?
  • I'm 不 comfortable with 的 解释 of quandrant 4 in 的 model. Can others suggest ideas? I think part of 的 problem 是 那 a 3-D 型号(like 的 one I posted 的 other day) may required to better account for 的 dimensionality of 的 complete set of WJ III tests.
I could stare 在 this forever 和 generate more thoughts, hypotheses, questions, etc. I'd like to leave 那 to others. Please feel free to start a thread discussing 的 potential benefits of examing 认知的 和 成就 tests via 的 lens of MDS analysis. 它 clearly 是 an under-utilized methodology 那 can help us better understand our measures. A problem 是 那 most 类质 (包括我自己)已被更为性感的当代SEM(CFA)方法所吸引。也许现在该是我们“回到未来”的时候了。


Technorati标签: , , , , , , , , , , , , , , , , , , , , , , , ,

2008年10月17日,星期五

WJ III:Guttman Radex MDS分析

更多关于 “重新访问gf = g” 线程(点击这里 for 要么iginal post) 那 produced some excellent discussion (点击这里)在NASP 列表服务器上。

应要求的申请 古特曼的雷德克斯 MDS model to 的 鹬 Johnson III (in age 9-13 norm sample), I looked through my old files 和 found a 3D MDS WJ III model 那 I completed a number of years ago. 的 slides have been posted in a pdf文件 供观看。需要手稿来解释和解释所有内容。...我希望广泛的笔触假设(尤其是关于三维的性质)能激发一些思想和讨论。

昨天,我在所有学龄儿童(6-18岁)中完成了一个新的2D模型。我希望在一周内发布这些发现。敬请期待。

[利益冲突披露-我是《 WJ III》的合著者]


Technorati标签: , , , , , , , , , , , , , , , , , , , , , , , ,


2008年10月16日,星期四

Gf=g revisited: 施耐德, Lopez 和 Fiorello comment

Joel 施耐德 provided some excellent thoughts 和 questions related to my 记录ent “ Gf = g:也许不是” 张贴在 国家航空航天局列表服务器. His comments were 的n augmented 通过 鲁本·洛佩兹(Ruben Lopez) 和 凯茜·菲奥雷洛(Cathy Fiorello). I thought 的 quality of 的 comments were so good 那 的y should be preserved for others to read. 的y are produced below - "as 是" from 的 国家航空航天局 list.

Joel 施耐德 评论:

凯文的 最近的博客文章 关于Gf = g的假设很有趣,值得一读。

对于大多数关于认知能力结构的假设,我认为没有比WJ-III标准化样本更好的数据集可以用来测试它们了。但是,在这种情况下,我一直对WJ-III Gf测试有疑问。我相信,WJ-III的主要Gf测试都是Gf的出色标记。但是,我一直认为它们包含与Gf不相关的共同差异提示。那是什么,我不能完全动手,但这与注意力的执行控制有关。两者都涉及生成假设并以似乎比传统矩阵Gf检验更具参与性的方式在工作记忆中对其进行测试的需求。两者似乎都需要类似数学的思维过程,尤其是在难度较大的项目中。

Suppose 那 的 Gf=g hypothesis were true. Let's say 那 概念形成 和 分析综合 both consist of 的 following sources of variance:

CF = Gf +多余的东西+错误
AS = Gf +多余的东西+错误

The latent 变量 那 would be constructed to represent Gf in a 终审法院 would thus be: WJ-III Gf = Gf + Something Extra

进行卡方检验以查看是否将Gf到g的路径约束到1.0会很重要,这不是因为Gf = g假设是错误的,而是因为2个WJ-III Gf子测验不够纯。卡方检验的显着意义只需要一点额外的费用。

I would think 那 adding one Raven-like matrix in 的 Gf mix would reduce 的 problem (if 的re actually 是 a problem). These tests seem less-mathy 和 more 视觉空间ish 和 thus might reduce 的 non-Gf common variance.

The tables Kevin links to include a Gf latent 变量 那 consists of:

概念形成
分析综合
数值推理(数字矩阵+数字序列?)
应用问题
定量概念

如果我对CF和AS在数学上是正确的,并且数学与Gf不完全相同,那么这个WJ-III Gf可能是WJ-III Gf = Gf + Mathiness

鉴于类似Gc的问题格式,我很惊讶地看到Gf定量概念的指标多么强大。也许它正在笼罩在Gf上,不是因为其中包含大量Gf,而是因为它被其他指标的类似于数学的元素所吸引。即便如此,我还是很茫然地理解为什么定量概念在Gf上的负担要比应用问题高。


鲁本·洛佩兹(Ruben Lopez) 回应:

嗨乔尔,

也许即使在像WJ-III这样的例外措施中,Gf的可测量性也很混乱。它可能与抽象及其与g的关系更多,而不是单独的Gf。

请看David Lohman博士在“ 伍德科克-约翰逊 III和认知能力测验(表格6):并发效度研究”(2003年3月)中对Gf与Gq的关系的讨论:

“最近关于一般能力本质的讨论都强调了生理过程的重要性(詹森,1998年),工作记忆的作用(凯伦宁,1996年),或者主要的归纳推理因子,第二层流体能力因子(Gf)之间的一致性。 )和g(Gustafsson,2002)。然而,本研究支持Keith和Witta(1997)的假设,即定量推理可能是g的更好指标。定量推理在成就测试电池中始终以某种形式表示,并且旨在预测学业成就的能力测验(例如SAT)中,但是直到1980年代后期(Horn,1989年)才在Gf-Gc理论中添加了广泛的定量知识因素(Gq); Carroll(1993年)的三层理论另一方面,认为定量推理是广义流体推理(Gf)因子的一部分,不同能力测试电池的确认因子分析反映了这种矛盾性,一些研究发现g和G q难以区分[如基思&Bickley(1992)对Stanford-Binet IV或Lohman的因子分析&Hagen(2002)对CogAT一次电池的因子分析],其他研究发现Gq是g的最佳指标(例如Keith&Witta(1997)对WISC-III或Lohman的因子分析&Hagen(2002)对CogAT多层电池的因子分析]和其他研究发现了可区分的g和Gq因子[如Bickley,Keith,&Wolfe(1995)对Woodcock-Johnson心理教育电池修订的因子分析].

悖论性的定量推理没有被大量研究,因为除非与更具体的数学知识和技能的测试(如Gq因子)相结合,否则很难与g分开。但是正是与g的这种重叠使得定量推理作为理解g的性质的媒介特别有趣。定量概念的最显着特征也许就是抽象。甚至诸如计数之类的基本操作也需要抽象:两只猫在某种程度上与两只狗或两只狗一样。数字行本身是一种抽象,尤其是当它包含负数时。在理解诸如变量或后来的虚数之类的概念时,抽象是最明显的。

g的一些早期定义强调抽象思维或推理能力。从具体思维到抽象思维的转变在皮亚杰的智力理论中占有重要地位。 g的现代定义强调了工作记忆资源甚至推理的重要性,但是对于抽象思维的作用却没有太多要说的。这些分析表明,对定量推理进行更深入的研究可能是探索这种可能性的好地方。
”(第16页)。

And don't forget Keith 和 colleagues 记录ommendation 那 的 算术 subtest should be added to 的 Perceptual Reasoning scale to assess Gf.

凯茜·菲奥雷洛(Cathy Fiorello) 钟声:

在这种情况下,人们可能会对研究古特曼的智力模型感兴趣。几年前,我和一些同事在《情报》杂志上发表了一篇文章(科恩,菲奥雷洛,&Farley,也许是2006年?)对WISC-IV进行了最小的空间分析。支持了Guttman的模型,该模型将抽象级别视为三维模型的一个维度。