显示带有标签的帖子 达斯-II. 显示所有帖子
显示带有标签的帖子 达斯-II. 显示所有帖子

2012年3月1日,星期四

行动计划101简介#12:使用IQ部件分数作为SLD和MR / ID 诊断中一般智力的指标

   
           历史上的概念 一般情报(g), 由全球情报测试电池组负责 全尺寸 智商得分对于具有以下特征的个体的定义和分类至关重要 特殊学习障碍(SLD) 以及具有 智障(ID)。  最近,当代的定义和操作标准提高了智能测试能力 综合 要么 部分分数 在SLD的诊断和分类中扮演更重要的角色,而在ID中则更重要。
            In 的 case of SLD, 第三方法 一致性 定义在(a)识别 一致性 低成就与相关的认知能力或加工障碍之间的关系;(b)个人必须表现出相对的认知和成就优势的要求(请参见 菲拉内罗弗拉纳根& Ortiz, 2010)。 在第三种方法SLD方法中,没有强调全局IQ分数。
            In contrast, 的 11 版本 协会智障:定义,分类和支持系统 手册(AAIDD,2010年)将通用情报和全球综合智商得分作为对以下方面的定义的核心 智力功能. 这并非没有挑战。 例如,AAIDD ID 定义具有 被批评 因为过分依赖通用情报的构建,而忽略了当代心理学计量学理论和实证研究,这些研究已经集中在多维的智力层次模型上(即, 卡特尔-洪恩卡罗尔或CHC理论)。
潜在的限制“作为一般智能障碍的ID”定义是由 智障残疾人确定委员会,在 国家研究委员会 报告“智力低下: 确定获得社会保障福利的资格” (Reschly, Meyers & Hartel, 2001). 这个国家专家委员会的结论是“在接下来的十年中,可能会更进一步地调整智力测验以及从中得出的IQ分数以及Horn-Cattell和Carroll模型。 结果,未来几乎可以肯定会更多地依赖零件分数,例如 GC Gf,以及传统的复合IQ。 也就是说,传统的综合智商可能不会下降,但是与过去相比,将会更加重视零件得分”(Reschly et al。,2002,p.94)。 委员会指出“每当质疑一个或多个部分分数(子测试,量表)的有效性时,检查员还必须质疑该测试是否’的总分适合指导诊断决策。 总考试成绩通常被认为是客户的最佳估计’的整体智力功能。 但是,在某些情况下,总的测试成绩可能并不能完全代表整体认知功能,这对于某些人以及对他们而言都是如此。” (p. 106-107).
           在SLD和ID诊断和分类中,对智能测试电池复合零件评分的日益重视,提出了许多测量和概念问题(Reschly等,2002)。 例如,统计学上的显着差异是什么? 有什么有意义的区别? 当质疑整体智商时,哪些适当的认知能力应作为一般智力的代理? 总测验分数应为多少? 
适当的认知能力 只会是这里讨论的唯一问题。 这个问题解决 哪个组件或零件的分数与一般智力更相关(g)—也就是说,组成部分的分数很高 g装载机? 传统的共识是 GC (结晶的智力;理解知识)Gf (流体情报或推理) 是最高的 g负荷措施和构造,并且在诊断ID时最有可能成为身份提升的候选人(Reschly等,2002)。 尽管并非总是明确说明,但第三种方法一致性SLD定义指定个人必须证明“至少具有一般认知能力或智力的平均水平”(Flanagan et al。,2010,p.745),这是一个隐含地暗示认知能力和成分得分较高的陈述。 g-ness。
表1旨在为在SLD和ID的诊断和分类中使用零部件评分提供指导(单击图像放大并使用浏览器缩放功能) 查看;建议你 点击这里 来访问表格的PDF副本。并对其进行放大)。 表1总结了具有令人满意的心理测量特征(即国家规范样本,复合材料足够的信度和效度)的,全面的,国家规范的,单独管理的情报电池 g-得分)用于ID和SLD的诊断。



综合 g-得分 列列出了每个情报电池提供的全球一般情报得分。 这个分数是一个人的最佳估计的一般智力,目前与AAIDD的ID诊断最相关。  All 综合 g表1中列出的-scores满足 詹森s(1998) 心理测量误差 标准作为一般智力的有效估计。  As per 詹森s 测试次数 标准,所有智能电池 g-复合材料基于 最少九个 测试样本 至少三个 主要认知能力领域。  As per 詹森s 各种测试 标准(即信息内容,各种心理操作的技能和要求),从CHC理论的角度来看,电池的能力范围覆盖范围会有所不同四个(CAS,SB5),五个(KABC-II,WISC-IV,WAIS-IV),六个(DAS-II)和七个(WJ III)(奥尔蒂斯Flanagan& Alfonso, 2007; 基思& Reynolds, 2010)。  根据詹森(Jensen,1998)的建议, 用于估计的特定测试集合 g 应该以尽可能少的测试数量尽可能接近地成为所有类型的心理测试的代表样本,并且应该尽可能平均地代表各种测试 (第85页)。 用户应咨询以下来源 Flanagan等。 (2007年)基思和雷诺兹,2010年) 确定每个智能电池如何近似詹森的最佳设计标准,测量的特定CHC域以及每个电池组合中CHC域的比例表示 g-得分。
表1中还包括每个电池提供的组成部分的比例(例如,WAIS-IV语言理解指数,感知推理指数,工作记忆指数和处理速度指数),其后分别是 -电池 g-加载。[1]  Examination of 的 g现有电池的综合得分的高低(请参阅表1的最后三列)表明了传统的假设,即 GfGC 是通用情报的最佳代理 掌握所有情报电池.[2] 
在SB5的情况下,所有五个复合零件得分在 g-装载(h2 = .72至.79)。 没有一个SB5复合零件得分比其他SB5得分更好地暗示了一般的一般智力(当不使用整体IQ得分时)。 另一个极端是WJ III,其中流体推理,理解知识,长期存储和检索聚类得分最高 g-WJ III中基于部分得分的解释的代理。 WJ III视觉处理和处理速度群集不是复合零件评分,应该强调其为一般智能的指标。 在所有包含处理速度组件分数的电池(DAS-II,WAIS-IV,WISC-IV,WJ III)中,各自的处理速度量表始终是通用情报的最薄弱的代表,因此不会被视为良好的智能产品。一般情报估计。 
           同样清楚的是,不能假设测得能力的相似名称的合成物应具有相似的相对 g-不同电池内的状态。  例如, Gv 达斯-II(空间能力),SB5(视觉空间处理)中的(视觉空间或视觉处理)集群相对较强 g-在各自的电池中进行测量,但对于WJ III视觉处理集群则不能说相同的方法。 更有趣的是WAIS-IV和WISC-IV相对值的差异 g-加载类似听起来不错的索引分数。 
例如,工作记忆指数最高 gWAIS-IV中的加载组件分数(与感知推理指数并列),但在WISC-IV中仅排名第三(四分之三)。  工作内存索引由WAIS-IV中的数字跨度和算术子测试以及WISC-IV中的数字跨度和字母序号子测试组成。 据报道,算术子测试是阶乘复杂的测试,可能会利用流体智能(Gf-RQ—定量推理),定量知识(Gq),工作记忆(GSM),以及可能的处理速度(s;基思& Reynolds, 2010; 菲尔普斯,麦格鲁,诺皮克& Ford, 2005)。   算术子测试的阶乘复杂特性(实质上使它的功能像迷你算子一样,g 代理)将解释为什么WAIS-IV工作内存指数是一个很好的代理 g 在WAIS-IV中,但不在WISC-IV中。 WAIS-IV和WISC-IV工作记忆指数量表尽管命名相同,但是 测量相同的结构。

A 严重警告 是那个 g无法比较不同电池的负载。  g当分析中包含的各种措施的组合发生变化时,载荷可能会发生变化。 不同的“风味” g 可能导致(Carroll,1993; 詹森,1998)。比较的唯一方法 g电池的极性经过适当设计 交叉或联合电池 分析(例如,在普通样品中分析的WAIS-IV,SB5和WJ III)。
上面和下面的智能电池示例说明,那些使用组成部分分数作为人的估计的人’的一般智力必须了解其组成和心理测验 g-每个智能电池内组件的得分得分。 并非所有不同智能电池中的所有零部件得分都是相同的(关于 g-ness)。 同样,并非所有类似命名的基于因子的综合评分都可能测量相同的相同结构,并且电池内部的度数可能会有所不同 G-内斯。 对于因子分析中的因子命名,以及基于因子的智力测验综合评分,这并不是一个新问题。 悬崖(1983) 描述了这个 名义上的谬误 用简单的语言—“如果我们命名某事,这并不意味着我们了解它” (p. 120). 




[1] 如表1的脚注所示,所有综合得分 g凯文·麦格鲁(Kevin McGrew)通过在每本智能电池技术手册(请注意WJ III的例外情况)中输入已发布的相关矩阵的最小数量(涵盖的最大年龄范围)来计算负载(以获得WJ III的例外) g负荷估算。 对于每个智能电池,可以为每个年龄区分的相关矩阵计算和报告这些值。 但是,此表的目的是提供尽可能最佳的 平均 在每个智能电池的整个寿命范围内的价值。 弗洛伊德(Floyd)和同事发表了年龄差异的文章 g达斯-II和WJ III的装载。 这些值未使用,因为它们基于 主要公因子 分析方法, 分析测试之间的可靠共享方差。 尽管主要因素和 主成分 通常,载荷将在相同的相对位置订购量度,主因数载荷通常会较低。 鉴于不完善的清单综合量表分数是在实践中使用的分数,因此也可以使计算 g表1中报告的载荷在这项工作中使用了主成分分析。同样的理由用于不使用较高阶的潜在因子负荷 g每个测试电池的SEM / 终审法院分析中的因素。 CFA分析得出的负荷代表了基础理论能力结构与 g 清除测量错误。 此外,电池技术手册(或独立的期刊文章)中报告的最终CFA解决方案通常会使测试变得相当复杂(加载多个潜在因子),这种测量模型与清单/观察实践中使用的综合评分。 高阶潜在因子加载 g因子通常会基于清单指标而与主成分负载有很大不同,无论是绝对大小还是相对大小(例如, 正在加载 g 在WJ III技术手册中,这与清单变量基于 表1中报告的负载) 
[2]h2 值是用于比较相对数量的值 g-每个智能电池中组成部分中存在的方差得分。

2012年1月4日,星期三

研究字节:新的智商发现; SLODR和g在DAS-II上;中国科学院











通过发布 DraftCraft应用

2011年10月10日,星期一

研究字节:DAS-II衡量的认知性别差异

Keith和Reynolds研究团队撰写的另一篇强有力的方法论文章,通过分析DAS-II是否增加了智商性别差异研究知识。双击图像放大
Q








-使用Kevin McGrew的iPad的BlogPress进行iPost

2011年3月2日,星期三

差异能力量表II智商测试:发布者的CHC说明

我光滑地拿起一个不错的东西 CHC和DAS-II手册 在上周的NASP会议上。根据DAS-II的作者和出版商,它解释了他们如何从共识的智力智能心理测量模型(CHC理论)来看第二版的“差异能力量表”。

如果任何人都可以从发布者处获得我的在线PDF副本,我将关闭该链接以将访问量引导至该页面。搜索时找不到。

-使用我的Kevin McGrew的iPad使用BlogPress的iPost

产生者: 标签生成器


2010年12月19日,星期日

智商测试和理论趋势:Google Ngram可视化

过去一周,我在 纽约时报 关于Google提供的新的数据可视化工具- 走ogle图书Ngram查看器。然后我碰到一个 法律博客文章 有人用不同的法律术语调查了趋势...而我忍不住尝试一下。

如罗伯特·安布罗吉(Robert Ambrogi)在法律博客中所述:

“使用从1500到2008年间已数字化的数百万本书中获得的数据,它可以让您查看并比较单词和短语在数年或几个世纪以来在图书中使用的频率。正如Google所说:“使用Ngram Viewer,您可以对这些数据集中的短语进行图形化处理并进行比较,以显示多年来它们的使用情况如何增加和减少.”

我首先必须尝试输入的术语如何工作。这些术语区分大小写。我用各种排列检查每个短语,以最大程度地提高“命中率” ...,然后一起运行一些短语以确定并比较趋势。

以下是我的结果,并附有一些评论-数据往往能说明一切。我发现我搜索的大多数内容直到1940年之后才出现...因此这就是每个图的起点。还需要注意的是,这些图表仅在2008年之前上升...今天很高兴看到这些图表

酷的东西。双击每个图可放大。




该图表表明,Gv(视觉处理),Ga(听觉处理)和处理速度(Gs)的认知能力领域已成为比Gf(流体智力),Gc(晶体化智力),Gsm(短期记忆)更热门的话题。和Glr(长期检索)。有趣。



一个非常清楚的观察。在非韦氏智能电池中,斯坦福大学的Binet随着时间的流逝而急剧下降,而自1990年以来,智商测试块(WJ,DAS,KABC,CAS)上的“新手”成为更多写作的重点。如果将其纳入Wechsler Intelligence,则无疑是跨时间的赢家。我将其省略,这样“其他”电池的趋势将更加明显。



正如我多次写的那样,当代的卡特尔-洪卡罗尔(CHC)情报理论已经成为情报的共识理论。这个有趣的图表支持了这一结论,尤其是从1997年到2008年。此外,如果单击摘要表中的搜索词,则会将其带到包含该词的Google图书页面上。 点击这里 看CHC理论的例子。

我认为以上提到的许多趋势是由于1989年WJ-R的发表,Gf-Gc理论向CHC理论的出现。我已经写过关于这一关键的从理论到实践的出生期的文章 这里这里.

-使用我的Kevin McGrew的iPad使用BlogPress的iPost

2010年12月2日,星期四

智商测试电池发布时间表:Atkins 先生 / ID 弗林效应备忘单

随着我参与咨询 阿特金斯MR / ID 死刑 在这种情况下,经常提出的话题是 规范过时 (又名 弗林效应)。与其他人交谈时,我常常很难说出各种测试修订版的确切发布日期,因为我不仅要跟踪Wechsler电池(这是Atkins报告中的主要IQ测试)。我经常想知道其他人是否对我的专业知识表示怀疑...但是大多数人没有意识到,智商电池不仅仅是韦克斯勒的成人电池...,尤其是大量儿童通用电池和其他电池跨越童年和成年时期。因此,我决定为自己准备一份备忘单。我可以打印该备忘单并将其保存在文件中。我以简单的形式将其组合在一起Q电池发布时间表。下面是该图的图像。双击放大。

需要理解的重要一点是,当开始认真讨论试验中的弗林效应时,在计算一组测试规范的过时程度时,通常不使用测试发布日期。而是使用对测试进行标准化/标准化的年份的最佳估计,该估计未包括在此图中(您需要找到此信息)。例如,WAIS-R于1981年出版...但是该手册指出规范是在1976年5月至1980年5月发生的。因此,在大多数弗林效应诉讼中,1978年(规范期的中期) )通常被使用。这使跟踪所有主要单独管理的IQ电池的专家难以回忆起这些信息。

希望对您有帮助...如果没有其他...您必须承认它很漂亮:) 点击图片查看





-使用我的Kevin McGrew的iPad使用BlogPress的iPost

2010年1月5日,星期二

类似于Wechsler的IQ子测验的量表评分标准:滥用,误解和对人生关键决策的影响的潜力-草拟报告以寻求反馈




以下是本指南的前三段(和关键数字) 草案 行动计划应用心理计量学101简要报告(#5)。  完整的报告可以通过以下方式以PDF格式下载: 点击这里. 完整报告的网页版本可以通过以下方式找到 点击这里 (注意-网页验证可能不会显示两个嵌入的图形...。可能需要查看PDF副本)

我正在向这份初稿报告提供表达我的意图,以征求有关我的分析和逻辑的准确性和合理性的反馈和意见。 我正在寻找重要的反馈意见来改进报告。 这是一份报告草稿,如果评论建议进行重大更改,将进行修订。 请本着 “抛出一些关键的想法” 进行反思性分析和反馈。 反馈可以直接发送给我([email protected]),也可以以列表服务线程讨论的形式提供给我。 国家航空航天局 和/或 CHC列表服务器.


我最近一直在浏览James Flynn的新书(什么是情报: 超越弗林效应),以便更好地理解 弗林效应。我(作为一名应用测量人员)特别感兴趣的是他对跨时间的各种Wechsler量表中各个子测验分数的分析。正如大多数心理学家所知,韦氏(Wechsler)子测验的量表分数(ss)是在平均值(M)= 10和标准差(SD)= 3的量表上。子测验ss的范围是1到19。 弗林在其书的附录1中指出 "it is customary to score subtests on a scale in which 的 SD is 3, as opposed to 智商分数 which are scaled with SD set 在 15. To convert to 智商, 只是 乘 subtest gains 通过 five, as was done to get 的 智商 gains in 的 last column." 乍一看,这种说法听起来好像子测试ss向IQ SS的转换很容易(“只是 乘….”;我的重点)和数学上可以接受的程序,没有问题。但是,仔细检查后,这种转换可能会将未知的错误源引入转换后的SS分数的精度中。 这篇简短的技术文章的目的是解释进行此ss-IQ SS转换时涉及的问题。

ss 1-19刻度在Wechsler电池中具有悠久的历史。例如,在 成人智力的测量 (Wechsler,1944年),Wechsler描述了将子测验原始分数转换为新ss指标的步骤。尽管随着时间的推移,计算ss 1-19值的方法和程序变得越来越复杂,但韦氏电池在每个新修订版中都延续了这一传统。  尽管用于开发Wechsler ss 1-19量表的方法可能已经变得更加复杂,但每个子测验的最终基础量表并没有…分数仍在1-19之间(M = 10; SD = 3)。 另外,最近 斯坦福·比内特—5th 版 (SB5; Roid,2003)和 考夫曼儿童评估电池第二版 (KABC-II)各自的子测试都采用了相同的1s到19分制。

当其他现代智能电池提供具有更好测量分辨率的子测试规模度量时,为什么在某些智能电池中仍使用这种相对粗略(将在下面定义)的度量标准? 例如, 达斯-II (Elliott,2007)在T量表(M = 50; SD = 10)上放置各个测试分数,分数范围为10-90。  的 WJ III (麦格鲁&伍德考克(Woodcock,2001)将所有考试和综合分数放在与满分和综合分数(M = 100; SD = 15)相关的标准分数(SS)指标上。  要问的关键问题是 “保留历史ss 1-19刻度是否有优点或缺点,或者使用具有更好的测量分辨率的单独测试刻度(DAS-II; WJ III),它们的真正优点是什么?”

......继续............
(完整的报告可在此帖子第一段的链接中找到)

[双击图像放大]





Technorati标签: , ,, , , , , , , , , , , , , , , , , , , , , , , , , ,


2009年5月15日,星期五

CHC理论:出现,测试仪器和与学校相关的研究摘要

当代Cattell-Horn-Carroll(CHC)智力测验的开发,解释和应用研究可以追溯到 理查德·伍德考克 约翰Horn 约翰“Jack” Carroll 在1985年秋天,该网络资源的第一作者( 麦格鲁(McGrew),2005年)。这次会议的结果是1989年出版了第一个独立管理的,基于国家标准的基于CHC的情报电池,即伍德考克-约翰逊-修订版(Woodcock,McGrew,&马瑟(1989)。这个具有里程碑意义的事件 20年前,为 CHC驱动的主要基于学校的智力测试实践的发展e。
随后的重要CHC事件在此20年期间进行,包括:(a)由CHC组织的第一组联合测试电池因子分析研究(伍德考克,1990年)为CHC跨电池(CB)评估的概念种植了种子,(b)首次尝试通过类似考夫曼的方式使用WJ-R 补充测试 战略(Kaufman,1979年),以实施尚未命名和可操作的CHC CB测试方法( 麦格鲁(1993)),(c)阐明第一个综合的Cattell-Horn-Carroll模型并根据CHC框架分类主要情报电池(McGrew,1997),(d)首次假设,基础和操作原理的描述用于CHC CB评估和解释(Flanagan&麦格鲁(McGrew),1997年;麦格鲁&Flanagan,1998年),(e)出版了第一本智力理论和评估书,着重介绍了CHC理论和评估方法(Contemporary Intellectual Assessment: 的ories, Tests, 和 Issues; 通用电器nshaft弗拉纳根& Harrison, 1997; 单击此处链接到第二版),(f) CHC CB评估系列 ( 弗拉纳根·麦格鲁& Ortiz, 2000; 弗拉纳根,奥尔蒂斯,阿方索& Mascolo, 2006; 奥尔蒂斯Flanagan& Mascolo, 2001, 2007; 麦格鲁& Flanagan, 1998),(g)完成一系列由CHC组织的研究,以调查CHC认知能力与阅读,数学和写作成绩之间的关系(您现在正在阅读的内容),(h)阐明基于CHC的SLD评估和资格框架(请参阅Flanagan &Fiorello,手稿正在准备中),以及(h)随后的CHC修订或解释了许多综合的独立管理的智能测试电池( 差异能力量表—II, 达斯-II;斯坦福·比内特—5, SB5;考夫曼儿童评估电池—2nd版,KABC- II)。尽管没有明确说明,但是在最近的Wechsler三部曲( WPPSI-III; 第四次世界大战; WAIS- IV),以及介绍CHC CB程序以解释三个Wechsler电池( Flanagan等,2000)。

点击这里 对于本系列的其他帖子。

2008年12月16日,星期二

智商(ISIR)学者聚焦:蒂姆·基思(Tim Keith)-DASII CHC 终审法院和能力上的性别差异



蒂姆博士“幸福是一个潜在变量”基思 在2008 信息系统会议上发表。蒂姆是一位伟大的学者(和朋友),在 结构方程建模。当我需要跑步方面的帮助时,他是两个人之一 终审法院 楷模。他已经完成了有关主要独立管理的情报电池的一些最佳CFA研究。我已经与他合作了许多 g +特定能力 学习。最近,他开始将注意力转向使用SEM方法进行评估 性别差异 潜在地 CHC 能力(点击以下链接可查看他最近发表的研究,其中包括 WJ III -利益冲突披露-我是《 WJ III》的合著者。

在ISIR会议上,他介绍了对 差分能力量表-II(DAS-II) 规范数据。下图是最佳拟合模型。该模型为CHC对DAS-II的解释提供了良好的支持。在会议上,他的主要重点是性别差异。

简而言之,蒂姆的性别分析概述如下:

  • 女性(5-17岁)的Gs,Gsm和Glr更高(实际上是M6的狭窄能力-记忆力不佳)
  • 男性(5-17岁)的Gv更高
  • GC,Gf或g没有性别差异。
[双击图像放大]

2007年11月28日,星期三

超越CHC理论的临界点:回到未来

我刚刚发布了PPT幻灯片的副本,该幻灯片是 我最近在加拿大做了两个演讲 回复: CHC(Cattell-Horn-Carroll)智力理论. 的 latest version is called “超越CHC理论的临界点:回到未来。”

向下滚动此博客页面的左侧可以查看幻灯片,直到您到达 “在线PPT幻灯片” 节标题。单击演示文稿标题并享受。


以下是幻灯片的简要说明:
  • 历史和“解释浪潮”背景下的CHC(Cattell-Horn-Carroll)智力理论概述。提出CHC已达到学校心理学中的“临界点”的想法.....这使评估从业者能够了解过去尝试进行基于CHC的测试配置文件的个人优势和劣势解释
Technorati标签: , , , , , , , , , , , , , , ,

供电 抄写员 .

2007年4月11日,星期三

差异能力量表-第2版:在CHC专栏中再发表

荣誉 科林·埃利奥特(Colin Elliott) 最近出版的第二版 差异能力量表(DAS-2)。当我在1997年撰写有关DAS的文章时 CHC 对所有主要情报电池的广泛分析(在Flanagan等,1997年) 中央情报局 本书),我认为它是 CHC 能力...首先,当然是故意 CHC设计的 WJ-R和WJ -III (强制性利益冲突 -我是《 WJ III)。看到它现在已经加入了不断增长的人群中,我并不感到惊讶(看到我的CHC热门帖子)故意 CHC-设计的智能电池,即IMHO,当时(从CHC的角度来看)是第二好的工具(1997年)。

和往常一样,请查看 威利斯和杜蒙 该网站的其他 达斯-2 相关信息。

我很想看看副本。提示...提示...是谁 心理公司。听吗您不喜欢我刚刚给DAS-2的免费宣传吗?我肯定会喜欢免费的副本以进行检查。





Technorati标签: , , , , , , , , , , ,



供电 抄写员 .