显示带有标签的帖子 SB-IV. 显示所有帖子
显示带有标签的帖子 SB-IV. 显示所有帖子

2012年5月3日,星期四

Problems with 的 1960 and 1984 斯坦福·比内特 智商分数




A new 行动计划 AP101 report (#13) dealing with 的 above issue was 记录ently posted 在 的 人发会议博客.



由Kevin McGrew的iPad使用BlogPress发布
www.themindhub.com

2010年12月2日,星期四

智商测试电池发布时间表:Atkins 先生 / ID Flynn Effect备忘单

随着我参与咨询 阿特金斯MR / ID死刑 在这种情况下,经常提出的话题是 规范过时 (又名 的 Flynn Effect)。与其他人交谈时,我常常很难说出各种测试修订版的确切发布日期,因为我不仅要跟踪Wechsler电池(这是Atkins报告中的主要IQ测试)。我经常想知道其他人是否对我的专业知识表示怀疑...但是大多数人没有意识到,智商电池不仅仅是韦克斯勒的成人电池...,尤其是大量儿童通用电池和其他电池跨越童年和成年时期。因此,我决定为自己准备一份备忘单。我可以打印该备忘单并将其保存在文件中。我以简单的形式将其组合在一起 Q电池发布时间表. Below is an image of 的 figure. Double click on it to enlarge.

需要理解的重要一点是,当开始认真讨论试验中的弗林效应时,在计算一组测试规范的过时程度时,通常不使用测试发布日期。而是使用对测试进行标准化/标准化的年份的最佳估计,该估计未包括在此图中(您需要找到此信息)。例如,WAIS-R于1981年出版...但是该手册指出规范是在1976年5月至1980年5月发生的。因此,在大多数弗林效应诉讼中,1978年(规范期的中期) )通常被使用。这使跟踪所有主要单独管理的IQ电池的专家难以回忆起这些信息。

希望对您有帮助...如果没有其他...您必须承认它很漂亮:) 点击图片查看





-使用我的Kevin McGrew的iPad使用BlogPress的iPost

2010年2月14日,星期日

智商测试的选择可能是生死攸关的决定:ID / 先生样本中的WAIS v SB得分差异

有趣的文章“新闻中” 情报比较了智力障碍(ID / 先生)成人的WAIS和Stanford Binet 智商得分(除当前的SB5和WAIS-IV以外,其他版本除外)。 尽管将不同版本的分数混合在一起使得无法进行SB / WAIS特定版本的比较,但发现WAIS分数的平均值(平均值)几乎是 高17点 可能会让许多心理学家感到惊讶。  作者讨论了来自不同测试的不同分数对现实生活的影响(即Atkins ID死刑判决,获得SS福利的资格等)。 如前所述 行动计划 AP101特别报告,不同的IQ测试之间的如此巨大的差异不足为奇。 

西尔弗曼(Wilverman),密西耶斯基(Miezejeski),赖安(Ryan),西格曼(Zigman),Krinsky-McHale& Urv, T. (in press). tanford-Binet和WAIS智商的差异及其对智障成人(又称智力障碍)的影响。  情报。

抽象
比较了74名智障(ID)成年人的Stanford-Binet和Wechsler成人智力量表(WAIS)智商。在每种情况下,WAIS全面智商均高于斯坦福-比内特综合智商,平均差为16.7点。这些差异似乎不是由于斯坦福大学比奈大学的最低可能分数较低。与其他措施的进一步比较表明,WAIS可能会系统地低估智力障碍的严重程度。讨论了这些发现的含义,涉及确定残疾状况,估计ID患病率,评估痴呆症和与衰老相关的认知能力下降以及在涉及可能死刑的法医病例中对ID的诊断。
A concluding comment from 的 authors
然而,在这些情况下,心理学家无法履行其道德义务,却不知道哪个测试可以提供对真实智力的最有效估计。智商相对较高(尽管稀疏)的当前数据表明,斯坦福-比内特测试和WAIS智商测试之间的差异不再仅仅因为反映了标尺的不同楼层而不再被忽略。当测试结果表明对生死存亡的判断时,任何关于结果有效性的怀疑不确定性都必须积极应对。
文章大纲
1.方法
2.结果
3.讨论
  • 3.1。伤残判定
  • 3.2。 ID的发生率
  • 3.3。衰老下降
  • 3.4。死刑案件
  • 3.5。结论
致谢
参考文献

Technorati标签: , , , , , , , , , , , , , , , , , , , , , , ,

2009年5月26日,星期二

学位论文:SB5和WISC-IV Gv数学成绩预测因子


视觉空间处理和数学成就:Stanford-Binet智力量表(第五版)和Wechsler儿童智力量表(第四版)的视觉空间量度的预测能力 南达科他州大学克利福德·埃尔登博士,2008年,195页; AAT 3351188




抽象
在法律和文献中,学习障碍的定义与如何操作之间存在脱节。在过去的30年中,学习障碍识别的主要方法一直是一个人的认知能力水平与其学习成绩之间的严重差异。 2004年IDEA的最新修订包括允许更改识别程序的语言。这种语言表明,特定的学习障碍可以通过学生对基于研究的干预(RTI)的反应失败来识别。但是,两种识别方法都无法基于IDEA 2004定义来识别学习障碍,该定义将特定的学习障碍定义为主要是心理处理障碍。研究表明,处理组件在诸如阅读,写作和数学之类的学术任务中起着至关重要的作用。此外,已有大量研究表明视觉空间处理与数学成就有关。两项最著名的智商测试分别是斯坦福-比内特第五版(SB5)和韦氏儿童智力量表第四版(WISC-IV),并于2003年进行了修订,以与最新的智力理论更加紧密地结合在一起, 卡特尔·洪·卡罗尔认知能力理论(CHC)。研究支持这两种仪器都有测量视觉空间处理的子测试。本研究的目的是确定哪种视觉空间处理量度(SB5或WISC-IV)可以更好地预测数学成绩不佳。参与者是112名6到-8年级的中学生。在112名原始参与者中,有109名被纳入研究。对两个单独的顺序逻辑回归的结果进行比较发现,这两种方法都可以显着预测数学成绩。但是,考虑到SB5和WISC-IV视觉空间处理措施所占的差异相对较小,结果具有可疑的实际意义。

Technorati标签: , , , , , , , , , , , , ,

2009年5月15日,星期五

CHC 的ory: Emergence, test instruments and school-related research brief

当代Cattell-Horn-Carroll(CHC)智力测验的开发,解释和应用研究可以追溯到 理查德·伍德考克 约翰Horn 约翰“Jack” Carroll in 的 fall of 1985, a meeting also 在tended 通过 的 first author of 日is web-resource ( 麦格鲁(McGrew),2005年)。这次会议的结果是1989年发布了第一个独立管理的,基于国家标准的,基于CHC的情报电池,即伍德考克-约翰逊-修订版(Woodcock,McGrew,&马瑟(1989)。这个具有里程碑意义的事件 20年前, provided 的 impetus for 的 CHC驱动的主要基于学校的智力测试实践的发展e。
Subsequent important CHC events followed during 日is 20 year period, and included: (a) 的 first set of CHC- organized joint test battery 因子分析 studies (伍德考克,1990年) which planted 的 seeds for 的 concept of CHC 交叉电池 (CB) 评定, (b) 的 first 在tempt to use 的 WJ-R, via a Kaufman-like 补充测试 strategy (Kaufman, 1979), to implement 的 yet to be named and operationalized CHC CB approach to 测试 ( 麦格鲁(1993)),(c)阐明第一个综合的Cattell-Horn-Carroll模型并根据CHC框架分类主要情报电池(McGrew,1997),(d)首次假设,基础和操作原理的描述用于CHC CB评估和解释(Flanagan&麦格鲁(McGrew),1997年;麦格鲁&Flanagan,1998年),(e)出版了第一本智力理论和评估书,着重介绍了CHC理论和评估方法(当代智力评估:理论,检验和问题; 通用电器nshaft弗拉纳根& Harrison, 1997; 单击此处链接到第二版), (f) 的 publication of 的 CHC CB评估系列 ( 弗拉纳根·麦格鲁& Ortiz, 2000; 弗拉纳根,奥尔蒂斯,阿方索& Mascolo, 2006; 奥尔蒂斯Flanagan& Mascolo, 2001, 2007; 麦格鲁& Flanagan, 1998),(g)完成一系列由CHC组织的研究,以调查CHC认知能力与阅读,数学和写作成绩之间的关系(您现在正在阅读的内容),(h)阐明基于CHC的SLD评估和资格框架(请参阅Flanagan&Fiorello,手稿正在准备中),以及(h)随后的CHC修订或解释了许多综合的独立管理的智能测试电池( 差异能力量表—II, 达斯-II;斯坦福·比内特—5, SB5;考夫曼儿童评估电池—2nd版,KABC- II). Although not overtly stated, 的 impact of CHC 的ory can be seen in 的 记录ent revisions of 的 venerable 韦克斯勒 trilogy ( WPPSI-III; 第四次世界大战; WAIS- IV) as well as 的 presentation of CHC CB procedures for interpreting 的 日ree 韦氏电池 ( Flanagan等,2000)。

点击这里 对于本系列的其他帖子。

2006年10月9日,星期一

当代的智商测试是否被过分分解了?



Are test developers (that includes me, 的 blog dictator) increasingly overfactoring 情报 test batteries?

According to an article 通过 Frazier and Youngstrom "in press" in 的 prestigious journal 情报, contemporary test developers (and 的ir publishing companies) "are not adequately measuring 的 number of factors 的y are purported to measure." Below is 的 reference citation and abstract (with a link to 的 article).

According 的 Frazier and Youngstrom, 的 purpose of 的ir investigation was: “本文提出了几种力量影响了这一趋势,包括:越来越复杂的智力理论(Carroll,1993; 弗农,1950),商业测试出版商希望为临床医生提供具有更大解释价值的评估工具,出版商希望包括较小的能力因素可能只对研究人员感兴趣,并且严重依赖于自由的统计标准来确定测试所测量的因素数量,后一种假设在本研究中通过比较几种统计标准来确定测试的数量来进行经验评估。当前和历史上相关的认知能力系列中存在的因素。”

As a coauthor of one of 的 batteries (WJ III) analyzed in 日is study and, in particular, 的 battery 日at measures 的 largest number of factors in 的ir investigation, I feel compelled to respond to portions of 日is manuscript. Thus, readers should read 的 original article and 的n 评论 my comments, 完全意识到我有商业利益冲突.

Before I present 的 major conclusions of 的 article and provide select responses, I'd like to first state 日at, in many respects, I 日ink 日is is a well done article. Regardless of 的 extent to which I agree/disagree with Frazier and Youngstrom, 的 introduction is worth 读 for 在 least two reasons.

  • The article provides a nice (brief) overview of development of psychometric 情报 的ories from 矛兵 日rough early hierarchical 的ories (弗农) to contemporary Carroll and 卡特尔-Horn Gf-Gc (the later two now often referred to as 卡特尔·洪·卡罗尔 [CHC] 的ory).
  • 此外,对于那些希望对主要统计方法进行简要描述和提要以决定要保留在因子分析研究中的因子数量的个人,建议使用第3-6页。

T.Frazier和E.Youngstrom(2006年,印刷中). Historical increase in 的 number of factors measured 通过 commercial 认知能力的测试:我们是否过度分解了? 情报。

抽象

  • 认知能力的商业测试所衡量的因素数量的历史性增长可能源于四个明显的压力,这些压力包括:日益复杂的智力模型,测试发行者渴望提供具有更大解释价值的临床有用评估工具,测试发​​行者渴望获得更大的解释价值。包括研究人员可能感兴趣的次要因素(但在临床上无用),以及用于确定测试因素结构的宽松统计标准。本研究使用从主要成分分析以及探索性和确认性因素分析得出的统计标准,检验了几种历史相关且当前采用的商业认知能力测试所测得的因素数量。霍恩的平行分析(HPA)和最小均分(MAP)分析是两个很少使用的统计标准,已被证明可以准确地恢复数据集中的因素数量,它们是金标准。正如预期的那样,通过认知能力测试测得的因素数量随时间有了显着增加(r = .56,p = .030)。结果还表明,最近在认知能力测验的过度分解方面的大量增加。未来认知评估电池的开发人员可能希望增加电池的长度,以便更充分地测量其他因素。另外,对简短评估策略感兴趣的临床医生可能会从可靠评估一般智力的短电池中受益。

Additional comments/conclusions 通过 的 authors (followed 通过 my comments/responses)

Frazier / Youngstrom评论: 认知能力电池在心理评估中的广泛使用,普遍的心理评估市场的增长,创建临床医生和研究人员都可以使用的测试的愿望,以及提高智商测量的可靠性的愿望可能会对出版商造成压力市场能力测试,可以衡量其他测试所能衡量的一切,甚至更多。反过来,这迫使其他能力测试发布者尝试保持同步。

  • 麦格鲁评论/回应: First, I will not 在tempt to comment on 的 "desires/pressures" of test developers/publishers of 的 other major 情报 batteries included in 的ir analyses (Wechsler batteries, SB-IV, 韩国广播公司, 达斯). I restrict my comments to my experiences with 的 WJ-R and WJ III.
  • 作为WJ III的合著者以及WJ-R的主要数据分析人员,我个人可以保证测试发布者和我们作为合著者都没有施加压力来衡量更多因素来应对这一事实。为了测量更多。 如原始WJ-R技术手册(McGrew,Werder&Woodcock,1991年),随后在WJ III技术手册中进行了总结(McGrew和Woodcock,2001年),因素数量背后的驱动力是理论驱动的,两位最杰出的心理计量学智能理论家和因素分析家的意见....约翰Horn and 插口 Carroll (点击这里, 这里.) Both 喇叭 and Carroll where intimately involved in 的 design and 评论 of 的 factor results of 的 WJ-R and WJ III norm data. 在WJ-R和WJ III修订版中,驱动“欲望/压力”的目的是在实际限制内有效地测量广泛的CHC / Gf-Gc能力的主要特征,这些能力是数十年来研究已建立的(请参见Carroll的1993年的开创性工作, 点击这里, 这里)。 For additional information re: 的 involvement of 喇叭 and Carroll in 的se deliberations, read 的 relevant sections of McGrew's (that be me) on-line version of CHC理论: 过去,现在,将来. If 的re was an underlying driving "pressure", it was to 狭窄 的 情报 的ory-practice gap.


Frazier / Youngstrom评论: 从本研究中得出了几个重要发现。如预期的那样,商业能力测试变得越来越复杂。尽管这些测试的时间仅适度增加,但据称由这些测试衡量的因素数量却已大幅增加,甚至可能呈指数增长。但是,应该注意的是,据称测量的因素数量呈指数增长的可能性可能是由于包含了两个异常值,即WJ-R和WJ-III。甚至更有说服力的是,测试时间与所声称因素的比率已大大降低。这些趋势表明,测试作者可能会提出其他因素,而没有包括足够数量的子测试来衡量这些因素。如果更准确,更推荐,则应检查统计标准,以发现商业能力测试被严重夸大。

  • 麦格鲁评论/回应: 我的评论主要是为读者澄清的内容之一。 弗雷泽(Frazier)和扬斯特罗姆(Youngstrom)的说法是测试长度与因素的比率降低了,这可能与其他电池分析有关,但WJ-R和WJ III并非如此。 WJ III测量的广泛的CHC因子全部由至少3个或更多个测试指标表示,这是正确识别因子的普遍接受的标准。 Frazier and Youngstrom (and readers of 的ir article) may find it informative to note 日at in 插口 Carroll's final publication (T认知能力的更高层次的结构:目前的证据支持g和大约十个广泛因素。 在Helmuth Nyborg(Ed。), 通用情报科学研究: 向亚瑟·詹森致敬。爱思唯尔科学/佩尔加蒙出版社。-单击此处以访问Carroll的chapte的发布前副本r),Carroll表示,WJ-R电池(与WJ III相比,具有较低的测试因子比率)是“足够的”数据集,“用于得出有关认知能力的较高层次结构的结论。” In describing 的 WJ-R dataset, he stated 日at “这是旨在测试阶乘的数据集 正如Carroll(1993,p。579)所建议的那样,该结构仅在第二层或更高的层上具有 sufficient test variables to define several second-stratum factors, as well as 的 single 日ird- stratum factor, but not necessarily any first-stratum factors." 插口 Carroll is no slouch when it comes to 的 application of 因子分析 methods. In fact, he is generally considered as one of 的 masters of 的 "art and 科学" of 因子分析 and his contributions of 的 use of 因子分析 methods to 的 study of 认知的 abilities is well known (I 记录ommend folks to read Chapter 3 in Carroll's seminal treatise on 的 factor structure of human 认知的 abilities--“第3章:认知能力的相关性和因素分析研究的调查和分析:方法论). 弗雷泽(Frazier)和扬斯特罗姆(Youngstrom)将他们所有的卵主要放在因子分析(强调统计测试)的“科学”中。因子分析的实践有一种“技巧”,而原始的实证研究方法却缺乏这种技巧。

Frazier / Youngstrom评论: 本研究的结果还表明,能力测试的过度分解可能会加剧,因为声称的因素数量与MAP和HPA指示的数量之间的差异随着时间的推移而上升,并且子测试与声称的因素的比率也大大降低了。尽管商业压力和人类认知能力的日益复杂的模型可能是造成这些近期增长的原因,但本研究未对这些解释进行研究。

  • 麦格鲁评论/回应: Where's 的 beef/data 日at 支持 的 conclusion 日at "commercial pressures...are likely contributing to 的se 记录ent increases?" In 的 absence of data, such a statement is inappropriate. 是的,人类认知能力的模型越来越复杂,正在为衡量更多能力的电池做出贡献。 Science is a process of improving our state of knowledge via 的 accumulation of 证据 over time. The most solid empirical 证据 支持 a model of 情报 (CHC or Gf-Gc 的ory) 日at includes 7-9 broad stratum II abilities. Shouldn't 评定 technology stay abreast of contemporary 的ory? I 日ink 的 answer should be "yes." Since 的 authors state 日at "的se explanations were not investigated in 的 present study" 的y should have refrained from 的ir "commercial pressures" statement. I'm a bit surprised 日at such a statement, devoid of presented 证据, survived 的 editorial process of 的 journal.

Frazier / Youngstrom评论: Rather, evaluation centered on 的 hypothesis 日at test developers have been determining test structure using liberal, and often inaccurate, statistical criteria. This hypothesis was supported.."

  • 麦格鲁评论/回应: 除了未能正确认识到正确应用因子分析的艺术和科学外,弗雷泽(Frazier)和扬斯特罗姆(Youngstrom)还犯下了一种通常由个人(我并不是说这两个人都是如此)所犯下的罪恶,而这些人迷恋于定量方法的魔力(早年就包括我自己...直到 约翰Horn, 插口 McArdle和 插口 喇叭 个人ly tutored me on 的 limitations of any single quantitative method, like 因子分析). Briefly, 因子分析 is an internal 有效期 method. It can only evaluate 的 internal structural 证据 of an 情报 battery. 当我是因子分析新手时,我因无法清楚地区分(探索性或确认性因子方法)读写能力(Grw)与口头/结晶(Gc)能力而感到困扰。 I 日ought 的 magic of 因子分析 should show 的se as distinct factors. 霍恩和麦克阿尔德都轻轻摇动了我 “因素分析必须正确” 提醒我一个模式(我从记忆中释义) “凯文...因素分析只能告诉您很多有关能力的信息。 通常,除了内部有效性调查结果之外,您还必须查看因素分析之外的其他信息,以完全了解为支持高度相关能力的差异提供支持的全部证据。” 特别是,霍恩和麦克阿德(Hor and McArdle)敦促我检查无法与因果分析方法区分开的高度相关能力的增长曲线。 When I examined 的 growth curves for w and GC in 的 WJ-R data, I had an epiphany (note...点击这里 对于包含所有WJ III测试曲线的报告。...尤其要注意阅读/写作(Grw)和口头(Gc)测试之间的差异....在因子分析中经常“聚集”在一起的测试)。 他们是正确的。 尽管EFA和CFA不能清楚地区分这些因素,但是Grw和Gc的发育增长曲线却截然不同...如此不同,以致于很难断定它们是相同的结构。 长话短说... Frazier和Youngstrom在讨论/局限性部分可能没有意识到,建构效度是基于多种效度证据来源的总和。 Internal 结构效度 证据 is only one form...albeit one of 的 easier ones to examine for 情报 batteries given 的 ease of 因子分析 的se days. As articulated in 的 联合测试标准,并且由Horn和其他人很好地总结,除了结构/内部(因素分析)证据外,构建体的证据(以及构建体的声称度量)还必须来自发育,遗传力,差异结果预测和神经认知证据。 Only when all forms 证据 are considered can one make a proper appraisal of 的 有效期 of 的 constructs measured 通过 a 的oretically-based 情报 battery. 对于那些想要更多信息的人, 点击这里 (you will be taken to a discussion of 的 different forms of 有效期 证据 as Dawn Flanagan and I discussed in our book, 的 情报Test Desk Reference.)

我可以继续讲更多的观点和对策,但我将在这里停止。 我强烈建议读者阅读这篇重要文章,并在对作者的准确性/适当性形成意见时,综合以上几点。’的结论,特别是关于WJ-R和WJ-III电池的结论。 此外,强烈建议查阅WJ-R和WJ-III技术手册,其中提供了多种有效性证据来源(内部和外部)来支持电池的因子结构。



Technorati标签: , , , , , , , , , , , , , , , ,

供电 表演Firefox

2005年4月1日,星期五

CHC潮流正式宣布:2005年NASP大会的观察

OK. I unilaterally declare 日at 的 CHC评估潮流 在这里,并在学校心理学中积聚力量。

After two days 在 的 全国学校心理学家协会 (NASP)我在亚特兰大举行的年度大会’m officially declaring 日at 的 CHC “tipping point” occurred sometime during 的 past five years and 日at 的 CHC bandwagon is getting larger.

今天早上吃早餐时,在浏览会议程序的同时,我数了至少20多个不同的研讨会,论文和/或海报,它们涉及CHC设计的电池(例如WJ III,KABC-III,SB5),CHC理论, CHC跨电池(CB)评估,或程序摘要中提到的CHC。在我基于内存的非正式分析中,这表示在过去十年中与Gf-Gc / CHC理论和测量有关的演示文稿已大大增加。

Having been involved in 的 1977 WJ-to-WJ-R revision, a process 日at included having both 约翰博士“Jack” Carroll and 约翰博士Horn as 的 primary 的ory consultants (back 的n it was referred to as Gf-Gc 理论),现在令人兴奋的是,理论与实践之间的鸿沟终于被弥合了,越来越多的测试作者和评估从业人员正驾着CHC桥前进。这对于该领域是有益的。这对孩子有好处(用于决策的数据现在建立在有效证据的坚实基础上)。

欢迎乘坐Gale Roid(SB5 作者)和艾伦·纳登·考夫曼(卡伯二世 authors). [Note....I predict 日at 的 达斯-II, will also have a strong CHC flavor.] It is good to see 日at respected scholars and test developers are now validating 的 “ahead of 的 curve”理查德·伍德考克博士的结论, 早在1985年,那么当时的Gf-Gc理论(现称为CHC理论)是“the” structural 的ory of 情报 日at had 的 most solid empirical and 的oretical foundation from which to develop measures of 情报.

对于那些想要了解发生的事情,时间和方式的历史观点的人(关于将CHC研究转移到学校心理评估实践中),请阅读我发布的历史记录“up in 的 sky” (点击这里..also published in CAI2 book). The events 日at are documented provide 的 证据 for my claim of a CHC bandwagon effect.