显示带有标签的帖子 测量. 显示所有帖子
显示带有标签的帖子 测量. 显示所有帖子

2018年7月12日,星期四

大量的心理测量资源:《 Wiley心理测量测试手册》。

我刚收到我的 两卷套装 在心理测验中的出色资源。 涵盖如此广泛的心理测量问题的好书并不多。 这不是我所谓的“轻松阅读”。 这更像是一本“必不可少”的资源书,在寻求了解当代心理测验开发问题时可以“随时准备”。

2009年7月7日,星期二

应用心理测验开发系列:F部分–心理计量/技术统计分析:内部

第六 在系列中 应用测试开发的艺术与科学 现在可用。

第六 模块(F部分-心理/技术统计分析:  Internal) 现在可用。

此外,我还进行了一些编辑和添加(特别是摘要 “工具,技巧和麻烦”“高级主题” 幻灯片)到以前的演示文稿(A-E部分)。

这是 第六 系列 的PPT模块说明了使用当代方法(例如,理论驱动的测试规范,IRT-Rasch缩放等)在认知能力领域进行心理测验的过程。这些演示本质上仅是概念性的,而非统计性的。反馈表示赞赏。

可以在博客的左侧窗格的标题下跟踪该项目。 应用测试开发测试开发系列。

第一 模块(A部分:规划,开发框架&域/测试规范蓝图)之前已发布,可以通过SlideShare访问。

第二 模组 (B部分:测试和项目开发) 之前已发布,可通过SlideShare访问。

第三 模块(C部分-使用Rasch缩放技术)之前已发布,可以通过Slideshare访问。

第四 模块(D部分-制定规范[标准化]计划)之前已发布,可以通过Slideshare访问。

第五 模块(E部分-计算规范和派生分数)之前已发布,可以通过Slideshare访问。

你是 强烈 鼓励按顺序查看它们,作为概念,概念和想法的图形表示等,从头到尾地相互依存。

享受...更多。

Technorati标签: , , , , , , , , , , , , , , , , ,



2009年6月29日,星期一

应用心理测验开发系列:C部分–使用Rasch缩放技术

第三 在系列中 应用测试开发的艺术与科学 现在可用。的 第三 模块(C部分:测试和项目开发-使用Rasch Scaling技术) 现在可用。

这是 系列第三 的PPT模块说明了使用当代方法(例如,理论驱动的测试规范,IRT-Rasch缩放等)在认知能力领域进行心理测验的过程。这些演示本质上仅是概念性的,而非统计性的。反馈表示赞赏。

可以在博客的左侧窗格的标题下跟踪该项目。 应用测试开发测试开发系列。

第一 模块(A部分:规划,开发框架&域/测试规范蓝图)之前已发布,可以通过SlideShare访问。

第二 模组 (B部分:测试和项目开发) 之前已发布,可通过SlideShare访问。

你是 强烈 鼓励将它们作为概念,概念和构想的图形表示,从头到尾相互依存的顺序进行查看。

享受...更多。

Technorati标签: , , , , , , , , , , , , , , , ,

2009年6月26日,星期五

应用心理测验开发系列:B部分-测试和项目开发

系列第二 应用测试开发的艺术与科学 现在可用。的 第二 模块(B部分:测试和项目开发) 现在可用。

这是 系列第二 的PPT模块说明了使用当代方法(例如,理论驱动的测试规范,IRT-Rasch缩放等)在认知能力领域进行心理测验的过程。这些演示本质上仅是概念性的,而非统计性的。反馈表示赞赏。

可以在博客的左侧窗格的标题下跟踪该项目。 应用测试开发测试开发系列。

第一 模块(A部分:规划,开发框架&域/测试规范蓝图)之前已发布,可以通过SlideShare访问。

享受...更多。


应用心理测验开发系列:A部分,计划,开发框架&域/测试规范蓝图

公告- 应用测试开发的艺术与科学。让游戏开始。

这是 系列第一 的PPT模块说明了使用当代方法(例如,理论驱动的测试规范,IRT-Rasch缩放等)在认知能力领域进行心理测验的过程。这些演示本质上仅是概念性的,而非统计性的。反馈表示赞赏。

可以在博客的左侧窗格的标题下跟踪该项目。 应用测试开发测试开发系列。

第一个模块(A部分:规划,开发框架&域/测试规范蓝图)现在可以通过SlideShare查看。

敬请关注。


2009年4月27日,星期一

吉尔福德出版社的新IRT(项目响应理论)书


新的IRT(项目响应理论)书 可从吉尔福德获得。仅供参考。我没有读过这本书,也没有读过任何评论。如果有人阅读并发表了评论,请随时在此博客中添加评论。

Technorati标签: , , , , , , ,

2009年4月10日,星期五

心理测量师的攻击:心理测量

我只是在阅读Borsboom(2006; 精神病学)的挑衅性文章“心理学家的进攻”。 文章摘要如下。 在阅读过程中,我喜欢一些旨在引起心理学家注意的陈述。 这是最近的最爱。 

“心理学家倾向于赋予过时的技术以模糊的解释”

抽象:  本文分析了妨碍心理学与心理学计量学整合的理论,实用和实质性因素。理论因素包括整个心理学中普遍存在的操作主义思维方式,经典测试理论的主导地位以及“construct 有效期”作为针对各种具有挑战性的心理测验问题的综合类。务实的因素包括对心理学中的数学精确思维缺乏兴趣,在主要统计程序中对心理学计量模型的表示不足以及对心理学课程的数学训练不足。实质性因素与缺乏足够强大的心理学理论以激发心理学计量模型的结构有关。在确定了这些问题之后,讨论了许多有前途的最新进展,并提出了进一步整合心理学和心理计量学的建议。

Technorati标签: , , , , , ,

2008年12月30日,星期二

项目-教育评估系列中的教学主题

无论您是教育测量技术的用户还是教育和心理测量的课程的授课者,如果您想阅读有关所选测量主题的相对简短的概述模块,都应该免费在线查看 NCME 项目 模块。  的 goal of 项目 通过提供有关该领域及时主题的简短指导单元,开发供大学教职人员和学生以及研讨会负责人和参与者使用的模块,来提高对教育测量原理的理解。 ITEMS是由 全国教育计量理事会(NCME)

以下是我从NCME 项目网页获得的信息:

教学模块设计为面向学习者,并包括摘要,教程内容,练习和带注释的参考。大多数模块随附的教具旨在通过提供补充的学生练习,参考资料,测试项目以及透明胶片或大师来支持在教学和车间设置中使用教学模块。

可以在下面将ITEMS模块下载为PDF文件(您可以使用Adobe Reader进行查看)。

获取Adobe Reader

Technorati标签: , , , , , , , , ,

2007年6月23日,星期六

有关阅读理解(Grw)的更多信息

该博客的普通读者会注意到,最近我特别关注阅读文章,这些文章涉及阅读理解的发展和评估(钢筋混凝土;点击 这里 这里)。

今天我偶然发现了2006年的一期特刊 阅读科学研究 处理主题 阅读理解评估。通过单击可找到文章和摘要的副本 这里 . 杰克·弗莱彻博士 提供了整个特刊内容的详尽摘要。

看看这个。一个好问题要阅读。


Technorati标签: , , , , , , , ,

供电 抄写员.

2007年5月24日,星期四

非单词(Ga / GSM )重复任务-要跟踪的文献

对不起,过去几个月来我的帖子前后不一致。当我和可爱的孩子一起工作时,这个夏天太疯狂了 未婚夫 计划一场婚礼,卖掉两座房子,然后盖一栋新房子:)

这篇文章的目的是提醒读者我发现的趋势(我可能发现这种趋势的时间太晚了……但是……至少我现在已经注意到它了。越来越多的经验文献暗示了通过 非单词重复任务 在识别儿童 特定语言障碍(SLI)。今天,我遇到了Estes等人的荟萃分析。 (2007; 点击这里查看),这继续凸显了这些功能和评估任务的重要性。摘要摘录如下。

重要的事情似乎是通过非单词重复任务来衡量的,尽管这些能力究竟是如何争论的。如Estes等人所述:
  • “围绕非单词重复使用的技能的性质,是否招募了语音工作记忆,已经引起了相当多的争论(Bishop等,1996; Botting& Conti-Ramsden, 2001;蒙哥马利,1995b;范德利& Howard, 1993), phonological encoding (Kamhi &Catts,1986年),语音意识或敏感度(例如Metsala,1999年)或一般语音处理能力(例如Bowey,1996年,2001年)。许多作者还承认重复非单词的行为涉及多个过程(例如Briscoe,Bishop,&诺伯里,2001年;爱德华兹&拉希(Lahey),1998年; 嘎 thercole,威利斯,巴德利,& Emslie, 1994; 雪 ling, Chiat, & Hulme, 1991). A child's ability to repeat a novel word may be affected 通过 any of the component skills involved in the process of hearing, encoding, 和 producing a word form: the ability to perceive 言语 distinctions;语音和形态表示的准确性,鲁棒性或组织性;储存单词形式的能力;以及运动计划和发音技巧。 SLI 儿童的损伤可能会在此过程中的任何时候或很多时候影响表现。”
我同意。任务分析表明,从 CHC 因子分析的观点,非单词重复任务可以从其阶乘复杂性(即,它们测量多个重要的能力/结构)中获得诊断的敏感性。这些可能包括 (听觉处理) 狭窄的能力 例如语音编码(PC),语音识别(US),声音模式存储(UM)和时间跟踪(UK)。另外,显然 GSM 牵涉到狭窄的工作记忆能力(MW;通常称为语音工作记忆或发音循环)。其他CHC候选能力包括访问个人词典的效率(又名;词汇访问或命名工具的速度-Glr:NA)。对于的用户 WJ -III 电池[利益冲突披露 -我是合著者],我们有一个名为 声音意识 已经发现,它非常能预测学术成就和诊断分类(正常还是某种疾病)...我主要认为,因为这是对多种狭能力(至少是PC和MW)。对于其他评估目的(诊断和预测)而言,并非因果“纯净”的措施仍然很重要和有用。

我鼓励读者继续跟踪新兴的非单词重复实践和理论文献。阅读的另一篇重要文章是 嘎 thercole(2006)。而且,我已经 以前的博客 关于杂志上的非单词重复文章 阅读障碍 恕我直言,该方法存在严重的方法缺陷,不应予以认真对待。最后,随着我对这些文学作品的认识的提高,我最近对 行动计划 参考数据库 对于其他可能相关的文章(如您所见。在这个领域不乏文学作品可供阅读)。

Estes等。 (2007)摘要
  • 目的: 这项研究对有和没有特殊语言障碍(SLI)的儿童之间非单词重复表现的差异进行了荟萃分析。作者研究了跨研究的效应量的可变性(即有和没有SLI的儿童之间差异的大小)及其与几个因素的关系:非单词重复任务的类型,SLI样本的年龄和非单词长度。 方法: 作者搜索了计算机化的数据库和参考部分,并要求未发表的数据来查找非单词重复任务的报告,以比较有或没有SLI的孩子。 结果: 患有SLI的儿童在非单词重复方面表现出很大的损伤,平均水平(跨23个研究)比没有SLI的儿童低1.27个标准差。主持人分析显示,非单词重复任务的不同版本产生了明显不同的效果大小,表明这些措施不可互换。第二次主持人分析发现,效应大小与SLI儿童年龄之间没有关联。最后,一项探索性的荟萃分析发现,患有SLI的儿童表现出即使重复短单词也很难重复的现象,而长单词则很难重复。 结论: 这些发现可能会影响非单词重复任务的使用和解释方式,并为未来的研究提出了一些方向。
Technorati标签: , , , , , , , , , , , , , , , , , , , , ,

供电 抄写员.

2007年4月11日,星期三

差异能力量表-第2版:在CHC专栏中再发表

荣誉 科林·埃利奥特(Colin Elliott) 最近出版的第二版 差异能力量表(DAS-2)。当我在1997年撰写有关DAS的文章时 CHC 对所有主要情报电池的广泛分析(在Flanagan等,1997年) 中央情报局 本书),我认为它是 CHC 能力...首先,当然是故意 CHC 设计的 WJ -R 和WJ -III (强制性利益冲突 -我是《 WJ III)。看到它现在已经加入了不断增长的人群中,我并不感到惊讶(看到我的CHC热门帖子)故意 CHC -设计的智能电池,即IMHO,当时(从CHC的角度来看)是第二好的工具(1997年)。

和往常一样,请查看 威利斯和杜蒙 该网站的其他 达斯 -2 相关信息。

我很想看看副本。提示...提示...是谁 心理公司。听吗您不喜欢我刚刚给DAS-2的免费宣传吗?我肯定会喜欢免费的副本以进行检查。





Technorati标签: , , , , , , , , , , ,



供电 抄写员.

2007年1月26日,星期五

Quantoids角点双因素和二阶FA比较-Matthew Reynolds的来宾帖子

以下是来自的来宾博客文章 马修·雷诺兹,其中之一 蒂姆·基思(Tim Keith) 博士研究生 教育心理学 德克萨斯大学奥斯汀分校教育心理学系(学校心理学与量化方法)。

这是未来量化指标在学校/教育心理学研究领域中不容错过的出色文章。感谢蒂姆·基思(Tim Keith)博士建议他的一名博士生写一篇追求博客文章。这是 首先是这样的博士生虚拟学者职位。 如果还有其他教授想招待博士生,请他们分配文章以查看并准备在IQ的Corner上做客座职位,请给我发送电子邮件...。 [email protected]
  • Chen F.F.,West,S.G.和Sousa,K.H.(2006)。生活质量的双因素和二阶模型的比较。 多元行为研究, 41189-225。 (点击查看)

尽管与智力没有直接关系,但本文比较了在智力心理测量研究中经常使用的两种验证性因子分析(CFA)模型:双因子模型和二阶模型。 Chen等。 (2006年)将双因素模型描述为具有一个在所有项目中均占共同体的通用因素,并在特定领域中解释了超出通用因素影响的特定领域因素。二阶模型被描述为具有相关的一阶因子,而一阶因子解释了这些关系。

研究1通过将因素结构应用于AIDS时间导向的健康结果研究中的生活质量测量,比较了这两种模型。研究2是 蒙特卡洛 研究调查是否有足够的能力来检测双因素和二阶模型的差异。先前的研究表明,根据经验不可能在社会科学研究中使用的典型样本中将两者区分开(即 穆莱克 & Quartetti, 1997).

研究1的结果:

  • 双因素和二阶因素模型被强加给一项与医疗保健有关的生活质量调查,涉及17个项目。这些模型具有一般的总体生活质量因素和四个领域特定因素。四个特定领域的因素包括认知,活力,心理健康和疾病担忧。
  • 双因素模型的结果表明,心理健康因素并未提供超越一般因素的独特信息。因此,该模型被重新指定而没有心理健康因素。
  • 指定了二阶因子模型,其中包含四个一阶因子和一个总体生活质量因子,该因子解释了一阶因子之间的关系。但是,心理健康因素的剩余方差具有统计学意义,表明该因素有一些独特的贡献(尽管一般因素占该因素方差的91.4%)。请注意,此发现与双因素模型不同。在双因素模型中,心理健康因素并未提供独特的信息。 因此,为了与双因素模型一致,作者还重新指定了二阶模型,以使只有三个因素以及与心理健康因素相关的子测验直接加载到了二阶因素上。
  • 比较两个不同模型的结果表明,双因子模型和二阶因子模型都提供了足够的拟合度。由于二阶模型是双因素模型的更受约束的版本,因此使用似然比检验(即卡方差检验)来比较模型的拟合度。二阶模型比双因子模型拟合得更差,这表明应用于双因子模型的约束过于局限。另外,功率分析表明有足够的功率来检测差异。
  • 接下来,作者使用这些模型来预测社交功能。两种模型均得出几乎相同的标准化估算值。就能力因素的可解释性而言,这一发现相当令人放心。

研究2:

  • 研究结果表明,即使样本数量为200,也似乎有足够的能力检测双因素模型和二阶模型之间的差异。


讨论:

  • 作者得出的结论是,双因素模型比二阶模型具有多个优势。优势之一是它确定了三个因素,而不是四个。我不太相信这一定是一种优势。第二,他们指出,研究人员在查看结果时可能会漏掉潜在的不重要的一阶因子方差。我认为这是作者的一个好观点。但是,我对使用双因素模型也有同样的担忧。例如,一个不太仔细的研究人员可能不会考虑非重要领域特定因素的负载以及非重要领域特定因素的方差。
  • 第二个优点是双因素模型拟合得更好。也就是说,一般因素和项目之间的关系不能完全由一阶因素来调节。
  • 第三,他们指出,在预测外部标准时,双因素模型更易于解释,因为领域因素在双因素模型中表示为公共因素,而在高阶模型中则是残差因素。虽然是正确的,但我认为这是次要的。
  • 最后,也许是最重要的是,他们得出结论:两个模型都对研究有用。我完全同意这一点,因为CFA模型应该与理论模型一致。
  • I通常,本文为那些对层次因子分析感兴趣的人提供了很好的信息,并且以简单的方式提供。我认为双因素模型的优势被高估了。我确实同意在研究中检查两个模型是有用的,特别是因为二阶模型可以从双因子模型派生而来。
  • I在我自己的研究中,双因素模型的一个缺点与经验不足识别有关。我认为,也许它遇到了与多方法多特征模型相同的困难,因为它们过于参数化。最近使用双因素模型测试方法效果的研究也发现,即使双因素模型是不正确的模型,它也可能非常适合(Maydeu-Olivares&Coffman,2006)。
  • 就心理计量智力的研究而言,两种模型的解释也略有不同。例如,在双因素模型中,一般因素的所有影响都是直接的。在情报研究中,在我看来,当代理论与高阶模型更一致,在该模型中,一般因素解释了广泛能力的相互关系,并且其与测试性能的关系是通过广泛能力来介导的。
  • 为了使它与情报研究人员更加紧密相关, 一些输出 我使用Holzinger进行的分析&Swineford相关矩阵在他们1937年的研究中报告。分别显示了规格,具有标准化载荷的模型以及非标准化载荷,差异和总效应。只是警告,这些模型不是公开形式,但足以进行演示。我希望这些模型有助于阐明二阶模型实际上是双因素模型的更受约束的版本。有关更多技术性说明,请参见Yung,Thissen和McLeod(1999)。
  • 最后,顺便说一句,我想我将分享霍尔辛格的最后两句话&Swineford 1937年文章 精神病学。 在本文中,作者介绍了双因素模型:
  • 上面说明的双因素分析不仅非常简单,而且与其他方法相比,计算相对容易。对于本示例,由一个人完成的总计算时间少于十小时。”
  • 我只是在Amos 5中运行了一个双因子模型,除了设置模型外,实际的计算时间为0.29秒。您必须感谢研究人员多年来投入的所有时间和耐心,才能使我们今天处于今天!
Technorati标签: , , , , , , , , ,

供电 表演Firefox