显示带有标签的帖子 统计. 显示所有帖子
显示带有标签的帖子 统计. 显示所有帖子

2016年12月6日星期二

心理学中的大数据:心理学方法专刊

我刚刚在 心理方法。 我期待阅读许多文章,因为心理学中“大数据”分析的思想很重要。 我特别希望阅读由作者合着的文章 杰克·麦克阿德 在SEM树上。 我不确定我是否会理解,但是我知道杰克做了很多工作。 多年前,他是第一个向我介绍SEM方法的人(在WJ-R项目期间;他通过一个名为COSAN的程序非常轻松地教我了SEM,然后我毕业于LISREL),他很棒老师-他可以从概念上阐明复杂的统计方法。 然后我也了解了决策树方法 (CART,MAR) 杰克(Jack)的话,并认为应该在心理学研究中更多地使用它们。 此博客的类固网读者应该很好地接受此PM问题。

 

更新-心理方法-第21卷,第4期

以下是新发行的 预约定价安排 日志:


心理学中的大数据:特刊简介。
第447-457页
哈洛,丽莎L。奥斯瓦尔德,弗雷德里克·L。

心理学大数据研究的实用指南。
第458-474页
陈(Eric Evan);肖恩·P·沃希克

理论驱动的网络抓取入门:从Internet自动提取大数据以用于心理研究。
第475-492页
兰德斯(Richard N.)布鲁索,罗伯特·C。卡瓦琳,卡特琳J .; Collmus,Andrew B.

挖掘大数据以提取模式并预测现实生活的结果。
第493-506页
米哈尔Kosinski;王以伦希玛宾杜Lakkaraju;列斯科维奇

从社交媒体语言中获得见解:方法和挑战。
第507-525页
玛格丽特·科恩(Kern);格雷戈里公园;约翰内斯·艾希斯塔德(Eichstaedt); Schwartz,H。Andrew; Sap,Maarten;史密斯(Laura K.); Ungar,Lyle H.

传递负面情绪:对大学校园暴力事件后的Twitter数据进行调查。
第526-541页
Jones,Nickolas M .;肖恩·P·沃希克(Wojcik);亲爱的,约西亚;银,罗克珊·科恩(Roxane Cohen)


用结构方程模型森林进行理论指导的勘探。
第566-582页
布兰德迈尔(Andrews M.)格林德尔(John J.)麦卡德,约翰·J。乌尔曼·林登伯格

使用多元树增强在数据中查找结构。
第583-602页
米勒,帕特里克·J。卢克,吉塔·H。麦克阿托,丹尼尔·B。 Bergeman,C.S.

高维预测的统计学习理论:在标准键规模开发中的应用。
第603-620页
查普曼,本杰明·P。魏斯,亚历山大;达伯斯坦(Paul Duberstein)

偏最小二乘对应分析:同时分析行为和遗传数据的框架。
第621-651页
Beaton,Derek;约瑟夫·邓洛普;阿维·赫尔维
收件箱
x




2015年3月4日,星期三

推荐的统计书:Tim Keith博士的《多元回归与超越》

我很高兴得知我所知道的最受尊敬的类固醇之一修订了他的经典著作, 多元回归及超越: 多元回归和结构方程建模简介。   基思博士的定量技能是一流的。  当我需要建议时,他是我咨询的三个量词之一。 Tim具有使统计概念易于理解的超凡才能。 

蒂姆(Tim)的新版本表达了两个强烈的赞许。 其他信息(包括指向亚马逊的链接)可以在他的网站上找到 网页。



2010年11月25日,星期四

研究字节:报告心理研究的效应量




优秀的文章。双击图像放大(我希望)


-使用我的Kevin McGrew的iPad使用BlogPress的iPost

2010年7月15日,星期四

量子角:层次线性建模(HLM)入门

当越来越多的应用期刊发表文章时,我向复杂的统计方法介绍较少的面向统计的读者时,我很喜欢它,因为我经常发现这些“傻瓜的量化解释”是对复杂统计方法的出色介绍。 今天我发现 资优儿童季刊 已发布了由两部分组成的简短文章系列,为您提供了不错的介绍 HLM. 我从未运行过HLM模型,因此我发现简介非常有帮助。 如此之多,以至于我可能会在一些合适的数据集上运行一些HLM,而我只是看到它起作用。

以下是这两篇文章。  Enjoy.  Kudos to GCQ麦考奇博士.

麦考奇(D.B.& Adelson, J. L. 处理依赖性(第1部分): 了解集群数据的影响。  资优儿童季刊,54(2)152-155。
本文从概念上介绍了有关聚类(嵌套)数据分析的问题。我们定义了类内相关系数(ICC)和设计效果,并解释了它们对标准误差的影响。当ICC大于0时,则设计效果大于1。在这种情况下,低估了独立性假设下产生的标准误差。这会增加I型错误率。我们简要说明了非独立性对标准误差的影响。我们表明,在考虑了设计效果之后,我们对测试统计量的统计显着性所做的决定会有所变化。当我们无法解释数据的聚类性质时,我们得出结论,两组之间的差异具有统计学意义。但是,一旦我们针对设计效果调整了标准误差,则差异不再具有统计显着性。

麦考奇(D.B.(2010). Dealing With Dependence (Part II): A 通用电器ntle Introduction to Hierarchical Linear
造型。 天才儿童季刊,54(3)252-256。
I在教育中,最自然发生的数据聚集在上下文中。学生聚集在教室内,教室聚集在学校内,学校聚集在地区内。当人们聚集在自然形成的组织单位(例如学校,教室或地区)中时,来自同一集群的人们的响应可能表现出某种程度的相互关联。分层线性建模的使用使研究人员可以针对这种非独立性进行调整和建模。此外,尝试了解同一集群中的人们彼此之间的相似程度,然后尝试找出有助于我们理解集群内部和集群之间差异的变量,可能具有巨大的实质意义。在HLM中,我们努力理解和解释感兴趣的结果变量的群内和群内变异性。我们还可以在个人级别(级别1)和上下文级别(级别2)上使用预测变量来解释因变量的方差。本文提供了一个使用实际数据集的简单示例,并逐步解释了简单的分层线性模型,以说明该技术的实用性。

Technorati标签: , , , , , , , , , , , , , , , ,

2009年5月4日,星期一

Quantoids角:网络研讨会统计资源

我只是偶然发现了一个网站(分析因素),提供有关各种统计分析问题的在线讲座。 我没有使用过该服务,但认为其他类可能要看一看。

Technorati标签: , , , , ,

2009年4月10日,星期五

心理测量师的攻击:心理测量

我只是在阅读Borsboom(2006; 精神病学)的挑衅性文章“心理学家的进攻”。 文章摘要如下。 在阅读过程中,我喜欢一些旨在引起心理学家注意的陈述。 这是最近的最爱。 

“心理学家倾向于赋予过时的技术以模糊的解释”

抽象:  本文分析了妨碍心理学与心理学计量学整合的理论,实用和实质性因素。理论因素包括整个心理学中普遍存在的操作主义思维方式,经典测试理论的主导地位以及“construct 有效期”作为针对各种具有挑战性的心理测验问题的综合类。务实的因素包括对心理学中的数学精确思维缺乏兴趣,在主要统计程序中对心理学计量模型的表示不足以及对心理学课程的数学训练不足。实质性因素与缺乏足够强大的心理学理论以激发心理学计量模型的结构有关。在确定了这些问题之后,讨论了许多有前途的最新进展,并提出了进一步整合心理学和心理计量学的建议。

Technorati标签: , , , , , ,

2009年3月14日,星期六

量子角:验证性因子分析指南


只要阅读一篇不错的文章 心理方法 最新的CFA方法,统计方法在情报研究中的使用频率很高。这是一个漂亮的手稿/研究清单...双击图像放大。我将在接下来的几天中跟进更详细的帖子。

2009年3月2日,星期一

量子角:处理(并计划)数据收集中的丢失数据

自从我发表一篇文章以来,已经有很长时间了,我的文章可能会调整阅读此博客的类固醇的鸟蛤。这是我的定量研究人员的目标,也适合那些定量研究较少的人员,因为该主题将在研究文章,测试手册等中更经常地提及。

缺失数据 几十年来一直困扰着研究人员和测试开发人员的问题。在过去的20年中,已经出现了非常复杂的方法来处理丢失的数据并通过复杂的统计算法生成“完整”的数据集。还有……许多运行数据的人可能已经使用了这些步骤,并且完全不知道他们的分析使用了估算值或合理值!例如,如果您使用主 结构方程模型(SEM) 软件程序(例如LISREL,Mplus,AMOS),并且您在某些主题上的数据不完整,这些程序很可能在运行SEM模型之前利用这些新算法之一来估算可能的值。

在过去的15年中,我一直在学习这些文献,并发现这些当代的缺失数据归类方法非常有用。越来越多的研究人员需要意识到这些方法的好处,以及正确使用它的一些细微差别。

过去一周,我收到了最新一期的 心理学年度回顾 并发现(令我高兴)这是统计领域最简单,最容易理解的摘要。我并不惊讶地看到它是由 约翰·格雷厄姆,他还为此主题撰写了许多其他重要的期刊文章。我敦促读者 智商角 谁进行应用研究或测试开发项目以阅读本文 概述文章。值得一读。另外,我建议读者认真看一下 Schaefer的NORM软件...当需要进行严重数据插补时使用的程序。有关该程序的详细说明,以及对一些缺失数据文献的简短概述,请参见 达玛万(2004).

真正酷的是 “计划的丢失数据”-----也就是说,设计一个数据收集项目以故意丢失数据,以便允许在更多的主题中收集更多的变量...然后可以通过这些对象进行处理(如果设计正确)新的类玩具。

同行(及未来)类固醇...享受

Technorati标签: , , , , , , , , , ,

2009年1月23日,星期五

阅读和阅读障碍:RAN是否应该躲藏起来?

我刚刚读了一篇出色的文章,调查了 语音意识, 命名速度(RAN快速自动命名), 正字法知识形态意识 了解阅读成绩。尽管鉴于总样本量,请谨慎行事(n= 93),这是我们在教育心理学上需要更多研究的一个很好的例子。

首先,本文的一个重要特征是对四种不同的与阅读相关的结构的描述和定义,这些结构最近在学习阅读中被认为是重要的。我建议阅读介绍,以更好地理解语音意识等。

但是,我对本文的真正兴奋之处在于,它直接尝试(至少部分地)解决以下问题: 规格错误, 当省略预测性或解释性研究中的潜在重要变量时发生的一种研究设计错误。这种类型的错误可能导致对预测变量的影响(相对重要性)的估计偏差。我有 之前用肥皂盒装过 不会在这里重复我冗长的腹泻。 长话短说 -我相信最近在教育,特殊教育和学校心理学领域中占主导地位的许多“热门”阅读/阅读障碍研究可能很快就使某些皇帝(语音意识; RAN)受膏,并给予了他们太多的赞誉。在上面的链接中阅读我以前的文章。除非您一直生活在一块岩石下(并且您与有阅读障碍的孩子一起工作),否则似乎总是在chat不休 “ RAN这个... RAN那... RAN是...等等。” 是的...我在夸大我的观点。

为什么我喜欢这篇最新文章(或为什么它可以减轻我的抱怨)?简单。它不仅将RAN和/或音素意识作为阅读的预测因子进行了单独的研究……它还使他们能够与正字法知识和形态意识一起竞争阅读的解释。你猜怎么着? RAN未能参加比赛!当输入到同时回归模型中以预测阅读时,当音素意识,正字法知识和形态学意识也在运行时,RAN不会对阅读预测做出任何贡献。

本文认为,由于过去十年来主导我们专业期刊和会议的大量热门和性感阅读研究中的规范错误,导致RAN的炒作可能被过分夸大了。

但是请不要误会我的意思,有大量证据表明RAN的基础过程可能对早期阅读很重要。我的观点是,这篇文章支持了我的观点,那就是也许它已经获得了太多的荣誉……并且需要降低一个等级。

如果我也没有批评这项当前的研究,因为我也没有包括其他潜在的重要阅读预测因素,那我会很失落。例如,我希望看到作者也包括工作记忆的量度(兆瓦),词汇知识(气相色谱)或词汇,感知速度(糖蛋白)和关联记忆(胶体)....基于 我对现存阅读文学的阅读.

我现在将从我的 规格错误 肥皂盒。要传达的信息是,我们需要进行更多的研究以摆脱盲人的眼光,并包括与阅读(以及学校学习的所有领域)相关的重要构想的更全面的基于研究的指标……因此,我们可以确定哪些构想/能力很重要,在什么程度上很重要。另外...如果这些研究人员指定了基于研究或理论的因果SEM模型(结构之间可能存在直接和间接的因果关系),我会更喜欢-也许RAN被认为更重要...可能作为其他预测因素的直接或间接原因(或结果)。

以下是文章参考,摘要和链接供您阅读。


罗曼(Roman,A.A.),柯比(Kirby),J.R。,帕里拉(Parrila),R.K。,韦德·伍利(WadeWoolley),&Deacon,S.H.(2009年)。全面了解4、6和8年级的单词阅读技能。 实验儿童心理学杂志,102(1)96-113。 (点击这里查看/阅读)

  • 抽象:迄今为止的研究提出了与阅读发展有关的四个主要变量:语音意识,命名速度,正字法知识和形态意识。尽管已在其他一个或两个其他变量的背景下检查了这些变量中的每个变量,但本研究同时检查了所有四个因素,以评估它们对阅读的独特贡献。样本分别来自4、6和8年级(10、12和14岁)的孩子完成了一系列测试,其中包括至少四个变量中的每个变量的度量和两个阅读准确性的度量。语音意识,正字学知识和形态学意识都对真实单词和伪单词的阅读产生了独特的影响,而其他变量却无法满足这些严格的控制要求。结果证明了这三种技能在老年读者阅读中的持续重要性。
Technorati标签: , , , , , , , , , , , , , ,

2009年1月21日,星期三

让我们听听它的科学,数据和统计数据

我昨天在奥巴马的讲话中听到了一些激动人心的短语。如下面链接中的文章所述,一种方法是将科学恢复到适当的位置。另一个是证实“根据数据和统计"

对这个类比词有安慰性的话。

http://www.sciam.com/podcast/episode.cfm?id=we-will-restore-science-to-its-righ-09-01-21


从KMcGrew iPhone(IQMobile)发送。 (如果消息中包含图片,请双击该图片以使其变大,如果看不见的话)

2008年12月14日,星期日

岩浆指南统计书

我最喜欢的新博客之一(GOOD MATH BAD MATH)上的有趣帖子
回复:向学生展示统计数据的新方式。

http://scienceblogs.com/goodmath/2008/12/book_review_the_manga_guide_to.php


从KMcGrew iPhone(IQMobile)发送。 (如果邮件中包含图片,
双击使其变大(如果很难看到)

2008年6月10日,星期二

项目:教育测量/统计基于网络的教学模块

我刚刚读到 ITEM专案 在最新一期的 教育评估:问题与实践。 所有基于学校的评估专业人员都可能希望看一看...。这些材料可能对教育他人有关分数的含义,他们做什么和不告诉我们以及分数差异意味着什么有用。

项目描述 来自ITEMS网页(重点和IQ的Corner博客管理员添加的链接)
  • 在当前“不让任何孩子落伍”的时代,希望K-12的教师和管理人员对标准化测试结果有深刻的理解,使用它们来改进教学,并与他人进行交流。但是,许多教育工作者从来没有机会获得这些角色所需的“评估素养”。由加利福尼亚大学圣塔芭芭拉分校的丽贝卡·兹维克(Rebecca Zwick)指导的ITEMS项目的目标是,开发和评估教育测量和统计中的三个基于Web的教学模块,以解决这一培训空白。我们创造了 三个25分钟的单元: “比分是多少?”(2005年),“什么考试成绩能告诉我们什么? (2006),以及 “有什么不同?” (2007). Overall, 250 K-12 teachers 和 administrators participated in our research, which demonstrated the effectiveness of the modules in communicating 教育测量 和 统计 concepts, especially for teacher 教育 students. Our modules are now freely available on our website, http://items.education.ucsb.edu, in low- 和 high-bandwidth versions, with optional closed captioning. Also posted are supplementary materials, including glossaries, formulas, reference lists, 和 quizzes corresponding to each module. The provision of this 训练 in a convenient 和 economical way is intended to assist schools with the successful implementation 和 解释 of 评定s. Several school districts have let us know they are using the materials, 和 在 least one teacher 教育 program has incorporated them into its curriculum.
Technorati标签: , , , , , , , , , ,

2008年6月5日,星期四

三级差异基准价格信息

最近有人问了一个问题 国家航空航天局列表服务器 关于如何找到有关WJ III差异分数的“基本率”信息。同事兼朋友Barb Wendling发表了非常详尽的回复。我决定在下面做她写得很好的解释...,以便以后可以随时参考。 倒钩的荣誉 [利益冲突声明- 我是《 三级》的合著者。

差异规范

  • 三级 交流电H和WJ III COG的组合使计算规范样本中每个个体的差异评分成为可能,然后使用该信息准备差异规范。对于变化和差异过程,“ 法案UAL” 与“ PSEUDO”差异规范相反的差异规范 用于确定任何变化或差异的重要性和频率 (s ee r出口到 以下连结 进一步说明 :) . 这些差异规范为从业人员提供了许多优势。首先,在相同的,具有全国代表性的大型样本上对认知和成就系列进行了标准化,从而消除了使用基于不同准则样本的测试时存在的未知差异带来的误差。其次,相关系数在各个年龄段的能力和成就之间都是已知的,因此无需基于一些相关性和有限的样本来估计和校正回归量。第三,从业人员可以使用差异的百分等级(差异PR)或成就分数与预测的成就分数之间的差异(估计单位的标准误差)来评估差异的重要性(差异SD)。
  • 差异百分等级。 该分数定义了实际分数和预测分数之间存在特定大小差异的总体百分比。差异PR是基于规范的估计 基本费率 of人口中的特定差异。与通常基于横截面数据的其他测试提供的基本费率不同,WJ III通过按标准样本内的子组(相同年龄或等级)报告信息来提供更高的准确性。
  • 差异标准偏差。 这个分数反映了考生的距离’的分数高于或低于同龄或同等级同学的平均分数。差异SD允许根据估计的标准误差定义重要性标准。通常,将差异SD选为+/- 1.5或更大。这种幅度的差异大约会发生100次中的6次。镨行动者 但是,在使用各种WJ III软件评分程序时,可以选择从+/- 1.0到+/- 2.3的不同显着性水平.

2008年2月1日,星期五

努计分问题说明:David Dailey的来宾博客文章


最近,有人在 CHC列表服务器 要求澄清由 努规范。我认为该问题为WJ系列乐器中使用的某些心理测验原理和方法提供了一个“可教的时刻”。

我问 戴维·戴利WJ 作者小组的常驻统计学家和技术顾问,写一个简短的解释。他的书面答复如下。请享用。

[感兴趣的读者也可能对最近发表的文章感兴趣 努评估服务公告hat解释了为什么WJ III和NU规范之间的分数可能会有所不同。另外,利益冲突披露-我是《 三级》的合著者]


尊敬的詹森女士(提出问题的人):

感谢您与CHC邮件列表分享有趣的阅读成绩。凯文·麦格鲁(Kevin McGrew)已要求我就这些成绩所表现出的现象写几句话-尤其是,正如您所问的,为什么这个61个月大的孩子的广泛阅读成绩这么低。我一直积极参与WJ III和WJ III NU规范表的开发,希望我能对您的问题有所帮助。

您报告说,您的主题在阅读测试和分类中获得了一组特定的标准分数。我用下表中的那个主题出现的近似W,W差异和RPI分数来扩大了这些分数(最好以固定宽度的字体查看):

[我为以下数字的格式表示歉意.....我努力获得一种不错的表格格式,但无法正常工作。在使用博客软件方面,我还是一个相对较新的人]

测试/群集,SS,W,W-diff,RPI

字母-单词ID,140,431,+87,100

文字攻击,138,463,+81,100

阅读流利度128、477,+ 13、97

通过理解,133,458,+56,100

广泛阅读,125、455,+ 52、100

简介,149,444,+71,100

基本阅读技能,145,448,+85,100


您可以自己验证集群W分数是组成集群的测试的W分数的算术平均值。 W差异和RPI显示该受试者的阅读发展远高于其同龄人-但他们还显示阅读流利度得分不及其余得分那么出色。

您担心广泛阅读集群的标准分数比其他集群标准的分数低很多。尽管该主题的分数在所有类别中都非常高(就同龄人的熟练程度而言),但与其他类别相比,广泛阅读分数并不那么出色。它的W差低于其他类别,因为它包括阅读流利度,为此,受试者“仅” 13 W点胜过了同龄人。

上表中的W差异分数是计算受试者标准分数的两个术语之一。另一个是比例因子(SD-标准偏差),用于说明测试分数在参考对等组中的分布范围。

在Woodcock-Johnson产品中,允许在同等参考组中表现低于中位数的受试者的比例因子(SD)与通常在表现高于中位数的受试者中的比例因子(SD)不同。因此,WJ评分模型始终能够反映出高绩效者与低绩效者之间不同的价差。

事实证明,对于像您这样的年轻主题,阅读集群中表现出色的学生的比例因子(SD)很大-这意味着要获得很大的W差异才能获得与意思。这是因为,对于这些阅读技巧中的大多数,上述中级科目的分数分布非常广泛。对于广泛阅读,一个61个月大的受试者必须获得比中位数高32 W的积分才能获得115的标准分数(比平均值高一个标准差)。对于其他两个阅读簇,该数目要小一些。因此,再加上您的受试者在这些聚类上获得的更高的W差,就可以说明该受试者的标准得分模式。

(您可能会注意到阅读流利度的比例因子非常小。这反映了一个事实,即该年龄段的中高级受试者在此任务上的差异很小。)

因此,最重要的是,广泛阅读分数遭受了“双重打击”,即W差异相对较低(由于较低的阅读流利度),而规范样本分数的中位数差异较大。并且该受试者在其他集群上获得了更高的标准分数,因为他们在这些集群上的相对表现(就原始能力而言)要高得多,而且范本样本内的差异也较小。

再次感谢您的提问。希望我能帮助您更多地了解这些分数的工作原理。

Technorati标签: , , , , , , , ,

供电 抄写员.

2007年10月10日,星期三

智商测试的因素分析:因素太多?

这周,在 国家航空航天局列表服务器,进行了简短的交流:保理 智力测验。它开始于 嘎ry Canivez博士 引用了该杂志的最新文章 情报 (弗雷泽& Youngstrom, 2007)。卡尼维兹博士写道:
  • 您可能还想阅读Frazier和Youngstrom(2007)的文章,该文章发表在《情报》杂志上的认知评估工具中的过分分解问题。其他与最高阶维度(g)有多少可变性以及较低阶维度中剩下的可变性(第二层因素)有关的其他问题也影响得分的可解释性。
我以前曾评论过(“当代智商测试是否被过分夸大了”)上有关此文章的文章(当“在出版中”时),在此不再赘述。 弗雷泽and Young 抽象 在下面
  • 认知能力的商业测试所衡量的因素数量的历史性增长可能源于四个明显的压力,这些压力包括:越来越复杂的智力模型,测试发行者渴望提供具有更大解释价值的临床有用评估工具,测试发​​行者渴望获得更大的解释价值。包括研究人员可能感兴趣的次要因素(但在临床上无用),以及用于确定测试因素结构的宽松统计标准。本研究使用从主要成分分析以及探索性和确认性因素分析得出的统计标准,检验了几种历史相关且当前采用的商业认知能力测试所测得的因素数量。霍恩的平行分析(HPA)和最小均分(MAP)分析是两个很少使用的统计标准,已被证明可以准确地恢复数据集中的因素数量,它们是金标准。正如预期的那样,通过认知能力测试测得的因素数量随时间有了显着增加(r = .56,p = .030)。结果还表明,最近在认知能力测验的过度分解方面的大量增加。未来认知评估电池的开发人员可能希望增加电池的长度,以便更充分地测量其他因素。另外,对简短评估策略感兴趣的临床医生可能会从可靠评估一般智力的短电池中受益。
在一个有趣的回应中, 乔尔·施耐德博士 提供以下建议:

  • 嘎ry,您所引用的论文表明,认知测验“夸大了”他们的数据,这意味着它们提取的因素比数据中实际存在的要多。它将WJ-R和WJ-III选为离群值(即WJ电池的确过高)。我发现他们的结论令人难以置信,因此我使用SPSS处理了一些模拟数据,以查看是否可以制作具有7个宽因子结构以及将所有分值结合在一起的g因子的模拟“ WJ -III”数据集。每个子测验分数的计算方式如下:

    子测试= g + BroadFactor +错误

    每个子测试都分配给它设计要加载的广泛因素
    上。每个方差源均呈正态分布。

    通过系统地改变g和广义因子的方差,我
    能够查看如何执行不同的因子提取规则
    在g和宽因子大小的几种组合下。

    我发现即使是中等大小的g因子也会导致所有
    提取规则的数量低估了真实数量
    因素(在这种情况下为7个相关因素)。

    似乎在许多可能的情况下,类似WJ-III的数据将具有
    比流行因素提取规则检测到的因素更多。因此,我
    认为本文夸大其词。

    这是我的SPSS语法。创建数千个案例,然后使用
    gCoefficient和FactorCoefficient变量(0到2是一个很好的范围)。

    计算g系数= 1.5。
    计算因子系数= 1.0。
    计算g = RV.NORMAL(0,
    1) .
    计算Gc = RV.NORMAL(0,
    1) .
    计算Gf = RV.NORMAL(0,
    1) .
    计算Gsm = RV.NORMAL(0,
    1) .
    计算Gs = RV.NORMAL(0,
    1) .
    计算Ga = RV.NORMAL(0,
    1) .
    计算Glr = RV.NORMAL(0,
    1) .
    计算Gv = RV.NORMAL(0,
    1) .
    执行 。
    计算VC = RV.NORMAL(0,
    1)+ g系数* g +系数系数* GC。
    计算GI = RV.NORMAL(0,
    1)+ g系数* g +系数系数* GC。
    计算CF = RV.NORMAL(0,
    1)+ g系数* g +因子系数* Gf。
    计算AS = RV.NORMAL(0,
    1)+ g系数* g +因子系数* Gf。
    计算P = RV.NORMAL(0,
    1)+ g系数* g +因子系数* Gf。
    计算值= RV.NORMAL(0,
    1)+ g系数* g +系数系数* l。
    计算RF = RV.NORMAL(0,
    1)+ g系数* g +系数系数* l。
    计算RPN = RV.NORMAL(0,
    1)+ g系数* g +系数系数* l。
    计算NR = RV.NORMAL(0,
    1)+ g系数* g +系数系数* GSM。
    计算MW = RV.NORMAL(0,
    1)+ g系数* g +系数系数* GSM。
    COMPUTE AWM = RV.NORMAL(0,
    1)+ g系数* g +系数系数* GSM。
    COMPUTE VM = RV.NORMAL(0,
    1)+ g系数* g +系数系数* s。
    计算DS = RV.NORMAL(0,
    1)+ g系数* g +系数系数* s。
    计算PC = RV.NORMAL(0,
    1)+ g系数* g +系数系数* s。
    计算SB = RV.NORMAL(0,
    1)+ g系数* g +因子系数* 嘎。
    计算AA = RV.NORMAL(0,
    1)+ g系数* g +因子系数* 嘎。
    计算IW = RV.NORMAL(0,
    1)+ g系数* g +因子系数* 嘎。
    计算SR = RV.NORMAL(0,
    1)+ g系数* g +因子系数* Gv 。
    计算PR = RV.NORMAL(0,
    1)+ g系数* g +因子系数* Gv 。
    执行 。
    因子
    /变量VC GI CF AS P VAL值 RF RPN NR MW AWM VM DS PC SB AA IW SR PR
    /缺少清单
    /分析VC GI CF AS P VAL值 RF RPN NR MW AWM VM DS PC SB AA IW SR PR
    / PRINT初始提取旋转
    / FORMAT SORT BLANK(.10)
    /情节本征
    / CRITERIA MINEIGEN(1)ITERATE(25)
    /提取PAF
    / CRITERIA ITERATE(25)
    /旋转PROMAX(4)
    / METHOD = CORRELATION。

所有这些 “这个因素分析比那个因素分析要好” 让我想起了很久以前写的一章 Doug 德特曼 (该杂志的现任和长期编辑 情报---对不起...我想不起来参考文献或确切的引号...我正在长期记忆中)在一本关于个体差异和智力的书中载体。这是一章,涉及个人差异研究的规律。其中一项法律与因素分析有关。用我自己的话 - -“如果您将两名因子分析方法学家放在同一房间内,则会引起争论……将无法就提取的因子数量,使用的正确轮换方法以及因子的解释达成共识。”

如此真实!我目前的唯一评论是,亲身学习了以下一些最重要的课程: 约翰·霍恩, 约翰·“杰克”·卡洛尔杰克·麦克阿德,对智力测验进行适当的因素分析时,既有“科学”(特定因素提取规则)又有“艺术”。

敬请期待。 约翰·加鲁托博士 刚刚给我发送了有关本文的从业人员观点。它将在今天晚些时候或明天作为访客博客帖子显示。

让游戏开始。


Technorati标签: , , , , , , , , , , , , , , , ,

供电 抄写员.

2007年9月3日,星期一

威斯康星州-III / IV散点图/ FS 智商研究-Hale对Lopez的回应

昨天的来宾博客文章作者 鲁本·洛佩兹(Ruben Lopez) 产生了一个漫长的回应 詹姆斯·布拉德·黑尔博士,关于 国家航空航天局 CHC列表服务器关于这个特定主题(对智力测验的综合和测验分数的解释)。对于那些都不属于这两个名单的人,布拉德经常挑战沃特金斯等人所阐述的研究背后的统计论据/方法。文章鲁本评论。实际上,在同一期中 应用神经心理学,Hale等人概述了他们的论点(点击这里查看/下载)。 [注意-请参阅 上一个位置在此博客上可以找到有关整个特刊的信息。围绕整个主题有很多立场和观点。布拉德的立场不是唯一的立场]

为了保持平衡,我决定从NASP列表服务中删除Brad的回复,并将其发布在此处 智商的角落。这将使其他人了解Brad的论点,并应有助于避免在这两个列表上出现束缚-因为Brad(和其他人)可以简单地将人们引荐到IQ角落的这个更常任的职位,以了解Brad的论点和想法[布拉德的笔记 -也许这篇文章可以使您免于重复在列表服务器上表达自己的想法和想法的烦恼...只需在该帖子上插入一个URL链接。]。同样,在过去,对于布拉德的论点,挑战和主张也听到了其他声音。如果他们想提出反响,我会鼓励任何这些声音与我联系([email protected])。

请注意,我发表布拉德的回应并不意味着我认可他的论点或主张。它们按“原样”显示。作为博客管理员,如果特别AN版本中其他文章的作者会以我可以博客文章形式发布的书面回复做出回应,我会喜欢的。
  • 我的意思是鲁本·洛佩兹(Ruben Lopez)并非故意冒犯他,这似乎是出于善意,但这清楚地说明了Watkins等人的观点。结果是如此成问题,并且可能被视为不道德的。为什么?因为像洛佩兹先生这样的从业者阅读了这些作者的立场和分析,并断定他们“看起来很合理”(引自洛佩兹先生的话)。然后,洛佩兹先生继续得出结论:“因此,我不会仅仅因为分散而忽略全部规模”。如果按照我的建议分析是错误的,则很明显的证据表明,至少有一位从业者(和其他人)可能被这项研究误导了,并且影响了他(他们的)心理学实践。
  • 这是非常可悲的,因为在同一期特刊的反驳论文中(Hale等,2007),提供了统计分析,清楚地表明了Watkin论文中的错误。是的,错误。是的,这是好话。除非我确信数据表明它们是错误的,否则我不会说它们是错误的。黑人和白人都在那里。这不是见仁见智,而是事实之一,我挑战任何统计学家的记录来证明沃特金斯分析是正确的,而我们的反驳分析是错误的。 *请*,仅限统计学家!这些是复杂的统计论据,最好由统计学家确定谁是正确的。无论您是否相信全球智商的价值,这都不是问题。该问题仅与统计分析有关。
  • 再次,请任何愿意出面证明我们认为自己错了的统计学家,请这样做。请让他们提供其全名和其他识别信息,以便日后与他们联系。
  • 至于为什么人们会继续重视和/或支持那些具有重大统计错误的论文,甚至愿意发表这些论文,这要由读者来决定。我什至不会猜测,因为这可以看作是自发攻击。我确实感到有趣的是,有人可以阅读特刊上的一篇文章并说这是件好事,而没有提及其他文章,这表明事实并非如此!
  • 如果我是正确的,并且这些分析在统计上是不适当的,并且被用来向从业人员介绍临床实践(与该学术团体撰写的许多其他论文一样(我们也在反驳论文中也显示)),这里的道德问题。我已经亲自联系了作者,并直接将其他论文中的统计错误告知他们,并且还联系了编辑。
  • 我们还显示了为什么在几本已发表的著作中分析是错误的。但是,该学术团体的作品仍继续受到其他人的认可,即使是那些精通统计学的人也更了解。当人们的观点和价值观取代事实时,这是科学领域的悲惨日子。我想我们作为一个职业必须问自己一个非常重要的问题。我们受到科学事实还是幻想的指导?由我们所有人来决定。
  • 请将此电子邮件转发给您认为愿意答复的任何人,包括Dr.Watkins和Glutting。

Technorati标签: , , , , , , , , , ,

供电 抄写员.

2007年6月22日,星期五

量子角-ROC曲线分类

对于我的其他类。

从事智力理论/测试研究的我们经常面临的统计问题是如何从测试分数(或测试分数的集合)中量化分类的准确性(敏感性/特异性)。在过去的几年中,我看到越来越多的关于使用 鹏曲线(接收机工作特性曲线) 评估分类的准确性。通常,读数本质上是技术性的。就在这个星期 MATLAB博客中的数据挖掘 发表了一个伟大的 “傻瓜的中华民国” 说明。我爱它。它以非常简单的语言说明了此过程。如果您正在进行分类研究和/或发现自己正在阅读使用ROC方法的文章,则应发挥最大作用。

Technorati标签: , , , , , , ,

供电 抄写员.

2007年1月27日,星期六

知道这个词吗?阅读障碍研究中的不良数据会“提高”?

我最近在杂志上浏览了以下文章 阅读障碍, 一篇文章建议对单词进行阅读( 三级字母词识别)和伪字阅读( 三级 Word Attack测试) 正在测量相同的结构。如下摘要所述,作者报告与 .94 在71位受试者(6至9岁)的样本中,这些测量之间的差异。正如抽象结论中突出显示的那样,作者认为伪单词阅读(Word Attack)的措施具有可疑的价值,因为它们与简单单词阅读(Letter-Word Identification)的测试几乎没有什么不同。

不幸的是,仔细检查研究方法表明: 分析存在严重问题。作者将原始分数与成就测度相关联。众所周知,原始分数(以及其他基于发展的分数,例如 三级 W得分) 是 发展的 在自然界中……就是说,分数会由于年龄的增长而系统地增加,这是由于单纯的成熟和连续升读成绩的影响。广泛年龄段的发展分数不能相互关联 无需先消除相关措施所共享的基于年龄/成熟度的发育差异的混淆。作者没有这样做。他们确实报告了研究中每项指标的得分“标准化”,但这听起来像是他们在整个年龄范围内对得分进行了标准化……这一过程保留了基于发育/年龄的差异。 [作者应按年龄将每个度量标准标准化。尽管年龄子样本使这一点有些棘手。理想情况下,由于没有标准评分,作者应该分出年代顺序的影响,保存残差,然后将残差进行关联]。

在较宽的年龄范围内与发育分数(原始分数; W分数)进行关联的正确方法是,首先通过使用基于年龄的标准分数或通过从中分离出发育年龄差异来消除发育/年龄差异。发展分数,然后关联剩余方差分数。

为此,我采用了WJ III规范数据[利益冲突披露e-我是《 三级》的合著者,并且从6岁到9岁之间选择了所有规范科目。我首先(不恰当地)关联了W分数,这与作者的关联原始分数相似。相关性是 .85. 虽然不如 .94 作者报道,它仍然处于高端。然后,我通过针对同一主题关联基于年龄的标准得分(平均值= 100; SD =平均值)消除了“第三变量”混淆的问题(字母/单词ID和单词攻击同时存在的年龄/发育差异) 15)。相关系数降至0.72。

显然,文章中报告的原始分数的不正确关联会产生 0.94的虚假高相关,该值表明两种测量方法共有88%的共同方差(0.94平方)。在更具全国代表性的样本中,这种不适当的相关性为。85, 这表明0.72%的共同方差。然而 准确的结果是0.72 52%的共享方差 相关性,表示的值。 52%的共享方差表明结论与88%的错误报告值有很大不同。尽管单词阅读(Letter-Word ID )和伪单词阅读(Word Attack)测试显着相关(.72),但它们 仅分享约50%的共同方差,这一发现表明它们是相关的量度,但仍能提供阅读过程独特方面的量度.

本文中报告的其余结果均受同一问题的影响,应忽略。我已经为希望查看这些图的用户计算出的W分数和SS相关性发布了散点图( 点击这里)。

  • 汤姆森(D.)&Crewther,S(2006)。讨厌吗?伪单词(非单词)可能是对年轻读者的语音技能的一种误导性衡量。阅读障碍,12,289-299。 (点击这里查看)

抽象 (斜体由博客管理员添加)
  • 伪单词(非单词)阅读任务是跨阅读研究各个领域的语音处理的常用量度。但是,很少有人考虑伪单词阅读是否比年轻单词阅读器提供更多有关语音处理的信息。 在这里,我们显示伪单词和真实单词的阅读是如此紧密相关(r = 0.94) 在学校开学的前四年中,代表同一结构。语音处理的两个子技能,语音意识和快速自动命名也可以预测伪单词和真实单词阅读中几乎相同的变化量。单词和伪单词阅读以及语音意识和快速命名之间的相关性仅在第四年出现,而语音意识和快速自动命名之间的显着相关性仅在上学的第一年才出现。 Ť 但是,这些结果表明,至少在学习阅读的幼儿中,使用假单词阅读来测量语音处理能力或语音意识时应格外小心,因为这可能会误导患有阅读障碍症状的儿童的治疗选择.
Technorati标签: , , , , , , , , , , , ,

供电 表演Firefox