2009年3月2日,星期一

量子角:处理(并计划)数据收集中的丢失数据

自从我发表一篇文章以来,已经有很长时间了,我的文章可能会调整阅读此博客的类固醇的鸟蛤。这是我的定量研究人员的目标,也适合那些定量研究较少的人员,因为该主题将在研究文章,测试手册等中更经常地提及。

缺失数据 几十年来一直困扰着研究人员和测试开发人员的问题。在过去的20年中,已经出现了非常复杂的方法来处理丢失的数据并通过复杂的统计算法生成“完整”的数据集。还有……许多运行数据的人可能已经使用了这些步骤,并且完全不知道他们的分析使用了估算值或合理值!例如,如果您使用主 结构方程模型(SEM) 软件程序(例如LISREL,Mplus,AMOS),并且您在某些主题上的数据不完整,这些程序很可能在运行SEM模型之前利用这些新算法之一来估算可能的值。

在过去的15年中,我一直在学习这些文献,并发现这些当代的缺失数据归类方法非常有用。越来越多的研究人员需要意识到这些方法的好处,以及正确使用它的一些细微差别。

过去一周,我收到了最新一期的 心理学年度回顾 并发现(令我高兴)这是统计领域最简单,最容易理解的摘要。我并不惊讶地看到它是由 约翰·格雷厄姆,他还为此主题撰写了许多其他重要的期刊文章。我敦促读者 智商角 谁进行应用研究或测试开发项目以阅读本文 概述文章。值得一读。另外,我建议读者认真看一下 Schaefer的NORM软件...当需要进行严重数据插补时使用的程序。有关该程序的详细说明,以及对一些缺失数据文献的简短概述,请参见 达玛万(2004).

真正酷的是 “计划的丢失数据”-----也就是说,设计一个数据收集项目以故意丢失数据,以便允许在更多的主题中收集更多的变量...然后可以通过这些对象进行处理(如果设计正确)新的类玩具。

同行(及未来)类固醇...享受

Technorati标签: , , , , , , , , , ,

没有评论: