挖掘你的数据

挖掘你的数据是你可以做的最有价值的事情之一。卷起袖子投入到原始数据中去。对它们进行探索性统计分析,寻找那些不是很明显的模式趋势,尝试以不同的方式整理和分割你的数据,让自己有足够多的时间及不畏惧尝试新事物或方法,这两点对探察数据来说是很总要的。

    当我们探察数据时,特别探察是比较大的一组数据时,我们首先要做的是确保我们正在处理的数据是整洁的。我们要检查是否有不一致的回答并要剔除极值,同时我们应着手在原始数据的基础上设立一些新的变量。例如,我们可以计算自我报告式问题的前两个最高分和后两个最低分。我们也经常计算多个任务的均值,比如任务成功的总数。我们还可以计算专家绩效的比率及根据不同程度的可接受完成时间对时间数据进行分类。这样,可以设立许多新的变量。事实上,我们最有价值的度量中有许多都来源于数据的探索性分析。

    你不必总是必须具有创造性。我们经常做的一件事是进行基本的描述性和探索性统计。在统计工具如SPSS甚至excel中,这是很容易操作的。通过进行一些基本的统计,很快就能看到数据所呈现出来的大趋势。

    也可以尝试用不同的方式呈现你的数据。例如,使用不同类型的散点图和回归线图,甚至还可以用不同类型的棒图。即使你从来没有用过这些图,它也会有助于你对所发生的事情有一个感性的认识。

    不要仅仅拘泥于你的数据。尝试揉入一些其他来源(可以证实你的观点或甚至与你的观点有冲突,均可)的数据。从其他几个来源揉入的数据越多,就越有助于增加你图表上数据的可信度。当一组以上的数据都表明同一个事情之后,执行一个数百万美元的再设计项目时就要容易得多。可以把看一下数据看作众多难题中的一个,难题越多,就越容易将其拼凑在一块,从而获得整个事情的概貌。

    我们无法充分地强调以第一手的方式查看你的数据所带来的价值。如果你与供应商或“拥有数据”的商业资助者一起工作,可以寻找新的数据。封装后的图标和统计很少能表明整个事情的情况。它们通常充满了问题。对于表面数值,我们获得不了任何总结性的数据;我们需要亲眼查看所发生的事情。

分类目录: 建站教程 | 标签: 挖掘  数据   | 评论:0
上一篇: 不要误用度量
下一篇: 基于问题的度量需注意的几点