挖掘你的数据

挖掘你的数据是你可以做的最有价值的事情之一。卷起袖子投入到原始数据中去。对它们进行探索性统计分析,寻找那些不是很明显的模式或趋势,尝试以不同的方式整理和分割你的数据,让自己有足够多的时间及不畏惧尝试新事物或方法,这两点对探察数据来说是很总要的。

    当我们探察数据时,特别探察是比较大的一组数据时,我们首先要做的是确保我们正在处理的数据是整洁的。我们要检查是否有不一致的回答并要剔除极值,同时我们应着手在原始数据的基础上设立一些新的变量。例如,我们可以计算自我报告式问题的前两个最高分和后两个最低分。我们也经常计算多个任务的均值,比如任务成功的总数。我们还可以计算专家绩效的比率及根据不同程度的可接受完成时间对时间数据进行分类。这样,可以设立许多新的变量。事实上,我们最有价值的度量中有许多都来源于数据的探索性分析。