2020-12-30 1557

群组分析怎么做

作者:Ivy Huang

在定量研究的数据分析中,通常我们除了做总体的分析之外,还会做群组分析。所谓群组分析,就是把整体样本,分成不同的分析组别,然后对比不同组别的数据差异,发现问题的根源所在。

 

 

举个例子,我们做员工满意度调查,发现整体的满意度评分是3.8分(满分5分),不是太高。我们想知道,这个满意度表现,是全体员工都给出了不是太高的评价,还是由某些员工导致的。这时候,就需要用到群组分析。比如,我们区分男性员工和女性员工,或者区分不同部门的员工。我们发现,男性员工的满意度平均分是4.5分,而女性员工的满意度平均分只有3.1分——毫无疑问,整体满意度评分不够好的主要原因,就在于女性员工的不满。这种情况下,我们有的放矢地去研究女性员工不满的原因,就可以更好地运用到接下去的公司管理策略调整上来。

 

 

那么,群组分析要怎么做呢?

 

 

 

 

首先,我们需要知道哪些群组需要进行差异分析。

 

 

因为,被定下来要进行差异分析的群组,我们需要确保其有不低于最低要求的样本量进行分析(至少50个)。确定了要分析哪些群组,我们才可以在收集样本的过程中,跟进各个被分析群组收集到的样本量情况。

 

 

每一个整体,都会有不同的群组切割方式。我们在思考哪些群组要进行差异分析时,需要有一些预判。比如,你觉得某个分析结果,可能某些群组之间会有不同;又比如,你需要分开特定群组,去看研究结果,以使后续有各不一样的应对策略。想清楚这些,才能锁定必要的群组分割。

 

 

我们要提前确定哪些群组要进行差异性分析的另一个原因,是大部分情况下,收集样本是需要成本的,如果需要确保每个群组有足够样本量,那么成本肯定会上升。所以,需要有的放矢,聚焦更加重要的群组。

 

 

其次,在清洗得到最终数据之后,我们要制作群组数据对比表格。

 

 

比较有效率的方法是,通过SPSS的数据分析功能,区分群组变量,直接跑出数据对比表格。如果您不懂SPSS,也可以通过问卷网收集数据,在数据分析阶段,通过数据报表页“交叉分析”的功能,看到群组差异,并可以导出相关的数据表和图表。具体操作参考如下:

 

 

 

 

 

 

 

 

最后,在确保每个群组样本量不低于50,可以被分析的情况下,什么样的差异才算是差异呢?相差多少才具有统计学意义呢?

 

 

显著性差异其实有一套科学的计算方法,但是作为不是学统计学的朋友来说,还是略显复杂,即使看了计算公式,也不一定明白原理,也不一定能亲自操作计算。所以,我们这里给出一套经验值的参考(基于95%置信区间):

 

 

 

 

上图表格的意思,举个例子,就是如果你的对比群组,样本在50左右,那么,两个组别的数据,必须达到8%的差异,才是显著差异,才能说是真的有差异;低于8%,都不能代表他们有显著的差异,以此类推。

 

 

所以,我们就需要避免,看到任何数据差异都下结论说群组有差异的做法,可以对照上表,让自己的判断更为准确。