2020-01-15 977 87

定量研究中的抽样问题（1）- 随机抽样介绍

作者：Ivy Huang

众所周知，定量研究之所以称为定量研究，是因为它是以科学计算为基础的，需要用数学的工具对事物进行数量的分析。定量方法往往是结构化的、客观的、可衡量的、更有科学性的。它往往需要较大的样本量，收集消费者或用户的行为和态度，力求结果的代表性和准确性。

那么问题来了，如果要较大的样本量来验证，多少为之大？如果我要研究我的用户，我需要访问他们所有人吗？

很显然，这是不太现实的。且不说是否所有人愿意参加访问，即使所有人都愿意，这也将是一个非常费时费力的工程，尤其是在讲求所有工作高效运转的今天；同时，在某些领域，针对某些特殊人群，让所有符合条件的人群参与访问，也将是巨额成本，显然是不符合最佳投入产出比的。

所以，我们在做定量研究的时候，必须了解一个词：抽样。

所谓抽样，就是从我们需要研究的所有目标群体中，按照某种原则，挑选出一定量的样本，用他们的研究结果，代表目标群体整体结果。既然，抽样的目的是通过对一部分被选择的样本来推断总体，就要求我们抽取的样本具有能够代表总体质量特征的性质，也就是抽样的代表性。举个例子，如果我们要研究一个城市男性的平均身高，我们在抽样的时候，可以去抽取这个城市所有男性篮球队员来代表吗？显然是不可以的，因为篮球队员的身高普遍较高，不具有随机代表性。

为此，我们就要采用合适、合理的，能够使样本更具有代表性特征的抽样方法来抽取样本。

抽样方法从理论上看，有以下这样的分类方式：

随机抽样：在随机抽样中，总体中的每个个体都有相等的被选中的机会，给了我们最好的机会去创造一个真正代表总体的样本。

非随机抽样：在非随机抽样中，所有元素被选中的机会都不相等。因此，有一个显著的风险，即最终得到一个不具代表性的样本，它不会产生可推广的结果。

在此文中，我们先简单介绍随机抽样的几种方式：

简单随机抽样：这是一个最随机的方法，每个成员都有被选择的机会，事先不作任何的分组分层，完全凭偶然机会获得样本。它更适合需要调查的整体目标群体数量不算太大，且个体互相之间差异较小的情况；

系统抽样：在这种类型的抽样中，第一个个体是随机选择的，其他个体是使用固定的“抽样间隔”选择的。这种方法常用在入户调研中，比如，先随机选择某个小区的第一户人家进行访问，然后按照右手原则（右手边的住户单元），每隔10户再访问一户。这个间隔有多大，可以根据总群体的数量和你要访问的数量来确定。比如这个小区共1000户，你要访问100户，那抽样间距就是1000/100=10；比如下图，就是先随机抽取了3号，然后每间隔3个，抽取1个；

分群抽样：在分群抽样中，我们使用总体的子组作为抽样单位，而不是个体。总体被分为子组，称为群，并随机选择一个完整的群作为抽样样本。要用这种抽样方式，一般会要求群组之间尽量同质，而群组内尽量异质。常用的城市区域抽样，就是分群抽样的一种体现。

分层抽样：在这种类型的抽样中，我们根据不同的特征，如性别、年龄等，把人口分成子组(称为层)。分层抽样的特点是分成几个排斥的又是穷尽的子组。然后我们从这些子组中选择样本:然后我们从这些子组中选择样本。

举个例子：某地有居民20000户，按收入高低进行分类，其中高收入4000户，占20%，中等收入12000户，占60%，低收入4000户，占20%。这种情况下，我们要从中抽取200户进行购买力调查的话，可以分别从这几个层级中按照比例抽取，如下：

高收入：200*20%=40（户）

中等收入：200*60%=120（户）

低收入：200*20%=40（户）

到这里，有关抽样方法中，随机抽样几种常用方式的介绍就结束了。在下一篇中，我们会跟大家另外讲述一下，非随机抽样的主要方式，敬请关注哦~

文章不错

定量研究中的抽样问题（1）- 随机抽样介绍

作者：Ivy Huang

热门文章