2020-01-15 545

定量研究中的抽样问题(1)- 随机抽样介绍

作者:Ivy Huang

众所周知,定量研究之所以称为定量研究,是因为它是以科学计算为基础的,需要用数学的工具对事物进行数量的分析。定量方法往往是结构化的、客观的、可衡量的、更有科学性的。它往往需要较大的样本量,收集消费者或用户的行为和态度,力求结果的代表性和准确性。

 

 

那么问题来了,如果要较大的样本量来验证,多少为之大?如果我要研究我的用户,我需要访问他们所有人吗?

 

 

很显然,这是不太现实的。且不说是否所有人愿意参加访问,即使所有人都愿意,这也将是一个非常费时费力的工程,尤其是在讲求所有工作高效运转的今天;同时,在某些领域,针对某些特殊人群,让所有符合条件的人群参与访问,也将是巨额成本,显然是不符合最佳投入产出比的。

 

 

所以,我们在做定量研究的时候,必须了解一个词:抽样。

 

 

所谓抽样,就是从我们需要研究的所有目标群体中,按照某种原则,挑选出一定量的样本,用他们的研究结果,代表目标群体整体结果。既然,抽样的目的是通过对一部分被选择的样本来推断总体,就要求我们抽取的样本具有能够代表总体质量特征的性质,也就是抽样的代表性。举个例子,如果我们要研究一个城市男性的平均身高,我们在抽样的时候,可以去抽取这个城市所有男性篮球队员来代表吗?显然是不可以的,因为篮球队员的身高普遍较高,不具有随机代表性。

 

 

 

 

 

为此,我们就要采用合适、合理的,能够使样本更具有代表性特征的抽样方法来抽取样本。

 

 

抽样方法从理论上看,有以下这样的分类方式:

 

 

 

 

随机抽样: 在随机抽样中,总体中的每个个体都有相等的被选中的机会,给了我们最好的机会去创造一个真正代表总体的样本。

 

 

非随机抽样:在非随机抽样中,所有元素被选中的机会都不相等。因此,有一个显著的风险,即最终得到一个不具代表性的样本,它不会产生可推广的结果。

 

 

在此文中,我们先简单介绍随机抽样的几种方式:

 

 

  1. 简单随机抽样:这是一个最随机的方法,每个成员都有被选择的机会,事先不作任何的分组分层,完全凭偶然机会获得样本。它更适合需要调查的整体目标群体数量不算太大,且个体互相之间差异较小的情况;

 

 

 

 

 

  1. 系统抽样:在这种类型的抽样中,第一个个体是随机选择的,其他个体是使用固定的“抽样间隔”选择的。这种方法常用在入户调研中,比如,先随机选择某个小区的第一户人家进行访问,然后按照右手原则(右手边的住户单元),每隔10户再访问一户。这个间隔有多大,可以根据总群体的数量和你要访问的数量来确定。比如这个小区共1000户,你要访问100户,那抽样间距就是1000/100=10;比如下图,就是先随机抽取了3号,然后每间隔3个,抽取1个;

 

 

 

 

 

  1. 分群抽样:在分群抽样中,我们使用总体的子组作为抽样单位,而不是个体。总体被分为子组,称为群,并随机选择一个完整的群作为抽样样本。要用这种抽样方式,一般会要求群组之间尽量同质,而群组内尽量异质。常用的城市区域抽样,就是分群抽样的一种体现。

 

 

 

 

 

  1. 分层抽样:在这种类型的抽样中,我们根据不同的特征,如性别、年龄等,把人口分成子组(称为层)。分层抽样的特点是分成几个排斥的又是穷尽的子组。然后我们从这些子组中选择样本:然后我们从这些子组中选择样本。

 

 

 

 

举个例子:某地有居民20000户,按收入高低进行分类,其中高收入4000户,占20%,中等收入12000户,占60%,低收入4000户,占20%。这种情况下,我们要从中抽取200户进行购买力调查的话,可以分别从这几个层级中按照比例抽取,如下:

 

高收入:200*20%=40(户)

中等收入:200*60%=120(户)

低收入:200*20%=40(户)

 

 

到这里,有关抽样方法中,随机抽样几种常用方式的介绍就结束了。在下一篇中,我们会跟大家另外讲述一下,非随机抽样的主要方式,敬请关注哦~