摘要
本文介绍分析了定性研究样本量设定的国际惯例和基本理论,试图从众说纷纭中找到相对统一的理论和概念。通过厘清定性研究与定量研究不同的目的、特点和逻辑,找到定性研究样本量设定的基本原则,为汽车市场研究实践提供有效的依据。同时结合实践经验,给出在实际操作中的参考样本量以及需要考虑的因素。
关键词:定性研究,样本量,汽车市场研究,
一、序言:定性样本量的迷思
近年来,汽车市场研究中越来越多地应用到定性的方法。来。定性方法能够更加深入和准确地抓住消费者的真实特点和行为背后的真实原因,相对定量方法而言有其突出的优势。如果说定量研究解决“是什么”的问题,那么定性研究解决的是“为什么”的问题。尤其在大数据时代,定量的抽样调查面临挑战,而定性研究的优势更加凸显出来。因此,汽车市场研究中定性方法的应用越来越常见。有的是与定量方法匹配使用,有的则是单纯依靠定性研究。但是,样本量的问题也越来越多地困扰着研究人员。从汽车市场研究的项目来看,有的只做几场FGD(焦点小组)或十几个深访,有的则动辄两三百个深访。那么,在定性研究中,究竟做多少个样本量才足够?定性调查究竟该怎样设定样本量才能够达到研究精度与时间、金钱成本的最优组合效果?究竟有没有一个万能的公式,就像定量调查测算不同置信区间下的样本量一样,来给出具有说服力的解释?
二、定性研究的概念及与定量的区别
要解决这个问题,我们有必要先来看一下什么是定性研究以及定性研究和定量研究的区别。
定性研究(qualitative analysis),是以研究者本人作为研究工具,在自然情境下采用多种资料收集方法对社会现象进行整体性研究,使用归纳法分析资料和形成理论,通过与研究对象互动对其行为和意义构建获得解释性的一种活动。(陈向明,2001)从陈向明的定义可以看出,定性研究一般情况下使用归纳法的思维逻辑,注重于研究对象的互动以解释现象的因果关系等。而定量研究(quantitative analysis),则是一种对事物可以量化的部分进行测量和分析,以检验研究者自己关于该事物的某些理论假设的研究方法。
定性研究和定量研究在诸多方面存在本质的不同。(具体见图1)
图1-定量、定性研究的比较[1]
比较维度 |
定性研究 |
定量研究 |
问题的类型 |
探测性 |
有限的探测性 |
样本规模 |
较小 |
较大 |
执行人员 |
需要特殊的技巧 |
不需太多特殊技巧 |
分析类型 |
主观性的、解释性的 |
统计性的、摘要性的 |
重复操作的能力 |
较低 |
较高 |
研究的类型 |
试探性的 |
说明性的、因果性的 |
可以看出,定性研究对研究人员的要求更高,探测性更强,而且分析类型本身就是主观性的和解释性的。与定量相比,它是一个开放的过程,研究和分析就在调查的过程当中进行。同时把人当作一个完整的、社会的人来进行研究,较定量研究更加深入和生动。同时,由于这种研究的复杂性,定性研究的样本量是相对较小的。这在汽车市场研究界也得到了一致的认可。但是,样本量要小到什么样的程度呢?我们试图从学术界来寻找答案。
我们发现,样本量的问题在社会科学界也同样困扰着学者们。在当今不少社科研究领域的专家同样面临挑战:是否有必要按照定量研究的基本法则来设定定性研究的基本标准?是否需要探究研究的个案是不是具有“代表性”(representative)、自己的研究能不能概括其他相似个案的情况(generalized)的问题?定性研究的学者在代表性问题的态度上出现了两种极端。一种是受定量思维的影响,他们使用了一些定量的术语来迎合定量研究者的口味,甚至主张强化定性研究的“信度”和“效度”。另一种就是认为“定性研究不需要解决外推的问题”,将实际操作中确实存在的问题回避掉了。
三、理论之一:定性研究与定量研究有不同的逻辑,不能用定量的思维来要求定性研究,“定性研究的代表性”本身就是一个伪命题
芝加哥大学的Mario Small教授看到了定性研究者在努力让自己的研究能够代表总体的过程中存在的诸多问题。比如:足够友好来接受一个陌生人邀请的人,他们可能和别的人群有不同的看法;定性研究中牵涉了复杂的因果关系和许多待研究的变量,要推断总体中这些变量的相关机制可能需要的是比定量研究更大样本的调查研究(survey),深度访谈本身的样本量肯定是不足够的。
Mario Small教授认为在定性研究法上强加“代表性”的评判准则本身就是错误的。为此,他探讨了定性研究和定量研究的不同逻辑,澄清了两个概念:
“统计显著性”与“社会显著性”。他认为定性研究“见微知著“地探知到更广的社会结构对其的影响。探究的不是“统计显著性” (即带有相似特征的总体的特征),而是“社会显著性”,即这个个案中告诉了我们多少有关社会结构的信息。研究者可以通过使用特殊或极端个案来验证既往理论。个案研究并不能告诉我们某个个案是不是能够在统计上代表总体。举例来说:我们无法在个案研究中逻辑推断出“所有和A组织处于同一类别的组织都有a特征”,但是定性研究能帮助我们了解“在X情况下,Y现象是否出现和W因素有关”。
“抽样逻辑”与“个案逻辑”。在抽样逻辑中,样本数是能通过计算预先设定的,样本要有统计代表性,所有个体都有等可能被抽中,所有的被访者可能都面对的是同一份标准化问卷。如果研究过程被严格执行,我们能从样本特征中推断出总体特征。当然,这也是在一定的抽样误差范围中。这种研究的目的是要确保样本在某一特征上的分布和总体分布大致相似。而个案逻辑却全然不同。在这种逻辑中,每一个个案都能帮助我们一点点,一步步更准确了解我们的研究问题。在这种逻辑中,我们不到研究结束是不能够确定我们所需要的个案数量的。个体不需要有代表性,其被抽中的概率也不需要一样。与定量调查不同,在定性研究中不同的被访者或许会被问到不同的问题。前一个个案中的结果会帮助我们提出在下一个个案中我们所要问的问题。所以说定性的访谈是“序贯访谈”,也就是有时间顺序的访谈法。我们所要达到的目标就是“饱和”(saturation),即对于某一个问题有全面的了解。
Mario Small教授的观点在业界引起了广泛的共鸣。国内的潘绥铭教授也持同样的观点。他认为定性调查与定量调查在“代表性” 上的区别,并不是“能够在多大程度上代表”,而是“究竟要去代表什么”。潘教授认为,定性调查希望代表的是“与研究主题相关的所有潜在信息”,而不是定量调查中的“总体中的所有个体”。也就是说,定性调查所代表的是研究主题之内的差异性的相对穷尽与其质性特征的归纳,而不是定量调查中样本与总体之间人口社会特征的分布的匹配。所以在定性调查中,不是调查多少人才能达到量的要求,而是调查到的信息多么丰富才足以反映出调查目标的质。定性调查绝对不是因为做不到才不去抽样的,而是因为两者的目标不一样。定量调查中那些寻求“推断总体总量或总体均值”的随机抽样方法,对于意在“收集研究主题相关的所有潜在信息” 这一定性调查的目标来说,不仅不适用,往往会适得其反。
潘教授认为,凡是使用或者试图使用随机抽样方法的调查,都不是定性调查,而仅仅是开放式问卷调查。说到底,定性调查的目标是要反映研究主题相关的最多信息的整体质性,而不是要去代表调查到的那些对象,更不是其总体。因此,定性调查根本就不应该使用“代表性” 这样的定量调查的专有术语,而是应该申明自己所追求与所获得的是“最大差异的信息饱和” 的程度,以及由此获得的“研究主题的归纳程度”。
四、理论之二:“信息饱和原则”是定性研究样本量的设定的基本原则,具体可以参照“求异法”
那么,回到我们最初的问题上来。定性调查中究竟应该如何选择调查对象,选择多少个调查对象才是足够的?潘绥铭教授认为:“调查了多少个人毫无意义,唯一的价值在于最终发现了多少种不同的情况。它们之间的差异越多越好,越大越好。到没有新的信息出现的时候,调查就终止了。”即一般所说的“求异法”。
“求异法”的一般操作程序:(1)按照研究者自己的调查主题,确立对象选择的起点,选定第一人进行访谈;(2)应用持续对比分析法(CCM)梳理从第一人得到的信息的指向与信息的充分程度;(3)根据梳理结果,衡量信息饱和程度,确立新的“理论抽样”标准,选择最可能(最大差异法)提供不同指向或者更加充分信息的第二人;(4)从第二人起,反复进行上述的梳理。如果信息仍未饱和,则继续调查第三人、第四人,依此类推;(5)在任何一个被访者那里,如果不再有新的信息,则理论上调查到此为止。(6)为了保险起见,研究者不妨再多访谈一个或者多个对象,如果确信再无新信息,即可终止调查;否则就继续调查下去。[2]
这就是定性调查的“信息饱和原则”。有国内学者描述为“理论饱和”,即穷尽了某类现象的所有相关属性和维度。在这里,个案成为理论或理论命题得以抽象出来的载体。而能够承担开发某种理论的功能的个案,就具有了“典型性”。斯特劳斯和科宾所说的“概念的代表性”,以及扎根理论所说的“理论抽样”都是同样的意思。也就是说,不能用“样本量” 的概念来评价定性研究的效果,只能衡量它所获得的信息是否已经饱和。而信息是否饱和的标准,要从被访者和研究者两个角度来衡量。从被访者的角度,他已经把话说完,或者已经无可表述。从研究者的角度,他(她)认定所获得信息已经足够分析自己的研究目标,那么就是信息饱和了。
在被访者的选择上,潘教授建议用“信息量最大法”选择第一人,用某些社会特征上的“差异最大法”选择第二人。如果研究中发现第二人与第一人的信息并不存在显著的差异,则需要重新选择划分的社会特征,依然按照差异最大法来选择第三人。定性调查在选择对象的时候,唯一的标准是对方的“信息最丰富”,而不是定量调查中那种“样本的特征与总体相匹配”。定性调查选择对象的理想状态是实现“最大差异的信息的饱和”,而不是定量调查中的实现随机性。
五、汽车市场研究中的实践和经验性探索
“信息饱和原则”的要点是说,定性研究没有,也不需要任何确定不变的“样本量”,也许一个人就足矣,也许一百个人还不够。 研究者事先根本无法知道要调查多少人,至多根据经验来估计。但是,这对于商业性的汽车市场研究而言,显然不具可操作性。商业性项目一般提前都有明确的预算和研究时间的界定。这种“边做边看”的方式可能更适合于科研项目。市场研究更看重可操作性和可重复性,需要有更详细的经验值来告诉研究人员和客户方,究竟被访者达到多少个,才能实现信息的饱和。这就需要从业者从实践当中不断总结和发现规律。
在汽车市场研究的实践当中,影响定性研究样本量的因素还有很多,比如研究目标的明确性、调研的性质、调查对象的类型、总体指标的变异程度、调研的精度、项目经费和时间要求等。此外,还有重要的一项:定性研究是单独使用还是和定量匹配使用;如果是匹配使用,是用在项目的什么阶段。如果是单独使用,一般要收集的信息就要多一些,可以多访谈一些被访者,直到研究者有足够的把握信息已经饱和再终止调查。如果是匹配使用,则收集的信息相对少一些,研究者对所研究的问题形成了基本印象,得到了基本假设即可。总之,需要对所研究的问题做最大化的区隔,保证每个区隔能够形成假设或结论。此外还要考虑所涉及领域的熟悉度和项目成熟度:是新领域或不熟悉的项目,就需要多设计样本量。
笔者曾经对中国农村的汽车市场进行研究。由于这个研究在汽车界较为超前,这个领域相对复杂和陌生,就使用了定性研究和定量研究匹配的方法。研究的前期进行探索性的定性研究,帮助定量问卷开发、担当定量问卷的试调查工具、形成初步的研究假说。后期进行验证性的定性研究,为定量调查揭示出来的问题寻找深入的答案。
图2-定性研究与定量研究的匹配
以前期的定性研究为例,笔者从地理位置、地区富裕程度、家庭富裕程度、有车无车四个维度进行了考虑,最终选取了4个城市,做了16个深访样本。事实证明,这个设计得到了很好的效果。
图3-探索性定性研究样本的选取和设定
对于市场研究行业的新手和想要更多参考的人来说,也有相关的数据给你更多的信息。比如,有研究人员通过“无提示品牌知名度”进行了多次结果的比较。他们以一项调查项目的总样本数(4450样本)为母体样本,从中分别随机抽取5样本,10样本,20样本,30样本,50样本,80样本,100样本,200样本,300样本来比较其结果,为了充分了解每种样本量的抽样结果,每种样本量重复抽取30次。最终发现,5样本的调查仅能拿到一半的答案,10样本获得七成的答案,15样本可得到80%的答案,而30样本是拐点,在得到90%的答案后,再增加样本量对答案获得率的帮助不大。
图4-不同样本量下的答案获得率
也就是说,定性研究最低需要15个样本或2组座谈会(8人组)的量,才能获得大部分的答案并覆盖到主要的答案。如果需要对比研究细分群体,则每个细分群体也应该最少是2组座谈会方可保证效果。
业内也流传着一种说法:定性和定量分析的样本量分野是32 (刚好是4组座谈会的量)。虽然这些说法在学术上也不够严谨,但确实能够给毫无经验者一些参考。
六、结束语
对于汽车市场研究的从业者来说,学术界关于定性研究样本量的研究结论,给我们提供了很好的依据。正如文中所说,定性研究要追求的是“社会显著性”而非“统计显著性”;追求的是得到了多少信息,而非调查多少人。我们可以根据“信息饱和”原则确定我们所做的研究是否已经足够达到目标,也可以用来说服一味贪图大样本量的客户,避免不必要的资金和时间的浪费。避免出现动辄做几百个深访的情况。同时,“个案逻辑”而非“抽样逻辑”也提醒汽车市场研究的从业人员,我们所做的定性工作是边收集信息边分析,而不是像定量一样,做完全部样本才开始分析。这就涉及到“即时分析”的问题。笔者将会专门撰文进行探讨。
参考文献:
1 [美]小卡尔·麦克丹尼尔,罗杰·盖兹:当代市场调研,机械工业出版社,原书第四版
2 潘绥铭、姚星亮、黄盈盈:论定性调查的人数问题. [J]社会学研究,2010(4)
3 徐晟韬:如何合理选择抽样样本数,机构研究
4 杨善华,孙飞宇:作为意义探究的深度访谈. [J] 社会学研究,2005(5)
5 卢晖临,李雪:如何走出个案——从个案研究到扩展个案研究,[J]中国社会科学2007(1)
6 王宁:个案研究的代表性问题与抽样逻辑,[J]甘肃社会科学2007(5)
7 Small, Mario L. 2009. “‘How Many Cases Do I Need?’ On Science and the Logic of Case Selection in Field Based Research.” Ethnography. 10(1)
注:本文发表于《汽车工业研究》2015年第4期(总第251期)研究版块