理论教育 数据收集调查:如何保障个人信息安全?

数据收集调查:如何保障个人信息安全?

时间:2023-05-25 理论教育 版权反馈
【摘要】:要求调查对象根据自身实际情况进行填写,并且要明确提出对个人信息保密。

数据收集调查:如何保障个人信息安全?

1.问卷设计

问卷的基本要素包括卷首语及主要问题两部分。

(1)卷首语包括以下几项:

① 简单的问卷实施者介绍,包括问卷实施者的身份、问卷指向的主要问题以及对问卷用途的说明。要求调查对象根据自身实际情况进行填写,并且要明确提出对个人信息保密。

② 明确的调查目的说明。调查目的说明是取信调查对象必不可少的环节,主要是向调查对象指明你调查的内容、需要,阐明基于学术研究的目的,需要针对调查对象的哪些行为进行调查,同时告知研究的意义。

③ 问卷的反馈及整理。问卷发放之后是需要回收的,因此必须交代问卷的回收方法以及答题的方式,甚至设置答题的范例,以便答题人更好地理解问题,从而降低答题的错误率及无效问卷的产生。

④ 被调查对象的基本信息,即基于问卷设计必须了解的被调查人的一些基本信息,诸如被调查对象的性别、年龄、教育水平等信息。

(2)问卷的主要问题:在问题设计上,可以分为开放式问题和封闭式问题两种类型。

① 封闭式问题,即答案已经被研究者提前做好,这些答案可以不止一个,且答案之间不一定是排斥关系,可以进行多项选择,但是被调查对象只能在已有选项中选择最符合自身实际情况和想法的选项。具体包括以下两种类型:一是排斥性问题,即非此即彼的问题,比如同意与否、男女性别等;二是程度性问题或者等级性问题。

② 开放式问题,即研究者只设计问题,并不提供答案以供选择,这种问题能够清楚地反映及测量答题人的真实想法。

为了设计出合理的调查问卷,笔者于2017年1月对消费者在社交网络上的信任程度与购买意向展开了深入研究,查阅了众多文献资料,并与部分社交网络服务网站的从业者进行了细致访谈。设计出试调查问卷后,对问卷进行了预测试,预测试的调查对象为20名微信平台的业内人士和成都理工大学管理科学学院的5位教授。通过检查问卷中问题的含义是否明确、措辞是否精准、概念是否可量化等指标,调整并确定最终的问卷内容。基于以上问卷的设计结构及原则,调查了网络首页的设计因素在消费者购买决策、购买心理中所起的作用。具体问卷详见附录1。

2.调研程序和样本量

(1)明确研究对象。通过随机调查、网络问卷、文献分析的方法,找到人们现在最常用的社交网络平台。

(2)预调查。通过专家访谈,选取常见社交网络服务平台的业内专家进行访谈,通过预调查检验问卷的普遍性问题;选取成都理工大学管理科学学院的相关教授进行访谈,征求他们的意见和建议,调整问卷设计。最后结合两方面的反馈,对问卷进行优化,确立了探索性研究调查使用的问卷。

(3)探索性研究。调查通过两种方式进行:一方面,笔者将网上问卷的链接地址放到自己及朋友的朋友圈里,并通过转发的形式增加样本量;另一方面,在学校及周边进行了现场人工发放与现场填写,通过系统抽样对被访者进行调查。调查结束后及时回收有效问卷,并验证指标的有效性和可靠性,并检验进一步使用的可行性,最终确定模型中各变量彼此间的关系。本研究在对象选取上以社交网络平台中活跃的年轻人为主,同时通过其他参与人群的调查研究,使得结论具有普适性,即适用于所有网络平台的使用者。

(4)正式研究。正式研究是普遍适用性研究,笔者选择扩大问卷数量和受访人群的方法,对它们分别进行调查,并按照原则对受访者进行了甄别。采取系统抽样的方式访问受访者,通过数据分析确定研究结论的普遍意义。

(5)关于样本量。利用因子分析、结构方程分析对样本总量进行分析时,得到了以下几点认识:Nunnally et al(1978)的研究被大家经常引用的原因是,被试人数是变量的10倍。Boomsma(1982)在研究中表明,样本量(N)越大,模型成立的百分率、参数的精确性、统计量的分布越好,并建议样本量不能少于100个,以200个以上为佳。根据牛永革(2007)的研究,本问卷共有24个题目,样本量至少为240个。本研究的问卷共有36个问题。为了获得更好的分析效果,考虑到有一定的废卷率,本研究把第一次探索性的样本量设计为220个,第二次的正式研究样本量设计为800个。

3.样本选择

在问卷预调研的基础上对问卷进行修改完善,然后确定本研究的样本容量,即如何通过有效的抽样方式,获取能够代表、反映真实情况的样本,以期获得有效的调查数据。在样本抽取方式中,最简单和最方便的抽样方式就是简单随机抽样,但是要对所有样本进行编排,所以简单随机抽样并不适合样本容量较大的抽样。本研究的样本范围是全国性的,简单随机的方法并不适合,因此,需要选择随机抽样法。由于样本容量在实践中被影响的可能性较大,能够对其产生影响的因素也较多,因此,在实际抽选过程中需要综合考量。影响样本容量的因素主要有以下几个方面:样本的总体规模、样本之间的异质性、样本精度的需求、抽样的方法、抽样的控制及问卷的回收、研究者的能力、财力、人力等。对于调查结果的把握,往往用置信水平或置信度来衡量。如果要求置信度大于5%,则误差率不能超过5%。在条件一致的情况下,置信度越高,调查结果越需要较大的样本容量。换句话说,误差水平要求越低,需要的样本容量就越大。(www.daowen.com)

4.样本调查

在对问卷信度及效度进行分析、检验的基础上,根据调查对象的反馈情况以及预测相关情况的分析,针对问卷中的问题设置及选项的合理性进行了微调,形成了最终测试问卷,并以此来提高所采集数据在实证分析中的科学性、有效性和可信性。问卷的发放采用网络转发、现场人工发放、现场填写等方式进行。

本次问卷测量选取的对象主要为在社交网络上消费的年轻人,且均具有网购经验,主要调查其在食品、服装、日常用具、学习书籍等方面的消费倾向。实验共分两次进行,第一次于2017年5月进行,共发放问卷220份,作为探索性研究。一方面,笔者将网上问卷的链接地址放到自己及朋友的朋友圈里,并通过转发的形式增加样本量;另一方面,研究者在学校及周边进行了现场人工发放与现场填写;7天以后回收有效问卷193份,回收率87.72%,符合一般问卷回收率的要求。

第二次问卷调查实践扩大了问卷数量和受访人群,于2018年7月进行,共发放问卷800份,作为普适性的正式研究。一方面,调研问卷通过微信朋友圈论坛、群组等进行了推广,而且受访者自愿参与调查。通过发放红包、微信红包抽奖等方式,吸引更多的受访者参与,并转发分享给其他好友,使得调查人数充分、受众范围扩大。为避免重复统计,笔者将IP地址逐一比对,进行数据初步筛查。另一方面,将调研问卷放在地铁口、购物街、公司厂区里,以便进行现场人工发放与现场填写。经过35天的实地调查,最终完成问卷人数为789人。对之前预调查时的20人的完成情况进行反馈总结时发现,一份问卷要认真完成最少需要5分钟的填写时间,因此对完成时间不足5分钟的问卷视为无效,并从总问卷中剔除。最终,得到项目有效问卷698份,回收率达到87.25%,符合一般问卷的调查要求。

通过两组问卷可以保证实验结果的一般适用性,并对两组实验结果的偏差进行了深入分析。同时,采用信度分析了问卷测量的可信度,即测量的一致性、可靠性,也就是同一测试样本在多次参与该测试时产生的测试结果是否具有一致性。这种一致性的测量方法包括两种:折半信度,Cronbach’s α系数。本研究采用Cronbach’ s α系数来验证一致性。这种方法在大多数情况下用于同质性试验,即通过系数来衡量因子之间是否具有相同或者相似的特征,系数越高,信度越高。根据Guielford(1995)曾提出的理论观点,若信度系数处于0.7~1.0,信度较好;信度系数在0.35~0.7,表示信度一般;当信度系数小于0.35时,表示信度极低。

5.样本的基本信息

(1)探索性研究样本概况。本次抽样主要根据我国网民的性别、学历、年龄、收入等因素进行。探索性研究问卷实验共发放了220份问卷,其中有效问卷为193份。根据基本情况进行简单的统计分析,具体情况见表4-5。

表4-5 探索性研究问卷描述性统计表(N=193)

续表

从问卷描述性统计表可以看出,本研究的抽样方法及获取的样本均较为合理且有效。在抽样性别的比例上,男性网民多于女性网民,与我国网民性别男性多于女性的现实也是一致的。在学历水平上,基于熟练应用网络的现实需要,专科及以上学历的网民占比达91.71%,符合网络应用需要的高学历的现实基础。从年龄来看,以18岁至30岁的人群为主,以符合使用社交网络服务的人群趋于年轻化的现实。在收入方面,以1000元以下的低收入群体为主,符合其中大部分仍然处于学生阶段的现实。综上所述,本研究的样本分布广、代表性强,能够有效减少抽样单一带来的误差,对于论证本研究的观点具有积极意义。

(2)普适性的正式研究样本概况。正式研究调查共发放了800份调查问卷,其中有效问卷为698份。根据基本情况进行简单的统计分析,具体情况见表4-6。

表4-6 正式研究问卷描述性统计表(N=698)

续表

从问卷描述性统计表可以看出,本研究的抽样方法及获取的样本均较为合理并有效,但与第一次探索性调研实验的样本情况是有区别的。在抽样性别的比例上,与第一次探索性调研实验的样本相似,男性网民多于女性网民,与我国网民性别男性多于女性的现实一致。在学历水平上,正式调研问卷实验的人群扩大后,被调查人员来自社会的各行各业,学历占比与探索性研究问卷调查有所差别,但这也符合社会人群的学历分布。从年龄来看,仍然以18岁到35岁的人群为主,符合使用社交网络服务的人群趋于年轻化的现实。在收入方面,与探索性研究问卷的调查人群主要以1 000元以下的大学生群体为主有所不同,正式研究问卷实验时将人群扩大为社会人群,收入以1 000-5 000为主。综上所述,通过正式研究问卷实验后,本研究的样本分布更广、代表性更强,能够有效减少抽样单一带来的误差,对于论证本研究的观点具有积极意义。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈