首先了解基本统计知识(大约5分钟),接着选择正确的研究方法进行结果解读;与此同时,了解一些问卷研究的思路使得研究更加顺手。与此同时,掌握一些数据清理的技能更好,比如对异常数据处理。
01. 基础知识
(1)数据类型识别
数据共分为两类,定量和定类数据:
术语说明举例定量数据数字大小具有比较意义您对天猫的满意度情况(非常不满意,比较不满意,中立,比较满意,非常满意)定类数据数字大小代表分类性别(男和女),专业(文科、理科、工科)
(2)P值的意义
p 值是统计学名词,其用于测量数据间的规律情况把握程度。如果p 值小于0.01即说明某件事情的发生至少有99%的把握,如果p 值小于0.05(并且大于0.01)则说明某件事情的发生至少有95%的把握。
研究人员想研究不同性别人群的购买意愿是否有明显的差异,如果对应的p 值小于0.05,则说明呈现出0.05水平的显著性差异,即说明不同性别人群的购买意愿有着明显的差异,而且对此类差异至少有95%的把握,绝大多数研究均希望p 值小于0.05,即说明有影响,有关系,或者有差异等。
(3)量表
量表答项类似于“非常同意”、“同意”、“不一定”、“不同意”、“非常不同意”,也或者“非常满意”、“比较满意”、“中立”、“比较不满意”,“非常不满意”等。大多数统计方法均只能针对量表。量表是一种非常典型的定量数据,当然个别情况时也可以将其看成定类(即认可态度不同的几类群体,但这种时候非常少)。
02. 分析方法选择使用
在确认好数据类型后,接着便可选择正确的研究方法。如下说明:
参考资料:https://spssau.com/helps/basics/concept.html
SPSSAU建议:先描述想研究什么用一句话描述。话里面拆成X和Y:然后结合X与Y的数据类型,选择对应的方法。
比如性别/专业等为定类数据,那么基本情况分析部分,直接使用频数分析即可;
如果数据中有量表态度题,那么基本情况分析时,可计算量表题的平均值,了解样本的平均态度情况;
进一步想深入分析差异关系,如果是定类和定类关系,比如‘性别’和‘是否吸烟’的关系,那么可使用交叉(卡方)分析;如果是定类和定量关系,比如‘性别’和‘身高’的关系,那么可使用方差分析;
进一步想深入分析影响关系,即X对于Y的影响,如果Y是定量数据(比如身高),那么可使用线性回归。如果说Y是定类数据(比如是否愿意购买电影票,购买哪种类型的电影票),那么就需要使用Logit回归分析,比如Y为是否愿意(yes和no两项),那么就使用二元Logit回归,如果是多个类别(比如购买‘爱情类’,‘喜剧类’,‘恐怖类’),那么此时使用多分类Logit回归即可。
如果数据中有量表数据即态度题,那么通常需要使用测量数据的真实性和量表设计的有效性,可使用信度和效度分析。
如果数据中有多选题(多选题是一种特殊的定类数据,其分析应该以‘某个多选题的所有选项作为整体’一次性分析),可使用SPSSAU问卷研究里面的‘多选题’,‘单选-多选’,‘多选-多选’,‘多选-单选’。分别分析多选题各项的选择比例,也或者单选题和多选题的差异关系,也或者多选题和多选题的差异关系,也或者多选题和单选题的差异关系。
03. 问卷思路剖析
问卷思路上一般分成三个部分,分别是基本情况分析,差异关系研究和影响关系研究。
- 首先是对问卷数据做基本的描述分析,结合数据类型,选择使用频数分析,或者描述分析即可;
- 接着研究差异关系情况,结合数据类型选择使用交叉卡方分析,或者方差分析即可;
- 接着研究影响关系情况,即X对于Y的影响,结合Y的数据类型,选择使用线性回归或者Logit回归即可。
参考资料如下:https://spssau.com/helps/basics/framemodule.html
(1)基本情况分析
分析方法:频数分析/描述分析
- 了解样本特征情况,基本认知情况,基本态度情况
- 比如个体基本特征(性别,年龄,学历,专业)等基本分布情况如何;比如对于疫情的认知情况或态度情况如何?
(2)探索规律(差异关系)
分析方法:交叉卡方分析/方差分析
- 深入分析差异情况,找出数据规律
- 比如分析不同性别/学历/专业群体,他们对于疫情认知态度差异情况如何?
(3)探索规律(影响关系)
分析方法:线性回归/Logit回归
- 深入分析更进一步的影响关系情况,找出数据规律
- 比如分析疫情认知态度情况 对 ‘疫情期间是否外出就读’的影响关系情况?
(4)其它
如果数据有量表题,那么可以测量数据的真实性和量表题设计的有效性。(仅针对量表题)
分析方法:信度分析/效度分析
- 探究数据的真实性和量表题设计的有效性
- 比如使用量表题询问‘消费升级’的态度情况,那么回收数据是否真实,且是否真的测量了‘消费升级’这个概念。
04.数据清理技能
数据分析前,有可能需要对数据进行清理,比如某个标题需要修改下,也比如数据中有大篇幅没有填写,也或者很多乱答(都选择同一个答案),那么此时需要做‘无效样本’处理。
与此同时,数据分析的时候,比如想把学历‘小学/初中/高中/大学/研究生’共5个类别,现在想组合成3个类别,分别是‘高中及以下/大学/研究生’,那么此时需要使用数据编码功能。
以上就是本次分享的内容啦。如果你有什么疑难问题,可以在评论区告诉我们。
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。