当我们在回收问卷时,总会遇到与我们需要调研人群不匹配的用户,或者乱答的用户。所以为了让结果更准确,分析之前需要将这些“脏”样本进行清洗。
常见的“脏”样本类型:
(1)非目标样本
(2)重复回答
(3)前后矛盾
(4)作答时间过长或过短
数据清洗顺序:
当我们的产品是针对60+的人群设计的,如果用户的年龄不在这个范围,可能就不具有参考价值。所以在设计问卷时,可以将非目标样本直接设置为无效答卷。
【非目标样本的无效问卷】设置:设置完成后,一旦用户的年龄不在60岁以上,系统会自动将该样本归类到“无效样本”中。(设置方式请点击此处查看)
用户可能会重复回答一份问卷,多份一样的问卷对于后续的分析没有意义,所以在发放问卷之前,可以设置【作答次数限制】,确保一个用户只作答一次。
【作答次数限制】设置:可以根据需要,设置作答设备/IP地址/微信作答控制。(设置方式请点击此处查看)
前后矛盾的作答情况有以下这些:
(1)内容矛盾:购买过XX品牌但不知道XX品牌。在问卷编辑时,可以通过【选项引用】,只给用户展示需要勾选的选项。
【选项引用】设置:用户在Q1选择了品牌3、品牌4、品牌5,Q2的选项只会展示这三个品牌。
(2)人口属性矛盾:年龄选择18岁以下,但是驾龄选择7-16年。这种可以在回收完问卷后,通过筛选条件,批量将这些问卷标记为无效问卷。
【批量标为无效】设置:通过筛选条件(年龄时18岁以下,驾龄是0-6年/7-16年/16年以上)将符合条件的问卷筛选出来,然后批量将这些问卷标为无效。
当用户作答时间过长或过短时,可能都会造成数据的不准确。过长说明作答时可能有被干扰,数据质量不好评估;过短说明作答时可能不认真。
【作答时间过长或过短】设置:可以通过快捷方式(小于2秒、大于10分钟)、自己设置筛选条件——将作答时间过长或过短的问卷批量标为无效。