数据会说谎的真实例子有哪些

时间 2021-01-31

标签网络 ide 工具大数据 spa 设计 3d orm blog 事件栏目系统网络繁體版

原文原文链接

哈喽你们好，我是可乐
网络

周日参加了知乎的一个线下活动——快闪课堂
主题：数据会说谎吗？
主讲人：程毅南
ide

为了不遗忘，因此将内容整理并附带我本身的理解，和你们分享。

主要分享了如何收集到真实的用户数据并用好这些数据。工具

咱们为何须要数据

咱们为何须要数据，由于要决策，更准确地说，要科学、准确地决策，并解决实际问题。大数据

什么是科学地搜集数据

世界客观存在，但须要人去发现和认知spa

在这个大数据时代，每时每刻都在产生大量的数据，如何从这么多数据里发现有效数据并进行科学地决策，是咱们重点关注的问题。设计

数据是链接客观世界和主观认知的桥梁，但修桥是个技术活3d

数据客观地存在，人们对数据的解读各有千秋，就像一千我的的心中有一千个哈姆雷特同样，不一样的人对同一份数据可能都会有不一样的说法，后面会举例。orm

搜集数据有什么难处

获取数据不难，可是获取真实、有效的数据，确实没那么简单。好比：blog

人的想法和感觉很难丈量事件

一个简单的情侣交流问题，就能够知道人的想法和感觉是很难丈量的，请看下面例子：

小茗同窗：我爱你
可乐：你有多爱我

为何我爱你很难回答，由于

爱的程度没法用工具测量
用得分或数字表达，都极易失真，缺少信度
爱的状态自己就不稳定，可是测量时的状态却很重要
爱的感觉能够对比参照（前女朋友，你妈），但…
你能够用优美的情话来比喻，但这考验的就是语文能力，缺少效度。

测量不许有什么问题

形成决策失误
举三个测量不许致使决策失误的栗子

感情被骗

好比上面的我爱你的案例，对小茗同窗是否爱可乐这件事情若是测量不许，极可能致使可乐遭受严重的情感诈骗事件。

美国大选民调翻车

2016年特朗普当选，是美国民调的滑铁卢，2020年差点又翻车。

对开放二胎的决策

开放二胎后，人口增量显著低于预期，中国适龄人群的生育意愿到底怎样，依然是一个有挑战的问题。

对世界产生认知误差

测量准确到底有多难

举3个比较难以获取真实数据的例子

美国大选民调

对于美国大选的预测，你们一直以来都津津乐道，2016年，民调预测希拉里会赢得大选，结果咱们都知道倒是特朗普上台，今年虽然总体上民调显示拜登的支持率较高，但在一些摇摆州的预测上仍是打了脸。

因此把数据测量准确这件事情仍是很难的。固然对于民调这种问题，结果不许确更多地可能仍是取样的误差？

如何了解某种难以启齿的行为的***率

如家庭暴力、偷窃、出轨等难以启齿的行为，如何了解它们的***率？

实际报案的、被警察抓获的、被他人发现的来这只是一小部分人，或者你能够说是幸存者误差，到底有多少人有过相似的行为？

咱们可能会想到经过如下方式来获取：

网络问卷调查。成本低，也没法核实用户身份，但也所以用户也就能够随意说谎
入户调查、街头拦访。也会撒谎，或者很差意思坦白
在居民家安装监控，排查全部转帐数据。相似咱们的数据埋点，可能效果好，但不现实。

这里程老师提供了另一种获取思路：

抽一张牌，但不告诉我抽到的是什么？

问被访者：是否打过本身的伴侣
若是抽到黑桃，则能够随心回答
若是抽到除 黑桃外的其余3种花色，则 只能回答是

最后，将回答是的比例减去75%，再除以25%，便是较为真实的家暴行为***率。

由于这里，回答“是”，变成了大几率事件，且这种方法保持了面对面调查却仍然匿名的方式，结果就较为真实一些。

调查用户对微博产品的体验和感觉

一个真实的案例，说是微博对用户的满意度问卷投放数个小时后，评分忽然大幅降低，发生什么事儿了？

结果发现是饭圈水军，“ 咱们给新浪微博打差评，让腾讯微博复活，给新浪点颜色看看”

这个案例能够帮助咱们思考一个问题：

意想不到的数据出现，是有效仍是无效？

如何作好测量

前面提到收集数据有那么多的困难，那么该如何科学有效地收集数据？

避免假装

人是爱面子的，会假装

调整问法，让他更天然地表达

比起直接问你支持谁，还不如问，你的邻居支持谁？

巧妙设计，让他明白真实答案没有后果

好比，刚刚提到的抽牌匿名法

官方身份，反正大家都知道，说谎没有意义

好比知乎问你最喜欢看哪些问题？普罗大众确定以为，你应该都知道的吧，否则天天给我推送的是啥？

避免从众

人性是容易服从、容易引导的，要避免从众压力

《是，首相》中奸臣作民调就体现了这一点。就“是否支持恢复兵役”的民调是可控制的。在下面一系列“是”的回答后，人们有很大的可能支持恢复兵役。

但换一种问法也是能够的

所以不一样的问卷调查方法，可能会获得不一样的结果，要避免给人从众的压力。

避免复杂

人性是懒惰的，调查请不要太麻烦

动辄几十道问卷调查题目真的很让人头疼。

包容

人性是千奇百怪的，要尽量包容你所见到的现象

如何用好数据

幸存者误差想必你们已经听过无数次了，不太了解的童鞋能够在这篇文章中看看。

数据分析中会常犯哪些错误，如何解决？

简单来讲幸存者误差就是只能看到通过某种筛选而产生的结果，忽略了被筛选掉的关键信息。这个案例告诉咱们用好数据多么的重要

一个问题

有什么方法能测量感情的健康程度

如何测量感情的健康程度？用下面的指标来衡量吗？

礼物个数
约会次数
陪伴时长
吵架次数
打架次数

仍是那句话，不一样的人心中有不一样的评判标准，感情是特指男女仍是包括父母亲情？什么是健康程度？感受又回到了文章一开头收集数据有什么难处的问题，人的想法和感觉自己就很难丈量，咱们能够经过构建不一样的用户画像来具体问题具体分析，主要目的是哪些指标可以帮助咱们作决策。

因此你们也能够评论区聊聊，有什么方法能测量感情的健康程度