哈喽你们好,我是可乐
网络
周日参加了知乎的一个线下活动——快闪课堂
主题:数据会说谎吗?
主讲人:程毅南
ide
主要分享了如何收集到真实的用户数据并用好这些数据。工具
咱们为何须要数据,由于要决策,更准确地说,要科学、准确地决策,并解决实际问题。大数据
世界客观存在,但须要人去发现和认知spa
在这个大数据时代,每时每刻都在产生大量的数据,如何从这么多数据里发现有效数据并进行科学地决策,是咱们重点关注的问题。设计
数据是链接客观世界和主观认知的桥梁,但修桥是个技术活3d
数据客观地存在,人们对数据的解读各有千秋,就像一千我的的心中有一千个哈姆雷特同样,不一样的人对同一份数据可能都会有不一样的说法,后面会举例。orm
获取数据不难,可是获取真实、有效的数据,确实没那么简单。好比:blog
人的想法和感觉很难丈量事件
一个简单的情侣交流问题,就能够知道人的想法和感觉是很难丈量的,请看下面例子:
小茗同窗:我爱你
可乐:你有多爱我
爱的程度没法用工具测量
用得分或数字表达,都极易失真,缺少信度
爱的状态自己就不稳定,可是测量时的状态却很重要
爱的感觉能够对比参照(前女朋友,你妈),但…
你能够用优美的情话来比喻,但这考验的就是语文能力,缺少效度。
形成决策失误
举三个测量不许致使决策失误的栗子
感情被骗
好比上面的 我爱你 的案例,对小茗同窗是否爱可乐这件事情若是测量不许,极可能致使可乐遭受严重的情感诈骗事件。
美国大选民调翻车
2016年特朗普当选,是美国民调的滑铁卢,2020年差点又翻车。
对开放二胎的决策
开放二胎后,人口增量显著低于预期,中国适龄人群的生育意愿到底怎样,依然是一个有挑战的问题。
对世界产生认知误差
举3个比较难以获取真实数据的例子
美国大选民调
对于美国大选的预测,你们一直以来都津津乐道,2016年,民调预测希拉里会赢得大选,结果咱们都知道倒是特朗普上台,今年虽然总体上民调显示拜登的支持率较高,但在一些摇摆州的预测上仍是打了脸。
因此把数据测量准确这件事情仍是很难的。固然对于民调这种问题,结果不许确更多地可能仍是取样的误差?
如何了解某种难以启齿的行为的***率
如家庭暴力、偷窃、出轨等难以启齿的行为,如何了解它们的***率?
实际报案的、被警察抓获的、被他人发现的来这只是一小部分人,或者你能够说是幸存者误差,到底有多少人有过相似的行为?
咱们可能会想到经过如下方式来获取:
网络问卷调查。成本低,也没法核实用户身份,但也所以用户也就能够随意说谎
入户调查、街头拦访。也会撒谎,或者很差意思坦白
在居民家安装监控,排查全部转帐数据。相似咱们的数据埋点,可能效果好,但不现实。
这里程老师提供了另一种获取思路:
抽一张牌,但不告诉我抽到的是什么?
最后,将回答是的比例减去75%,再除以25%,便是较为真实的家暴行为***率。
由于这里,回答“是”,变成了大几率事件,且这种方法保持了面对面调查却仍然匿名的方式,结果就较为真实一些。
调查用户对微博产品的体验和感觉
一个真实的案例,说是微博对用户的满意度问卷投放数个小时后,评分忽然大幅降低,发生什么事儿了?
这个案例能够帮助咱们思考一个问题:
意想不到的数据出现,是有效仍是无效?
前面提到收集数据有那么多的困难,那么该如何科学有效地收集数据?
人是爱面子的,会假装
调整问法,让他更天然地表达
比起直接问你支持谁,还不如问,你的邻居支持谁?
巧妙设计,让他明白真实答案没有后果
好比,刚刚提到的抽牌匿名法
官方身份,反正大家都知道,说谎没有意义
好比知乎问你最喜欢看哪些问题?普罗大众确定以为,你应该都知道的吧,否则天天给我推送的是啥?
人性是容易服从、容易引导的,要避免从众压力
《是,首相》中奸臣作民调就体现了这一点。就“是否支持恢复兵役”的民调是可控制的。在下面一系列“是”的回答后,人们有很大的可能支持恢复兵役。
人性是懒惰的,调查请不要太麻烦
动辄几十道问卷调查题目真的很让人头疼。
人性是千奇百怪的,要尽量包容你所见到的现象
幸存者误差想必你们已经听过无数次了,不太了解的童鞋能够在这篇文章中看看。
简单来讲幸存者误差就是只能看到通过某种筛选而产生的结果,忽略了被筛选掉的关键信息。这个案例告诉咱们用好数据多么的重要
有什么方法能测量感情的健康程度
如何测量感情的健康程度?用下面的指标来衡量吗?
礼物个数
约会次数
陪伴时长
吵架次数
打架次数
仍是那句话,不一样的人心中有不一样的评判标准,感情是特指男女仍是包括父母亲情?什么是健康程度?感受又回到了文章一开头收集数据有什么难处的问题,人的想法和感觉自己就很难丈量,咱们能够经过构建不一样的用户画像来具体问题具体分析,主要目的是哪些指标可以帮助咱们作决策。
因此你们也能够评论区聊聊,有什么方法能测量感情的健康程度