归因分析指南v1.0

归因是一个跨领域的方法，在数据分析、深度学习、广告营销、心理学、投资都有相关的理论研究。趁周末时间，完成了归因指南的第一个版本（之后还会不断迭代的），分享给你们。

- 什么是归因 attribution

汉语上理解，指的是观察者对他人的行为过程或本身的行为过程所进行的因果解释和推论。 归因——因果解释和推论 。

attribution

psychology : the interpretive process by which people make judgments about the causes of their own behavior and the behavior of others

归因最先源于心理学：人们对本身的行为原由和他人的行为进行推断的解释过程。

归因分析是一种能够跨领域使用的方法（技术） ，能帮助咱们看清影响结果的关键因素，从而不会轻易被表象所迷惑。从心理学到消费者行为，再到人力资源管理、绩效评估和团队领导力，基金股票投资决策，甚至延伸到互联网广告的效果优化（计算广告）。

- 边界与误区

现实中的因果关系是复杂、难于预测的 ，好比天气、股票市场、一场疫情的传播，每每在必定时段里是难于预测的，著名的理论蝴蝶效应就解释了这种混沌现象：一个微小的变化能影响事物的发展，这就是为何天气或者是股票市场会有崩盘和不可预测的天然灾害。

人类的思惟每每具备将事情复杂化的倾向 ，你们在讨论的时候，是否是有同感，咱们的思惟能够随时地漫无边界地发散，而远离议题自己。这里分享下查理·芒格的看法：我热衷于把事情简单化，若是事情太麻烦了，我就跳过去换一个。而巴菲特也有相似的说法：失败的缘由是由于咱们拥有了那些伟大和复杂的系统，但咱们要作的仅仅是回归简单。

把问题简单化，每每能用几句话简单描述的就是最佳答案。

理想的归因 （这里引用宋星在数字营销的一些观点）指的是全面归因，但愿可以穷尽这些全部对人决定购买施加的全部外部因素。这里包括了线上、线下，还有咱们预想不到的其余因素（梦境之类的）。明显，目前技术手段是作不到的。

退一步，全面归因作不到，那么，线上全面归因，全是数字化，可否实现呢？

现实状态下的归因 ，是指咱们忽略那些不可能去了解的外部影响因素，而只看那些咱们能掌握的因素。基于此，就有了线上全域归因、线上局部归因。

线上局部归因 ，咱们目前的技术手段所实现的基本都是指的是线上的局部归因， 是忽略了咱们所不能掌握的因素的一种归因分析手段。

- 数字营销领域的归因

在数字营销领域，通常咱们会称为营销归因模型，共有六种常见的归因模型：首次互动、最后一次互动、最后一次非直接点击、线性、时间衰减和基于位置。

每种分析模型都有其优缺点 。经过分析每一个归因模型，咱们能够更好地了解每一个营销渠道的投资回报率。 不必定有“最佳”归因模型 ，但咱们能够选择一种做为报告和分析的主要归因模型。

- 最终互动归因

这是大多数平台（Google Analytics）中的默认归因模型。最终互动归因(最终点击)，此模型会将100％的功劳归功于您的企业与潜在客户进行转化以前的最后一次互动。

优势，最终互动归因是最简单的实施和评估方法，一般也是最准确的 。用户能够从多个设备访问，清除Cookie或使用多个浏览器，这使得跟踪他们的整个旅程变得困难，可是，咱们始终能够在用户转换以前肯定它们的最后一次交互。

缺点是该模型忽略了最终交互以前发生的全部事情 。若是您的购买周期短，则此模型可能很是适合您。若是转换前接触点很少，则仅跟踪最后一个接触点就可使您对最有效的渠道有所了解。

- 首次互动模型

首次互动与最终互动相似，由于它为一次点击/互动提供了100％的功劳。首次互动（首次点击）将全部功劳归功于与客户的首次互动。例如，若是用户首先在Pinterest上找到您的业务，则Pinterest会得到互动后发生的任何销售的全部功劳；若是客户在Pinterest上找到您，而后在一周后点击展现广告，而后直接转到您的网站，这个功劳都是Pinterest的。

- 最终非直接点击

最终非直接点击模型比标准的最终点击模型更有帮助 。最终非直接点击仍然将100％的值分配给单个互动。直接访问是指任何人经过手动输入您的网址或单击添加了书签的连接直接进入您的网站。

- 线性归因

使用线性归因模型，将功劳平均分配给客户与企业之间的全部互动。例如，客户在Instagram上找到您，订阅您的电子邮件，而后单击了电子邮件里的连接。过了一周他们直接前往您的网站并消费了$ 120。在这种状况下有3个接触点。每一个接触点可得到33％的功劳。

线性归因对全部事物都给予同等的重视。该模型不会突出显示最有效的策略 。若是您想要一个简单明了的归因模型，而且能够轻松地向客户解释，那么线性归因多是您的理想选择。

- 时间衰减归因

顾名思义，时间衰减归因考虑了时间维度的因素，第一次互动得到的功劳较少，而最后一次互动得到的功劳最大。当您要处理特别长的销售周期时，您可能须要使用时间衰减归因模型。

- 基于排名的归因

基于排名的归因模型（U形归因）在潜在客户与您的品牌的首次互动以及转化为潜在客户的两点各分配40％的功劳，其他20％则分布在中间发生的任何其余交互做用之间。

例如，若是潜在客户首先经过Google搜索与您的公司联系，查看您的Facebook页面，而后注册您的电子邮件时事通信，则第一次（google）和第三次接触（电子邮件）都会得到40％的功劳，而Facebook访问会得到剩下的20％。

- 自定义归因模型

经过给你认为的最重要的任何接触点赋予自定义权重的一种归因模型。

- 投资决策领域的归因分析

归因分析，一种评估工具，用于根据特定基准来解释和分析投资组合的绩效。它用于识别公司或基金经理积极投资决策的超额收益来源。

基准决定归因分析的结果，核心思路：将特定投资组合产生的回报与已进行基准评估的投资回报进行比较。

- 分配影响

指经过将投资组合权重分配给特定的细分市场而产生的收益。好比，投资组合A，分配给IT行业20％，分配给房地产行业50％，分配给零售行业30％。比较的时候，是将分配权重与基准投资组合进行比较：

A(20%,50%,30%)

Baseline(15%,45%,45%)

Ps：本文baseline的设定仅为了解释清楚概念自己而假设的。

若是投资组合的行业高于基准水平，则被视为超重

若是投资组合的行业权重低于基准，则被视为减持

理想状况下，投资决策者的目标是将较高的权重放在表现良好的行业（即，对该行业加剧），而将较低的权重放在那些投资不良的行业（即，对该行业进行低估）。

此影响，考察的是如何分配权重。

- 选择影响

指选择一个细分市场中的特定股票对投资组合总回报的影响。

当来自特定细分市场的投资组合收益大于来自同一细分市场的基准收益时，就会产生正选择效应。

当来自特定细分市场的投资组合收益低于来自同一细分市场的基准收益时，就会产生负选择效应。

此影响，评估个体对总体的决定性影响有多大。

- 相互做用影响

把分配和选择综合起来，就是相互做用影响，因为相互做用影响是分配和选择的数学结果，而不是主动作出的投资决策，所以不容易归因于相互做用影响。

此影响，有点像1+1>2的状况，不容易把为何大于2的影响因素归因到某个1。

咱们进一步抽象下：

咱们把行业记为H，

投资组合记为A，

权重记为w，

分配效果记为 A （ w 1 * H 1 ， w 2 * H 2 ， w 3 * H 3 ）

基准记为 H 1base ， A base

分配影响记为 E a

选择影响记为 E s

相互做用影响记为 E i

E a比较的是：

W 1, w 2, w 3

W 1base , w 2base , w 3base

Es比较的是:

H 1 /H 1base

Ei比较的是:

Ei=wa*Ea + ws*Es

wa跟ws的权重大小。

- 用于解释深度学习模型的归因

Axiomatic Attribution for Deep Networks

归因也用于分析深度学习模型所学习到的特征，对于预测结果的贡献度。上图是用于分析一个翻译模型，单词对于输入输出的贡献程度。

上图是用于文本分类模型的归因分析，咱们能够直观地了解到模型所学习到的、对于分类有关键做用的单词。算法

- 产品案例

Adobe Analytics

这不只是归因，而是一场洞察革命。

It’s not just attribution.
It’s an insight revolution.

经过归因，您能够了解整个客户旅程中不一样的互动如何影响转化。传统归因归因于特定事件和任意事件，而最佳归因则使用机器学习和高级统计模型来了解每次触摸的精确影响。

- 功能1 营销归因

Marketing Attribution

多种基于规则和算法的归因方法可对客户行为进行可靠的分析，并根据客户的实际互动模式为每一个渠道提供最合适的模型。

1 多种归因模型，每种模型有其假设及适用的场景；

2 合理地根据具体业务选择适合的归因模型；

Mix, match, or compare attribution models in your analysis

3 可视化的重要性

可视化图表的选择表明了所想要展现的规律，每每图就是结论。

- 功能2 预测分析

Predictive analytics.

Predicting the future is what data was made for.

数据的存在价值就是为了预测将来。

当咱们收集了大量的客户数据，可是在许多状况下，咱们并无充分利用这一切收集而来的数据，由于咱们依赖从手动挖掘到的很小比例的看法。

预测分析旨在帮助咱们挖掘还没有开发的数据潜力。这些数据中隐藏着一些模式，这些模式能够揭示有意义的客户看法。预测功能依靠 机器学习和高级统计模型来自动挖掘大量数据 ，以寻找大多数分析师根本没有时间寻找的那些模式。

- 什么是洞察？

Insight

咱们首先须要发现有趣的模式interesting patterns，如何定义有趣？以下图所示，数据的趋势不稳定，就表明是有趣的：浏览器

为了把Insight自动挖掘出来，须要把全部可能的有趣模式分类出来，有趣的模式包括12种：Attribution贡献、Outstanding No. 1 第一名、Outstanding Top 2 第二名、Outstanding Last 最后一位、Evenness 均匀度、Change Point 转折点、Outlier 离群值、Seasonality 季节性、Trend 趋势、2D Clustering 聚类、Correlation 相关性、Cross-Measure Correlation 交叉测量相关。微信

能够分红3类，单点洞察、单形状洞察、复合洞察。app

结合图表，咱们看几个示例：

Outstanding No. 1

Outstanding Last

Attribution

Evenness

Change Point

Outlier

Trend

Seasonality

Correlation

Cross-Measure Correlation

2D Clustering

当把洞察的种类罗列完以后，就能够尝试使用机器学习来自动发现各类有价值的洞察啦~机器学习

- 产品案例

Amazon Attribution

亚马逊为品牌和零售商推出的工具。该工具将帮助卖家了解亚马逊产品流量从何而来，从而更好地调整本身的营销策略。

Measure 度量，卖家能够经过Amazon Attribution对各个广告渠道进行分析，来了解广告渠道的有效性。

Optimize 优化，卖家能够根据本身的需求，经过Amazon Attribution报告的各个广告渠道的有效性来进行不断地优化（in-flight optimization）。

Plan 计划，卖家能够经过Amazon Attribution查看各广告渠道的有效性和洞察相关的亚马逊细分受众群，来规划将来的营销策略。

度量-优化-计划，这是一个产品的最小闭环。

- 算法归因

也称为数据驱动归因，英文是Data-Driven Attribution，简称DDA。Google于2013年推出了Google Analytics Premium的数据驱动归因模型，并于2014年在AdWords中发布了该模型。ide

数据驱动归因是一种 基于机器学习 的归因模型，与基于规则的归因模型不一样，数据驱动归因使用全部可用的路径数据，包括路径长度，曝光顺序和广告素材，来了解特定营销接触点的存在如何影响用户转化的可能性以更好地将功劳分配给任何接触点。

算法归因本质上是一个分类问题，理论上能用于分类的算法均可以用于算法归因的。经常使用的算法有 马尔科夫链、沙普利值、生存分析和Harsanyi Dividend 。

谷歌系的产品用的是基于Shapley值，如Google Attribution 360，Google Analytics 360，DoubleClick和AdWords。算法归因相比基础的模型如First Touch，Last Touch，Linear等有着优点，算法归因考虑到了更多渠道间的互动。工具

- 辛普森悖论VS归因分析

Simpson's paradox

当人们尝试探究两种 变量（好比新生录取率与性别）是否具备相关性的时候，会分别对之进行分组研究。然而，在分组比较中都占优点的一方，在总评中有时反而是失势的一方。

简单来讲，同一组数据，总体的趋势和分组后的趋势彻底不一样。从统计学家的观点来看，出现辛普森悖论的缘由是由于这些数据中潜藏着一个魔鬼—— 潜在变量 lurking variable。

最著名的辛普森悖论的实例 ，就是1973年加利福尼亚大学伯克利分校性别歧视案的例子。若是只看总体录取率，那么男生的录取率是44%，女生的是35%。而若是拆开来看，在6个院系的4个里，女生的录取率大于男生。若是按照这样的分类，女生实际上比男生的录取率还高一点点。在这个案例中，辛普森悖论出现的缘由是，女生更愿意申请那些竞争压力很大的院系（好比英语系），可是男生却更愿意申请那些相对容易进的院系（好比工程学系）。这不就是归因所要挖掘的洞见吗？

很多统计学家认为，辛普森悖论的存在，提醒咱们不可能光用统计数字来推导准确的因果关系。由于数据能够用各类各样的方式分类，而后再进行比较，因此理论上潜在变量无穷无尽，你老是能够用某个潜在变量获得某种结论。

咱们能作的，就是仔细地研究分析各类影响因素，把各类分类方式（不一样模型）对比研究分析。

以上为全文，总结下：学习

归因是描述因果关系的一种分析方法，咱们须要明确影响因素，在影响因素的范围下进行归因分析。优化

各个领域的应用，须要结合业务具体的状况，设定一些基本的假设 ，例如数字营销有点击归因等模型，投资决策有分配、选择、相互做用的模型。

产品上， 不只仅是归因，还要解决洞察问题 。洞察实际上就是有趣的结论，咱们可使用机器学习自动挖掘到有趣的结论（结合洞察分类）

产品最小闭环： 度量-优化-计划 。

归因除了基于规则的实现，还有机器学习的实现方式，称为 算法归因 。

归因也能够 从辛普森悖论里得到结论 。

参考文献：

https://agencyanalytics.com/blog/marketing-attribution-models

https://zhuanlan.zhihu.com/p/90165817

https://arxiv.org/pdf/1703.01365.pdf

https://www.microsoft.com/en-us/research/uploads/prod/2016/12/Insight-Types-Specification.pdf

https://www.microsoft.com/en-us/research/uploads/prod/2019/05/QuickInsights-camera-ready-final.pdf

相关连接、更多资料查阅网站

⤵️️

「 Mix+人工智能 」专刊

每期由mixlab社区精选。收录人工智能的相关内容，包括AI产品、AI技术、AI场景、AI投资事件、AI的思惟方式等，MIX的主题包括：AR、VR、计算设计、计算广告、智能设计、智能写做、虚拟偶像等。

智能时代，人与人之间的差距，体如今AI使用能力上

To Be Continued

……

本文分享自微信公众号 - 无界社区mixlab（mix-lab）。
若有侵权，请联系 support@oschina.cn 删除。
本文参与“OSC源创计划”，欢迎正在阅读的你也加入，一块儿分享。