隐私优先时代的移动归因

01010011 @01010011@hackers.pub
概述
随着个人隐私保护重要性的凸显,移动归因(Mobile Attribution)的范式发生了重大变化。过去,我们可以通过IDFA、GAID等广告标识符进行精确测量,但在以用户隐私保护为首要任务的现代环境中,确定性的用户识别已不再可能。
本文将介绍以苹果的SKAdNetwork(SKAN)和谷歌的Privacy Sandbox为代表的移动环境隐私保护框架,并探讨如何通过概率论方法获取移动归因数据。
您是怎么知道的?
在20世纪70年代,美国底特律的汽车销售员"乔·吉拉德(Joe Girard)"在15年内售出了13,001辆汽车,被吉尼斯世界纪录认定为"世界上最伟大的销售员"。
他成功的秘诀不在于卖车的技巧,而在于不断创造客户的"系统"。他将那些向他介绍潜在客户的人称为**"猎犬(Bird Dogs)"。理发师、餐厅老板、银行职员等周围的每个人都可能成为他的"猎犬"。他的规则很简单:"请给我介绍客户。如果这位客户买了车,我会立即给您25美元。" 要使这个系统完美运转,最重要的前提条件是:"这位客户是谁介绍来的?"**必须毫无误差地掌握这一信息。乔·吉拉德在新客户到来时首先会问:"是谁把您介绍给我的?"当销售成功后,他会仔细记录在账本上,并确保将承诺的25美元送到介绍人手中。
就像乔·吉拉德的故事一样,在移动应用服务生态系统中,追踪哪些广告活动或营销手段带来了客户流量或付费,并找出其功劳所在的过程,就被称为移动归因(Mobile Attribution)。
确定性归因(Deterministic Attribution)
精确测量归因非常重要。只有知道这位客户是通过理发师的介绍还是银行职员的介绍而来,才能判断应该给谁支付多少广告费。为了回答"这位客户是通过谁的介绍而来的?"这个问题,移动平台向广告网络(Ad Network)提供了以下信息:
- IDFA (Identifier for Advertisers): 苹果为iOS设备提供的、用户可重置的广告标识符
- GAID (Google Advertising ID): 谷歌为安装了Google Play服务的Android设备提供的广告标识符
IDFA和GAID都是能够精确识别用户设备的唯一值。因此,知道IDFA和GAID就能获得准确的移动归因数据。
- 用户点击广告
- 广告网络捕获并存储该设备的IDFA/GAID
- 用户安装应用并首次运行
- 获得100%准确的用户来源路径归因
通过这种确定性归因获取方式,广告主能够获得关于哪些广告吸引了哪些用户的明确数据,这是推动移动广告生态系统增长的基础。但现在免费午餐已经结束了。在移动平台加强隐私保护的趋势下,未经用户同意就获取确定性归因已经不可能。正如阅读本文的您可能也一样,用户不再同意提供可以特定识别自己的个人信息。
概率归因(Probabilistic Attribution)
苹果的ATT(AppTrackingTransparency)和SKAN(SKAdNetwork)框架
如前所述,苹果不再在没有用户同意的情况下提供IDFA(准确地说,是没有"明确的"用户同意)。
因此,从iOS14+开始,要获取设备的IDFA值,必须通过ATT(AppTrackingTransparency)框架明确获得用户授权。如果用户拒绝同意,如上图所示,IDFA值将变为000000~(空值)。
这对广告主和广告网络都是致命问题。由于无法明确知道广告是由谁展示的,因此无法确定客户通过哪条路径进入,这导致广告业务的基本前提("您是怎么知道的?")崩塌。
作为替代方案,苹果提供了一种获取广告标识符的方式,它提供有限的信息但不能识别特定个人,这就是SKAN(SKAdNetwork)。
SKAN的数据流程如下:
- 广告网络:发布广告
- 广告网络:注册有限的归因(Postback)收集URL
- 用户:点击广告 -> 安装应用
- 苹果:为防止广告商追踪个人,延迟一定时间(最多144小时)
- 广告网络:经过一定时间后,通过Postback接收活动ID和有限的用户信息(Conversion Value)(无IDFA)
在这里,获取用户信息的唯一手段是CV(Conversion Value)。CV是一个0~63之间的整数,表示为6位二进制值,广告主可以将64种值映射到用户安装应用后的行为。例如,CV为1表示完成教程,CV为2表示完成首次应用内购买等,这些值可以预先定义,并在Postback时获取以分析用户。众所周知,6位二进制是非常有限的值,仅凭CV无法识别特定用户。
可以说,苹果自封为数据测量的裁判和唯一处理者。广告主和广告网络都必须在苹果设定的严格规则内,被动接收并解释苹果提供的最终结果。
安卓的Privacy Sandbox和Attribution Reporting API
与苹果参与并控制所有归因获取路径并只传递结果的方式相比,谷歌提供了构建块,让广告生态系统参与者能够基于隐私保护技术构建自己的隐私保护解决方案。这个核心构建块就是Privacy Sandbox。
Privacy Sandbox有以下三个核心目标:
- 构建新的隐私保护技术,替代现有的追踪机制。
- 支持发布商和开发者在没有侵入性追踪的情况下继续提供免费在线内容。
- 通过与行业合作,建立新的互联网隐私保护标准。
总之,就是在保护个人隐私的同时,让发布商和开发者能够继续维持基于广告的业务,创建行业标准。
谷歌的Privacy Sandbox与现有归因获取方式在技术上最大的区别在于,它在用户设备内部创建与广告网络信息匹配的归因。
由于归因是在设备内部获取的,广告业务运营商可以在不将用户个人信息传出设备的情况下获得有意义的用户转化信息。
这些在用户设备上生成的匿名归因通过Attribution Reporting API(简称ARA)收集。
通过ARA收集的报告主要有两种类型:
- 事件级报告(Event-Level Report): 提供有限但细分的信息,如"哪个广告促成了转化?"
- 汇总报告(Summary Reports): 以加密和汇总形式提供详细的转化数据,如"活动的总收入和ROI是多少?"
事件级报告(Event Level Report)是匿名化的个人信息。虽然是个人信息,但由于匿名化处理,不包含太多信息。它提供将归因信息与用户点击、浏览等事件映射的数据。这种报告适用于测量活动覆盖率或归因汇总等用途。
相比之下,汇总报告(Summary Report)是用户数据的统计结果。虽然没有个性化信息,但提供转化价值、ROI、按用户细分的活动性能分析等深入报告。
这些数据以加密形式(=encrypted aggregatable report)传递给广告技术平台(Appsflyer、Meta、Applovin等),基于这些加密数据,平台向位于云可信执行环境(Cloud Trusted Execution Environment)中的聚合服务(Aggregation Service)提出必要的查询。
云可信执行环境(TEE)是什么?
TEE是在满足谷歌提出的安全标准且值得信赖的云提供商基础设施上运行的隔离环境。只要满足TEE的安全标准,广告技术平台公司可以自行构建和运营。
执行摘要
至此,我们已经了解了在隐私保护时代如何获取移动归因的内容。确定性获取归因的时代已经结束,各利益相关者需要为隐私保护时代的归因获取方式做好准备。
决定论时代的终结:随着隐私保护的加强,基于IDFA、GAID的一对一用户追踪已不再可能。
向概率论时代的转变:现在我们必须基于有限的数据"推断"性能,而非获取明确数据。
苹果(SKAN)的方法:苹果控制整个过程的"黑盒"方式。
谷歌(Privacy Sandbox)的方法:以**"设备内匹配"为核心,为广告生态系统提供可利用的"构建块"**。
广告技术角色的变化:MMP、广告网络等广告技术需要接收加密报告,并在云安全环境(TEE)中直接构建和运营**"聚合服务"**来处理数据。