隱私優先時代的行動歸因

01010011 @01010011@hackers.pub
概述
隨著個人隱私保護重要性的提升,行動歸因(Mobile Attribution)的範式已經發生了重大變化。過去,我們可以透過 IDFA、GAID 等廣告識別碼進行精確測量,但在以用戶隱私保護為首要考量的現代,確定性(Deterministic)的用戶識別已不再可能。
本文將介紹以 Apple 的 SKAdNetwork (SKAN) 和 Google 的 Privacy Sandbox 為代表的行動環境隱私保護框架,並探討如何以機率論方式獲取行動歸因。
您是怎麼知道的?
在 1970 年代,美國底特律的汽車銷售員「喬·吉拉德(Joe Girard)」在 15 年間售出了 13,001 輛車,被列入金氏世界紀錄為「世界上最偉大的銷售員」。
他成功的秘訣不在於賣車的技巧,而是在於創造源源不斷客戶的「系統」。他稱那些為他介紹潛在客戶的人為「獵犬(Bird Dogs)」。理髮師、餐廳老闆、銀行職員等周圍的每個人都可能成為他的「獵犬」。
他的規則很簡單:「請給我介紹客戶。如果那位客戶買了車,我會立即給您 25 美元。」
要讓這個系統完美運作,有一個最重要的前提條件:就是要毫無誤差地掌握「這位客戶是誰介紹來的?」
當新客戶到來時,喬·吉拉德首先會問:「是誰介紹您來找我的?」然後在交易成功後,他會仔細記錄在帳本上,並確保將承諾的 25 美元送給介紹人。
就像喬·吉拉德的故事一樣,在行動應用服務生態系統中,追蹤哪些廣告活動或行銷策略帶來客戶流量或付費,並找出其功勞所在的過程,就稱為行動歸因(Mobile Attribution)。
確定性歸因(Deterministic Attribution)
精確測量歸因非常重要。只有知道這位客戶是理髮師介紹的,還是銀行職員介紹的,才能判斷應該給誰多少廣告費。
為了回答「這位客戶是誰介紹來的?」這個問題,行動平台過去會向廣告網路提供以下資訊:
- IDFA(Identifier for Advertisers): Apple 為 iOS 裝置提供的、用戶可重設的廣告識別碼
- GAID(Google Advertising ID): Google 為安裝了 Google Play 服務的 Android 裝置提供的廣告識別碼
IDFA 和 GAID 都是能夠精確識別用戶裝置的唯一值。因此,知道 IDFA 和 GAID 就能獲得精確的行動歸因。
- 用戶點擊廣告
- 廣告網路捕獲並儲存該裝置的 IDFA / GAID
- 用戶安裝應用程式並首次執行
- 獲得 100% 精確的用戶流量來源歸因
透過這種確定性歸因獲取方式,廣告主能夠獲得關於哪些廣告帶來哪些用戶的明確數據,這是推動行動廣告生態系統成長的基礎。但現在免費午餐已經結束了。在行動平台加強隱私保護的趨勢下,未經用戶同意就獲取確定性歸因已經不可能。就像正在閱讀這篇文章的您一樣,用戶不再同意提供可以特定識別自己的個人資訊。
機率性歸因(Probabilistic Attribution)
Apple 的 ATT(AppTrackingTransparency)和 SKAN(SKAdNetwork)框架
如前所述,Apple 不再在沒有用戶同意的情況下提供 IDFA(更準確地說,是沒有「明確」的用戶同意)。
因此,從 iOS14+ 開始,若要獲取裝置的 IDFA 值,必須透過 ATT(AppTrackingTransparency)框架明確獲得用戶授權。如果用戶拒絕同意,如上圖所示,IDFA 值會變成 000000~ 的空值。
這對廣告主和廣告網路都是致命問題。因為無法明確知道廣告是由誰曝光,就無法確定客戶從哪個管道流入,廣告業務的基本前提(「您是怎麼知道的?」)就此崩塌。
作為替代方案,Apple 提供了一種獲取廣告識別碼的方式,它提供有限的資訊但無法識別特定個人,這就是 SKAN(SKAdNetwork)。
SKAN 的資料流程如下:
- 廣告網路:發布廣告
- 廣告網路:註冊有限的歸因(Postback)收集 URL
- 用戶:點擊廣告 -> 安裝應用程式
- Apple:延遲一段時間(最多 144 小時)以防廣告商追蹤個人
- 廣告網路:經過一段時間後,通過 Postback 接收活動 ID 和有限的用戶資訊(轉換值,Conversion Value),但不包含 IDFA
在這裡,獲取用戶資訊的唯一手段是 CV(Conversion Value)。CV 是一個 0~63 之間的整數,以 6 位元表示,廣告主可以將 64 種值進行映射,以收集用戶安裝應用程式後的行為。例如,CV 為 1 表示完成教學,CV 為 2 表示完成首次應用內購買等,這些值可以預先定義,並在 Postback 時獲取以分析用戶。如您所知,6 位元是非常有限的值,單獨使用 CV 無法識別特定用戶。
可以說,Apple 自詡為資料測量的裁判和唯一處理者。廣告主和廣告網路都必須在 Apple 設定的嚴格規則內,被動接收並解釋 Apple 提供的最終結果。
Android 的 Privacy Sandbox 和 Attribution Reporting API
與 Apple 參與和控制所有歸因獲取路徑並只傳遞結果的方式相比,Google 提供了建構區塊,讓廣告生態系統參與者能夠基於隱私保護技術建立自己的隱私保護解決方案。這個核心建構區塊就是 Privacy Sandbox。
Privacy Sandbox 有以下三個核心目標:
- 建立新的隱私保護技術,以替代現有的追蹤機制。
- 支持發布商和開發者在沒有侵入性追蹤的情況下繼續提供免費的線上內容。
- 與業界合作建立新的網路隱私保護標準。
總結來說,就是在保護個人隱私的同時,創建一個行業標準,使發布商和開發者能夠維持廣告基礎的業務。
Google 的 Privacy Sandbox 與現有歸因獲取方式在技術上最大的區別是,它在用戶裝置內部創建與廣告網路資訊匹配的歸因。
由於歸因是在裝置內獲取的,廣告業務經營者可以在不將用戶個人資訊傳出裝置的情況下,獲得有意義的用戶轉換資訊。
這種在用戶裝置上生成的匿名化歸因通過 Attribution Reporting API(簡稱 ARA)收集。
通過 ARA 收集的報告主要有兩種類型:
- 事件級報告(Event-Level Report): 提供有限但細分的資訊,如「哪個廣告促成了轉換?」
- 摘要報告(Summary Reports): 以加密和彙總形式提供詳細的轉換數據,如「活動的總收入和 ROI 是多少?」
事件級報告是匿名化的個別資訊。雖然是個別資訊,但因為已匿名化,所以不包含太多資訊。它提供歸因資訊與用戶點擊、瀏覽等事件的映射數據。這種報告適合用於測量活動觸及率或歸因彙總等用途。
相比之下,摘要報告是用戶數據的統計結果。雖然沒有個別化的資訊,但提供轉換價值、ROI、按用戶區隔的活動績效分析等深入報告。
這些數據以加密形式(即加密可彙總報告)傳送給廣告技術平台(如 Appsflyer、Meta、Applovin 等),這些平台基於加密數據向位於雲端可信執行環境的彙總服務提出必要的查詢。
雲端可信執行環境(Cloud Trusted Execution Environment, TEE)是什麼?
TEE 是在符合 Google 提出的安全標準且值得信賴的雲端提供商基礎設施上運行的隔離環境。只要符合 TEE 的安全標準,廣告技術平台企業可以自行建立和運營。
執行摘要
至此,我們已經了解了在隱私保護時代如何獲取行動歸因。過去那種確定性獲取歸因的時代已經結束,各利益相關者必須為隱私保護時代的歸因獲取方式做好準備。
確定性時代的終結:隨著隱私保護的加強,基於 IDFA、GAID 的一對一用戶追蹤已不再可能。
轉向機率性時代:現在必須基於有限的數據「推斷」績效,而非依賴明確的數據。
Apple(SKAN)的方法:Apple 控制整個過程的「黑盒子」方式。
Google(Privacy Sandbox)的方法:以「裝置內匹配」為核心,提供廣告生態系統可利用的「建構區塊」。
廣告技術角色的變化:MMP、廣告網路等廣告技術需要接收加密報告,並在雲端安全環境(TEE)中建立和運營「彙總服務」來處理數據。