Carpe Diem

備忘録

Data Clean Room によるプライバシー保護と効果測定の両立

課題

従来広告の効果測定は、主にCookieやIPを使って以下の様にデータを突合していました。

しかしながら最近はプライバシー保護のためGDPRなどによってCookieレスが進んだり、これまでメディア(媒体)から連携されていたIPも連携されないような流れが出てきました。

これにより適切な広告効果が計測できない課題が生まれています。

そこでプライバシーを保護しつつ、効果計測もできるようにするソリューションがData Clean Roomです。

Data Clean Room (DCR)

前述の通り、DCRはIPなどのPII(個人識別用情報)を共有せず計測する仕組みです。

大まかにいうと

  • IPなどのPIIは公開はしないが結合(JOIN)はできる
  • PIIはProjection(SELECTなど)の対象にはできない
  • 集計関数によって統計データとしてのみアウトプットできる
    • 少数だったら表示しない(特定できてしまうため)といった制約もある

という方式によって、プライバシーを保護しつつ分析が可能になります。

アーキテクチャ

イメージとしては以下の様なアーキテクチャです。

この図のようにProvider(メディア)側はデータを直接共有せず、JOINしてOKかどうかのデータベース共有を行います。

Consumer(計測)側は許可されたフィールドとの結合や集約関数を使ってレポートを作成します。

JOINや集約関数の許可はProvider・Consumer間で事前にすり合わせを行います。

メリット・デメリット

DCR導入におけるメリット・デメリットは以下です。

メリット

  • 法規制対応(GDPR・個人情報保護法)を満たした分析基盤
    • プライバシーを保護しつつ、広告の効果測定が可能
  • データ連携の心理的・組織的ハードルを下げる
    • 社内外でのデータ共有への合意形成がしやすくなる
  • Cookie規制におけるファーストパーティデータの価値最大化

デメリット

  • 各メディアにDCR Providerを用意してもらう必要がある
    • ベンダー契約が含まれるとそれだけで 1.5〜3 ヶ月ほどリードタイムが発生
  • DCRソリューションが一致している必要がある
    • 相手が異なるソリューションを使っていれば別で用意が必要
  • ベンダーロックイン
  • 提供可能な共通キーがメディア毎に異なるケース(IPはNG、等)
  • ターゲティングには活用できない
  • 契約・権限管理の複雑化、煩雑化

ソリューション

最近では広告系のソーリューションや、データマネジメント系のソリューションの多くがこのDCRをサポートしてきています。

ウォールドガーデンDCR アプリ仲介型DCR 企業が構築するDCR
(クラウドネイティブDCR)
・Google Ads Data Hub
・Facebook Advanced Analytics
・Amazon Marketing Cloud
・LiveRamp
・AppsFlyer
・AWS Clean Rooms
・Snowflake DCR
・BigQuery DCR
・Habu
・Infosum

標準化への動き

前述のベンダーロックインのようなデメリットを解決すべく、現在はIABが標準化を進めています。

ADMaP (Attribution Data Matching Protocol)

iabtechlab.com

ADMaPというプロトコルで、DCRで重要な次の二つの主要な要素をプロトコルとして標準化しています。

1. マッピングプロトコル (Mapping Protocol)

広告主とパブリッシャーのデータセット間で共通の識別子を特定し、共通のマッチキー(突合キー)を定義する役割を担います。

項目 説明 関連情報
Key Type 提供されるキー値のタイプ(例:メールアドレス、電話番号)。 将来の改訂で追加のキータイプが標準化される可能性があります。
Key Value 広告主とパブリッシャーが準備するキーのリスト。PII(個人を特定できる情報)を含む可能性があります。

異なる関係者間で一貫したマッピングを可能にするために、現状以下の正規化とエンコーディングが指定されています。

Key Type 正規化とエンコーディング
メールアドレス (i) 前後のスペースの削除
(ii) ASCII文字を小文字に変換
(iii) SHA256ハッシュ化
(iv) ハッシュソルトなし。
電話番号 (i) E.164で正規化(最大15桁)
(ii) スペース、ハイフン、括弧などの特殊文字なし
(iii) SHA256ハッシュ化
(iv) ハッシュソルトなし

しかしメールアドレスや電話番号はサイト来訪やインストールタグとしては中々取得が難しかったりもするので、IPも今後入る可能性として考慮されています。

2. アトリビューションプロトコル (Attribution Protocol)

入力イベントとマッピングコンポーネントの識別子に基づいてアトリビューションを計算する役割を担います。
プライバシーを保護した集計されたアウトプットを生成するための集計・レポート作成コンポーネントも含まれます。

アトリビューション分析の種類としてルールベースとモデルベース(ML)があります。

ルールベース

ルールベースの手法は、事前に定義された規則に基づいてコンバージョンへの貢献度を割り当てるものです。

名称 説明
ラストタッチ コンバージョンに直結した最後のエンゲージメントにのみ貢献度を割り当てる
ファースト・ラスト 最初と最後のエンゲージメントに貢献度を割り当て、中間にある接触にも何らかの配分を行う
均等配分 コンバージョンに至るまでの全てのエンゲージメントに均等な貢献度を割り当てる
タイムディケイ (Time Decay) コンバージョンに近づくほど、エンゲージメントの貢献度が高くなるように割り当てる
カスタムヒューリスティック 上記以外をカバーするためのカスタムルールを用いる

アトリビューション分析におけるよくある手法ですね。

モデルベース

モデルベースの手法は、データに基づいて貢献度を計算するモデルを使用します。
しかしADMaPでは具体的なモデルについては指定は無く、その採用はProviderに委ねられるとしています。

まとめ

広告業界におけるプライバシー保護の流れとそれに対するソリューション、標準化といった未来についてまとめました。