(EFF)Google、物議を醸す新しい広告ターゲティング技術を何百万ものブラウザでテスト中

Categories
< Back
You are here:
Print

(EFF)Google、物議を醸す新しい広告ターゲティング技術を何百万ものブラウザでテスト中

以下、米国の電子フロンティア財団(EFF)の2021年3月30日の記事の飜訳です。

Spying eye with Chrome logo, blinking

これまでに判明していることは以下のとおりです。
by bennett cyphers 2021年3月30日

本日、Googleは、広告ターゲティングのための実験的な新技術であるFederated Learning of Cohorts(通称FLoC)の「第一回の実験」を開始しました。Google Chromeの何百万ものインスタンスのスイッチが静かに切り替わりました。これらのブラウザは、行動に基づいてユーザーをグループに分類し、グループのラベルをサードパーティのトラッカーやウェブ上の広告主と共有するようになります。この実験のために無作為に選ばれたユーザーは、現在のところ、サードパーティのCookieを無効にすることでのみオプトアウトすることができます。

Google社はこの試みを予告していましたが、これまでこの試みについての詳細は明らかにされていませんでした。私たちは、何が起こっているのかを正確に把握するために、ブログ記事メーリングリストウェブ標準のドラフトChromiumのソースコードを熟読しました。

EFFはすでに、FLoCはひどいアイデアだと書いています。 テストに参加する人々への通知もなく、ましてや彼らの同意も得られないまま、Googleがこの試験を開始したことは、存在してはならない技術のために、ユーザーの信頼を具体的に侵害するものです。

以下では、この実験がどのように行われるのか、また、これまでに判明している最も重要な技術的詳細を説明します。

FLoCはクッキーに代わるものと考えられている。今回のトライアルでは、それを補完するものとなる。

GoogleはFLoCを、サードパーティのCookieがなくなった後、広告主が広告をターゲットにするのに役立つように設計しました。トライアル期間中、トラッカーはサードパーティークッキーに加えて、FLoC IDを収集できるようになります。

つまり、現在Cookieを使ってウェブ上の一部であなたの行動を監視しているすべてのトラッカーが、あなたのFLoCコホートIDも受け取ることになります。コホートIDは、ウェブ上でのあなたの行動を直接反映しています。これにより、多くのトラッカーがすでに保持している行動プロファイルを補完することができます。

この試験は、世界中のChromeユーザーの最大5%に影響を与えるかも。

現在のところ、オーストラリア、ブラジル、カナダ、インド、インドネシア、日本、メキシコ、ニュージーランド、フィリピン、米国の一部の地域では、Chromeユーザーの0.5%を対象に試験が実施されていると言われています。また、Chromeでサードパーティークッキーをオフにしているユーザーのみが、デフォルトでオプトアウトされます。

さらに、FLoCを開発したチームは、アドテクノロジー企業が新しいデータを使ってよりよいモデルをトレーニングできるように、サンプルをユーザーの5%に引き上げることをGoogleに要求しています。この要求が認められれば、数千万から数億人のユーザーが試験に登録されることになります。

ユーザーは自動的に試験に登録されています。専用のオプトアウトは(まだ)ありません。

上述のとおり、Chrome ユーザーのうち無作為に選ばれた一部のユーザーが、通知や同意なしに試験に登録されます。それらのユーザーには、オプトインが求められません。現在のバージョンのChromeでは、サードパーティのCookieをすべてオフにすることでしか、この試験から抜け出すことができません。

Chromeの将来のバージョンでは、FLoCを含むGoogleの「プライバシー・サンドボックス」のための専用コントロールが追加される予定です。それまでの間は、FLoCをオフにしたいユーザーは、サードパーティのCookieもオフにする必要があります。

サードパーティークッキーをオフにすることは、一般的には悪い考えではありません。結局のところ、Googleが対処したいと言っているプライバシー問題の核心は、Cookieにあるのです。しかし、サードパーティのCookieを完全にオフにすることは、粗雑な対策であり、ウェブユーザーが頼りにしている多くの便利な機能(シングルサインオンなど)を壊してしまいます。プライバシーに敏感なChromeユーザーの多くは、Privacy Badgerなどの拡張機能を含む、より対象を絞ったツールを使用して、Cookieベースのトラッキングを防止しています。残念ながら、Chromeの拡張機能では、ユーザーがFLoC IDを公開するかどうかをコントロールすることはできません。

また、ウェブサイト側も、オプトインを求められていません。

FLoCは、ユーザーの閲覧履歴に基づいてラベルを計算します。今回の試験では、Googleは、ウェブ上の大半のサイトである、広告を提供するすべてのウェブサイトをデフォルトで使用します。サイトは、HTTPヘッダーを送信することで、FLoCの計算に含まれないようにすることができますが、ホスティングプロバイダーの中には、顧客がヘッダーを直接コントロールできないところもあります。多くのサイトオーナーは、この試みを全く知らないかもしれません。

これは、訪問者のデータをどのように処理するか、サイトがコントロールできなくなることを意味するため、問題です。今のところ、サイト管理者は、広告主のコードを自分のページに掲載することを意識的に決定しなければなりません。サイトは、少なくとも理論上は、プライバシーポリシーに基づいて広告主との提携を選択することができます。しかし今後は、ユーザーがそのサイトを訪れた際の情報がFLoC IDに包まれ、広く公開されることになります(詳しくは次項で)。たとえ、そのサイトがしっかりとしたプライバシーポリシーを持ち、責任ある広告主との関係を築いていたとしても、そのサイトへの訪問が、他の場面でのトラッカーの見方に影響を与える可能性があります。

各ユーザーのFLoC ID(過去1週間の閲覧履歴を反映したラベル)は、必要とするウェブサイトやトラッカーが利用できるようになります。

Chromeのオリジン・トライアルには誰でもサインアップできます。その後は、JavaScriptを実行できるときはいつでも、トライアルに選ばれたユーザーのFLoC IDにアクセスできます。これには、ほとんどの広告配信サイトにアクセスするたびにブラウザが接続する、名もなき広告主の広大なエコシステムが含まれます。あなたがトライアルに参加している場合、数十社の企業が、あなたが訪問する各サイトからあなたのFLoC IDを集めることができるかもしれません。

想定されるコホートは33,000を超えます。

FLoCの仕様の中で最も重要な部分のひとつは、コホートの数が正確に定義されていないことです。Googleは、8ビットのコホートIDを使って予備的な実験を行ったが、その結果、可能なグループ数はわずか256であった。これにより、トラッカーがユーザーのコホートIDから得られる情報量は限られたものになりました。

しかし、最新版のChromeを調べてみると、ライブ版のFLoCでは50ビットのコホートIDが使われていることがわかった。このコホートは、Googleの最初の実験に比べて100倍以上多い、合計33,872個のコホートにまとめられています。Googleは、各コホートに「数千人」の人々がグループ化されるようにして、コホートだけでは誰も特定できないようにすると述べている。しかし、コホートIDは、15ビット程度の多くの新しい情報を公開することになり、指紋採取者に大きなアドバンテージを与えることになります。

この試験は7月まで行われる予定です。

トラッカー、広告主、その他のサードパーティは、GoogleのOrigin Trialポータルを通じてサインアップし、ユーザーからFLoCの収集を開始することができる。このページでは現在、このトライアルが7月13日まで続く可能性があることを示している。また、Googleは、コホートの計算方法など、この技術の正確な詳細は変更される可能性があることを明らかにしており、FLoCのグループ化アルゴリズムは、現在から将来にかけて何度か繰り返される可能性があります。

Googleは、FLoCが “センシティブなカテゴリー “と相関しているかどうかを監査する予定です。まだまだ大局を見失っています。

Googleは、コホートが人種、セクシュアリティ、病状などの「センシティブなカテゴリー」との相関が強すぎないようにすることを約束している。これを監視するために、Googleは各コホートのユーザーがどのサイトを訪れているかというデータを収集する予定です。Googleは、その方法を説明したホワイトペーパーを公開しています。

具体的な提案がなされたことは喜ばしいことですが、このホワイトペーパーでは、最も差し迫った問題が回避されています。Googleが取り組むべき問題は、「脆弱なグループに属する人々をターゲットにできるか」ということですが、ホワイトペーパーではこれを「特定のサイトを訪れた人々をターゲットにできるか」に下げています。これは、危険なほど単純化しすぎています。Googleは、難しい問題に取り組むのではなく、自分たちが解決できると信じている簡単なバージョンに焦点を当てることを選択しました。その一方で、FLoCの潜在的な最悪の害には対処していません。

試験期間中、「Chrome Sync」(Googleに閲覧履歴を収集させる)をオンにしていて、いくつかあるデフォルトの共有設定をいずれも無効にしていないユーザーは、閲覧履歴に付随するコホートIDをGoogleと共有することになる。

そしてGoogleは、各ユーザーが “センシティブ・カテゴリー “に属すると思われるサイトを閲覧したかどうかを確認します。例えば、WebMDは “メディカル “カテゴリーに、PornHubは “アダルト “カテゴリーに分類されます。ある集団の中で、特定の種類の「センシティブ」なサイトを閲覧したユーザーがあまりにも多い場合、Googleはその集団をブロックします。センシティブ」なコホートに含まれるユーザーは、代わりに「空」のコホートに入れられる。もちろん、トラッカーは、そのユーザーが「空」のコホートに含まれていることを確認でき、そのユーザーがもともと何らかの「センシティブ」に分類されていたことがわかります。

今回の実験では、Google社が保有する膨大なパーソナライズドブラウジングデータのキャッシュを利用して監査を行っている。将来的には、他のプライバシー保護技術を用いて、個人の閲覧履歴を知らずに同じことを行うことを計画している。

グーグルがどのようにするかにかかわらず、この計画は、FLoC、差別、プレダトリー・ターゲティングの大きな問題を解決するものではありません。この提案は、「センシティブなカテゴリー」に属する人々が特定の「センシティブな」ウェブサイトを閲覧し、それらのグループに属さない人々は当該サイトを閲覧しないという前提に基づいています。しかし、行動は人口統計と直感的でない方法で相関します。特定の層が、他の層とは異なるウェブのサブセットを訪れる可能性は高く、そのような行動はGoogleの「センシティブなサイト」フレーミングでは捉えられないでしょう。例えば、うつ病を患っている人は、似たような閲覧行動をとるかもしれませんが、例えば「depression.org」を訪問するような明確で直接的な行動をとるとは限りません。一方、トラッキング会社は、何百万人ものユーザーのトラフィックを収集し、それを人口統計や行動に関するデータとリンクさせ、どのコホートがどのセンシティブな特徴とリンクしているのかを解読する能力を備えています。提案されているGoogleのウェブサイトベースのシステムでは、それを阻止することはできない。

前にも述べたように、”グーグルは、監視のための古い足場を解体することを選択しても、それを新たな独自の有害なものに置き換えることはできない”。Googleは、FLoCの害に対処することも、対処できることを納得させることもできていません。それどころか、何百万人もの無防備なユーザーに関する新たなデータを共有するテストを行っています。これは間違った方向への新たな一歩です。

出典:https://www.eff.org/deeplinks/2021/03/google-testing-its-controversial-new-ad-targeting-tech-millions-browsers-heres

付記:下訳にDeepLをもちいました。

Table of Contents