(EFF)すべてを支配する1つのデータベース：オンラインでの表現の自由を損ねる目に見えないコンテンツカルテル

Created On2021年8月23日

Last Updated On2021年8月31日

bytoshi

以下はEFFのウエッブ記事の翻訳です。

A striped cat opines using a megaphone.

by svea windwehr and jillian c. yorka August 27, 2020

毎年、テロリストや暴力的過激派のコンテンツが含まれているとされる画像や動画、投稿が、YouTubeやFacebook、Twitterなどのソーシャルメディアから何百万も削除されています。これらの削除の背景には、「テロリストや暴力的過激派がデジタルプラットフォームを悪用するのを防ぐ」ことを目的とした業界主導の取り組みである「テロ対策に関するグローバル・インターネット・フォーラムGlobal Internet Forum to Counter Terrorism（GIFCT）」があります。そして残念なことに、GIFCTは特定のコミュニティの表現の自由に大きな（そして不均衡な）悪影響を与える可能性があります。

ソーシャルメディアのプラットフォームは、自社のプラットフォーム上にある過激派や暴力的なコンテンツの問題に長い間悩まされてきました。プラットフォームは、ユーザーに不快なコンテンツのないオンライン環境を提供することに本質的な関心を持っているのかもしれません。そのため、ほとんどのソーシャルメディア・プラットフォームの利用規約には、さまざまな言論規定が含まれています。しかし、この10年間、ソーシャルメディア・プラットフォームは、世界中の政府から、プラットフォーム上の暴力的・過激なコンテンツに対応するよう圧力を受けてきました。2015年と2016年にそれぞれパリとブリュッセルで起きたテロ事件によって拍車がかけられ、検閲が過激主義に対する有効な手段であるという近視眼的な信念に導かれて、各国政府は国際テロを解決する手段としてコンテンツ・モデレーションに目を向けています。

商業的なコンテンツモデレーションとは、プラットフォーム、具体的には人間のレビュアーや、非常に多くの場合は機械が、利用規約や「コミュニティスタンダード」などのルールに基づいて、サイトに掲載できるコンテンツと掲載できないコンテンツを決定するプロセスのことです。

コロナウイルスの大流行の中、ソーシャルメディア企業は、人間のコンテンツレビュアーを使うことができなくなり、代わりに機械学習アルゴリズムに依存して、コンテンツの選別やフラグを立てることが多くなっています。アルゴリズムとは、実際に何かを行うための指示書のようなもので、最初にルールを設定し、類似したコンテンツが識別できるようになることを期待して多くの学習データを与えます。しかし、人間の会話は複雑な社会現象であり、文脈に大きく依存しているため、必然的にコンテンツモデレーションアルゴリズムはミスを犯します。さらに悪いことに、機械学習アルゴリズムは通常、どのようにして判断に至ったかを説明しないブラックボックスとして動作し、企業は通常、自社技術の基礎となる基本的な仮定や学習データセットを共有しないため、第三者はこれらのミスをほとんど防ぐことができません。

この問題は、過激派コンテンツを追跡・削除するためのハッシュデータベースの導入により、より深刻になっています。ハッシュとは、企業が自社のプラットフォームからコンテンツを識別して削除するために使用する、コンテンツのデジタル「指紋」のことです。ハッシュは基本的に固有のものであり、特定のコンテンツを容易に識別することができます。ある画像が「テロリストコンテンツ」と認定されると、その画像にハッシュが付けられてデータベースに登録され、今後同じ画像がアップロードされても簡単に特定できるようになります。

これこそがGIFCTの目的です。企業が自主的に提供した「テロリスト」と疑われるコンテンツの膨大なデータベースを、フォーラムのメンバー間で共有するのです。このデータベースでは、コンテンツそのものではなく、「テロリスト」「過激派」「暴力的」とされるコンテンツの「ハッシュ」（固有の指紋）を収集します。GIFCTのメンバーは、このデータベースを利用して、ユーザーがアップロードしようとするコンテンツがデータベース内の素材と一致するかどうかをリアルタイムにチェックすることができます。これは、テロリストのコンテンツを正しく識別して削除するという困難な作業を効率的に行うためのアプローチのように聞こえますが、それは同時に、何が許容される言論で、何が削除されるのかを決定するために、1つのデータベースがインターネット全体で使用される可能性があることを意味します。

数え切れないほどの例が、人間の審査員にとっても、アルゴリズムにとっても、アクティビズム、対抗言論、過激なコンテンツのニュアンスを一貫して正しく把握することは非常に難しいことを証明しています。その結果、正当な言論の多くがテロリストのコンテンツとして誤って分類され、ソーシャルメディアのプラットフォームから削除されてしまうのです。GIFCTデータベースが普及しているため、動画や写真、投稿を誤って「テロリスト」コンテンツと分類すると、ソーシャルメディアのプラットフォーム全体に影響が及び、ユーザーの表現の自由の権利が一度に複数のプラットフォームで損なわれてしまいます。そしてそれは、記憶や記録の場としてのインターネットに、壊滅的な影響を与えることになります。不正確なコンテンツ・モデレーション・システムは、人権侵害や戦争犯罪の証拠など、他では入手できない重要な情報を削除してしまう可能性があります。例えば、シリア戦争中に行われた残虐行為の証拠を収集、共有、保管することを目的としたNGOであるSyrian Archiveは、戦争中の残虐行為を撮影したビデオがYouTubeによって年間数十万本削除されていると報告しています。同アーカイブによると、シリアの人権侵害を記録した動画の削除率は約13％で、コロナウイルス問題をきっかけに約2倍の20％にまで上昇しているといいます。前述のとおり、YouTubeを含む多くのソーシャルメディアでは、アルゴリズムを用いたコンテンツ・モデレーションが通常よりも頻繁に行われており、その結果、ウェッブの削除が増加しています。もしYouTubeが、シリアの人権侵害を描いているにもかかわらず、YouTubeのアルゴリズムによって「テロリスト」コンテンツとしてタグ付けされたコンテンツのハッシュをGIFCTデータベースに投稿した場合、そのコンテンツが複数のプラットフォームで永遠に削除されてしまうかもしれません。

GIFCTのコンテンツカルテルは、貴重な人権文書を失うリスクがあるだけでなく、一部のコミュニティに不均衡な悪影響を与えます。「テロリズム」を定義することは、本質的に政治的な仕事であり、時空を超えて確定されることはまずありません。何がテロリストなのか、あるいは暴力的で過激なコンテンツを構成するのかについて国際的な合意がないため、企業は国連の指定テロリスト組織リストや米国国務省の外国人テロリスト組織リストを参照します。しかし、それらのリストは主にイスラム教組織を対象としており、例えば右翼過激派グループなどはほとんど見のがされます。つまり、GIFCTの誤分類による負担は、イスラムやアラブのコミュニティに偏っており、ネット上の最悪のコンテンツに対処するための効果的な取り組みと、徹底的な検閲との間の微妙な境界線を浮き彫りにしています。

2019年3月にクライストチャーチの2つのモスクが襲撃されて以来、GIFCTはこれまで以上に注目を集めています。51人が犠牲になったこの銃撃事件を受けて、フランスのエマニュエル・マクロン大統領とニュージーランドのジャシンダ・アーダーン首相は「クライストチャーチ・コール」を立ち上げました。このイニシアチブは、オンライン上の暴力的、過激なコンテンツを排除することを目的としたもので、GIFCTが重要な役割を果たすことが期待されています。こうしたGIFCTへの再注目を受けて、GIFCTは、市民社会、政府、政府間機関の声を代表する独立諮問委員会（IAC）を新たに設置するなど、独立した組織へと進化することを発表しました。

しかし、実権を握る運営委員会は、依然として産業界の手中にあります。また、独立諮問委員会は、市民的自由の団体の連合体が繰り返し指摘しているように、すでに重大な欠陥を抱えています。

例えば、IACに参加している政府は、その立場を利用して、企業のコンテンツモデレーション方針に影響を与えたり、テロリストコンテンツの定義を自分たちの利益に合うように形成したりする可能性が高く、世間の目から離れているため、説明責任を果たすことができません。また、IACに政府を含めることは、多くの市民社会組織が財政的に政府に依存していたり、フォーラムで政府高官を批判することで報復の脅威にさらされる可能性があるため、市民社会組織の有意義な参加を妨げることにもなりかねません。市民社会が後回しにされている限り、GIFCTは効果的なマルチステークホルダー・フォーラムにはなりません。GIFCTの欠陥と、それが表現の自由や人権、戦争犯罪の証拠保全に与える壊滅的な影響は、何年も前から知られていました。市民社会団体は組織の改革を支援しようとしましたが、GIFCTとその新しい事務局長は無反応のままです。このことは、IACの最後の問題につながります。主要なNGOがまったく参加しないことを選択しているのです。

その結果、GIFCTと、GIFCTの政策が影響を与える何百万人ものインターネットユーザーはどうなるのでしょうか。良いことなどはありません。意義ある市民社会の代表と参加、完全な透明性と効果的な説明責任のメカニズムがなければ、GIFCTは、マルチステークホルダー主義を約束しながら、政府に認められた粉飾決算以上のものを提供しない業界主導のフォーラムになってしまう危険性があります。

訳注：「テロ対策に関するグローバル・インターネット・フォーラム（Global Internet Forum to Counter Terrorism：GIFCT）」についての日本の外務省の説明は以下の通り
（1）インターネット上のテロリズムや暴力的過激主義の拡散を共同で防止する目的で設立されたIT企業によるフォーラム。2017年に，Facebook, Microsoft, Twitter, YouTube（Google）の4社で立ち上げ。共有ハッシュデータベース作成・運用の効率化，テロ関連情報検知技術に関するベストプラクティスの共有等，テロリストによるサイバー空間の悪用への対応を議論。中小事業者への技術支援も実施している。
（2）クライストチャーチ・コール宣言（CCA）やG20での議論を踏まえ，GIFCTは，活動強化のため組織改革や活動の見直しを行うこととし，23日に開催されたリーダーズ・フォーラムにおいて，各国政府や市民社会からの要請に応えられるよう，企業のコンソーシアムから，専門のスタッフを有する独立組織に改組することを発表した。
（3）組織改革の一環として，近く，各国政府・国際機関及び市民社会からの代表から成る「Advisory Committee（諮問委員会）」の結成が予定されており，9月23日時点で我が国, 米国，英国，フランス，カナダ，ニュージーランドや国連，EUが参加する旨，GIFCTが発表している。https://www.mofa.go.jp/mofaj/fp/is_sc/page25_001966.html

出典：One Database to Rule Them All: The Invisible Content Cartel that Undermines the Freedom of Expression Online https://www.eff.org/deeplinks/2020/08/one-database-rule-them-all-invisible-content-cartel-undermines-freedom-1

付記：下訳にhttps://www.deepl.com/ja/translatorを用いました。

Howdy! How can we help you?

(EFF)すべてを支配する1つのデータベース：オンラインでの表現の自由を損ねる目に見えないコンテンツカルテル