Vision

アマゾンとマイクロソフトは、プライバシー法の限界を試す訴訟の中で、Flickrの写真を顔認識に利用したことを否定している

アマゾンとマイクロソフトは、プライバシー法の限界を試す訴訟の中で、Flickrの写真を顔認識に利用したことを否定している
IBM が 2019 年に公開した図。Flickr ユーザーが Creative Commons ライセンスの下でアップロードした画像を含む「顔の多様性」データセットで研究者が利用できる生体認証マーカーを示しています。

関連する2件の訴訟に直面しているアマゾンとマイクロソフトは、それぞれの顔認識技術に携わる人々が、Flickrユーザーがアップロードした100万枚の写真からまとめられたIBMの「Diversity in Faces」写真データベースをダウンロードし、その画像がAIアルゴリズムを改善するかどうかを調べたことを認めている。

両社とも、答えはノーだと主張している。

アマゾンとマイクロソフトの研究者らは2019年にそれぞれ独自に、このデータベースは顔認識技術の精度向上には役立たないと判断し、使わないことに決めたと、両社の弁護士はシアトルの連邦裁判所に提出した別々の書類で主張している。

しかし、クリエイティブ・コモンズ・ライセンスのもと、Flickrアカウントに数千枚の写真をアップロードしたシカゴ在住の男性2人は、証拠はマイクロソフトとアマゾンが書面による通知や同意なしに彼らの画像を不法に使用し、イリノイ州生体認証情報プライバシー法に基づく彼らの権利を侵害したことを示していると主張している。

そして、被害者は自分たちだけではなかったと彼らは主張している。この訴訟は集団訴訟としての地位を求めており、知らないうちにデータベースに写真が含まれていた何千人もの人々を代理することを提案している。

より大きな影響:これらの訴訟は、米国における国家レベルのプライバシー法の欠如、正確な人工知能モデルの開発に伴うトレードオフ、クラウドコンピューティングの台頭による管轄権の境界線の曖昧化など、テクノロジー業界と社会が直面している一連のより広範な問題を浮き彫りにしている。

アマゾンとマイクロソフトは、たとえデータを使用していたとしても、データが州内のサーバーにダウンロードされ保存されたという証拠がないため、イリノイ州のプライバシー法の対象にはならないと主張している。

原告らは、自分たちは州内に住んでいるのでいずれにせよこの法律は適用されると反論している。

写真はクリエイティブ・コモンズ・ライセンスに基づいてアップロードされていたが、原告側の弁護士は、商業利用を禁止し、画像の出典を明記することを要求するライセンスのバージョンを使用していたと主張している。

新たな主張:両訴訟は2020年7月にシアトルの米国地方裁判所に提起されたが、最近の提出書類には、証拠開示の過程で両社が提出した証言や文書に基づく新たな主張が追加されている。

原告側の弁護士であるイリノイ州ティンリーパークのスティーブン・バンス氏とティム・ジャネシック氏は先週提出した2つの書類の中で、アマゾンとマイクロソフトの従業員らがデータベースに関して、両社が当初明らかにした以上の行為を行っていたと主張した。

原告らは、アマゾン ウェブ サービスの研究科学者らが写真から得た「生体認証データを広範に利用した」とし、同社の主張は「事実記録の歪曲に基づいている」と主張している。

マイクロソフトによるデータベースの使用は「相当なもの」であり、「データセットに含まれるメタデータの使用、そこにリンクされている100万枚の写真のすべてをダウンロードし、それらの顔のサブセットに対して顔認識技術を実行し、買収を検討していた別の顔認識システムの評価に使用する可能性などを含むが、これらに限定されない」と彼らは主張している。

最近の裁判所の書類における編集の例。この例では、Amazon の Rekognition テクノロジーについて言及しています。

しかし皮肉なことに、マイクロソフトとアマゾンは裁判所を説得して、自分たちにも一定のプライバシーを与えた。最新の裁判所文書の公開版では、原告が証拠開示手続きで得た情報を明らかにする可能性のある文章が削除されており、表向きは企業秘密の漏洩を防ぐためだ。

プライバシーと精度: Amazon と Microsoft に対する訴訟、およびイリノイ州の IBM とカリフォルニア州の Google に対する関連訴訟は、大量のデータを必要とする AI モデルの開発におけるプライバシーと精度のトレードオフを示しています。

IBMは当初、性別や肌の色を超えて人工知能をより公平かつ公正なものにすることを目標に掲げ、2019年1月に「Diversity in Faces」データベースをリリースした。

「100万枚の顔画像からなる大規模なデータセットから顔コーディング方式の注釈を抽出し公開することで、AI顔認識システムのデータの多様性と範囲の研究を加速し、より公平で正確なAIシステムを実現できると考えています」と同社は当時述べていた。

顔認識の大きな課題により、業界全体の企業が撤退することになった。

  • 偏見と不正確さが明らかになった後、IBMは2020年に汎用顔認識技術を廃止した。
  • その後、アマゾンとマイクロソフトは両社とも、法執行機関への顔認識ツールの販売を停止した。
  • 最近の発表では、マイクロソフトはさらに踏み込み、より広範な AI 原則の一環として、顔認識の使用に新たな制限と制御を設けることを約束した。

IBMはThe Vergeに対し、データベースには公開されている画像のみが含まれており、認証された研究者のみがアクセスでき、個人はデータセットへのアクセスを拒否できると語ったという。

裁判所の書類によると、写真の不一致が、データベースがマイクロソフトとアマゾンにとって役に立たなかった理由の一つだった。被写体はそれぞれ異なる方向を向いており、距離や角度も様々だった。

国家レベルのプライバシー法の欠如:この訴訟は、ある州のプライバシー法の適用範囲を試すものであり、国家レベルのプライバシー法が存在しない中で生まれた州法の寄せ集めによって生じた複雑さを浮き彫りにしている。

ワシントン州選出の民主党下院議員スーザン・デルベーン氏が昨年提出した全国的なプライバシー法案「情報の透明性と個人データ管理法」は、デルベーン氏が言うところの「各州のプライバシー法の寄せ集め」を避けることを目指していた。

米国下院議員スーザン・デルベーン氏が国家プライバシー法案を提出した。(GeekWire ファイル写真 / トッド・ビショップ)

しかし、この法案は顔認識という重要な問題への対処には至りませんでした。元マイクロソフト幹部のデルベネ氏は当時、この法案が基本的なプライバシー法として成立し、より複雑な問題は将来に残される可能性が高まることを期待すると述べていました。しかし、結局法案は頓挫しました。

マイクロソフトやアマゾンは、全国で一貫した規則を定める国家プライバシー法の制定を求めている企業の一つである。

クラウド時代の法的管轄権:マイクロソフトは裁判所への提出書類の中で、同社の契約社員とインターン生がワシントン州とニューヨーク州からIBMの「DiF」データセットをダウンロードし、「マイクロソフトの研究目的には役に立たないことをすぐに判断し、何にも使用しなかった」と述べています。

同社は、仮に契約社員やインターン生がデータベースの暗号化された部分をOneDriveにアップロードしていた場合、シカ​​ゴのデータセンターに保存されていた可能性があることを認めている。しかし、同社は「DiFデータセットがOneDriveに保存されたと信じる理由はない」と述べている。

たとえデータベースの一部がイリノイ州に保管されていたとしても、同社は、同州のプライバシー法の関連条項は「イリノイ州で主かつ実質的に行われた行為によるデータ取得のみを規制しており、取得後の断片化されたデータの暗号化された保管は規制していない」ため、法的管轄権は生じないと主張している。

この問題に関するアマゾンの弁明はもっと単純で、データベースはワシントン州とジョージア州の研究者によってダウンロードされ、オレゴン州のアマゾン ウェブ サービス米国西部地域にアップロードされたと主張している。

原告側の弁護士は、この問題に関して両社に反対し、別のFacebookに対する訴訟における第9巡回控訴裁判所の判決を引用し、州議会は「たとえ州外で何らかの関連活動が行われたとしても」この法律をイリノイ州住民に適用することを意図していたと「推論するのが合理的」であると述べた。

訴訟の行方は、管轄権に関する裁判所の見解に左右される可能性がある。マイクロソフトとアマゾンはそれぞれ、シアトルの連邦地方裁判所のジェームズ・ロバート判事に略式判決を求める申し立てを行っている。

裁判所提出書類:これらの訴訟は、Vance v. Amazon.com Inc (2:20-cv-01084) および Vance v. Microsoft Corporation (2:20-cv-01082) です。Microsoft、Amazon、および原告からの最新の申立てと回答は以下の通りです。

  • マイクロソフトの略式判決申立て、2022年5月
  • マイクロソフトの申し立てに対する原告の反対、2022年7月
  • アマゾンの略式判決申立て、2022年5月
  • アマゾンの申し立てに対する原告の反対、2022年7月