Airpods

科学者たちは、人工知能がいかにして人間特有の偏見を吸収するかに焦点を当てている

科学者たちは、人工知能がいかにして人間特有の偏見を吸収するかに焦点を当てている

アラン・ボイル

人工知能のバイアスのデモンストレーション
プリンストン大学の研究者アイリン・カリスカン氏が、Googleの自動翻訳プログラムがジェンダーバイアスの兆候を示していることを実証した。(プリンストン大学、YouTube / アーロン・ネイサンズ経由)

人工知能ソフトウェアが人種や性別に関する人間の偏見を吸収するという新たな証拠があり、それは言語の構造そのものによるものかもしれない。

科学者たちは、AIが分析したテキスト内の単語に関連する肯定的および否定的な意味合いを評価する統計システムを作成した後、この結論に達しました。

暗黙連合テスト(IAT)として知られる同様のシステムでは、人間は、はっきりと認めていなくても、異なる人種や男性と女性の相対的地位に関して偏見を抱いていることが示唆されている。

プリンストン大学のアイリン・カリスカン氏とその同僚は、IATを改良したテキスト分析ツール「Word-Embedding Association Test(WEAT)」を開発しました。彼らは、この手法とその応用について、本日サイエンス誌に掲載された研究論文で説明しています。

WEATは、与えられた単語とその周囲の単語との関連性を調べ、埋め込まれた単語が快い意味合いを持つか不快な意味合いを持つかを判断します。例えば、分析の結果、花は昆虫よりも快い意味合いを持ち、楽器は武器よりも快い意味合いを持つことがわかりました。

次に研究者らは、インターネットから収集した約220万語のテキスト本文を使用して、ヨーロッパ系アメリカ人と見なされる名前とアフリカ系アメリカ人に特徴的な名前を比較して統計分析を行った。

WEAT分析では、人間に相談することなく、ヨーロッパ系アメリカ人の名前は「幸せ」や「贈り物」など楽しい言葉と関連付けられる可能性が高いことがわかった。

ジェンダー面では、研究者たちはWEFAT(Word-Embedding Factual Association Test)と呼ばれる、少し異なる統計ツールを使用しました。彼らは、異なる種類の単語と男性語と女性語(例えば、「男性」と「女性」、「彼」と「彼女」、「男の子」と「女の子」)との関連性を調べました。

分析の結果、女性を表す言葉や伝統的な女性の名前は、「両親」や「結婚」といった家族関連の言葉と結びつく可能性が高かったことが示されました。男性を表す言葉や名前は、「職業」や「給料」といったキャリア関連の言葉とより強い結びつきを示しました。

研究者らは仕事や研究のさまざまな分野についても詳しく調査し、女性を表す言葉や名前は芸術とより密接に関連しているのに対し、男性を表す言葉は数学や科学とより密接に関連していることを発見した。

一例として、Google翻訳をトルコ語のフレーズから英語への自動翻訳に適用した例を挙げます。トルコ語には性中立の三人称代名詞(「o」)があります。しかし、性中立の文(例えば「O bir doktor」や「O bir hemşire」)をトルコ語から翻訳すると、英語の同義語は「彼は医者です」や「彼女は看護師です」となってしまいました。

AIと偏見に関する外部の専門家は、この研究は研究の新たな領域を示していると述べた。

「この論文は、機械学習の手法が数学やアルゴリズムに依存しているからといって『客観的』でも『偏りがない』わけでもないという重要な点を改めて強調しています」と、ニューヨーク市にあるマイクロソフト・リサーチのシニアリサーチャー、ハンナ・ウォラック氏はニュースリリースで述べた。「むしろ、社会のデータを用いて学習され、社会に偏りがある限り、これらの手法はそうした偏りを再現する可能性が高いのです。」

約20年前に潜在連合テストの開発に携わったワシントン大学の心理学者アンソニー・グリーンウォルド氏は、サイエンス誌の論評で、新たな研究結果は「IATが明らかにする潜在的偏見の源は言語にあるかもしれない」ことを示唆していると述べた。

彼は、別の説明も可能だと述べた。例えば、両方の分析ツールで測定されたバイアスは、言語以外の社会的要因や文化的要因によるものである可能性がある。しかしいずれにせよ、グリーンウォルド氏は、今回の発見は、人間や人工知能プログラムが言語を処理する方法の「バイアスを解消する」という課題をさらに深めるものだと述べた。

計算によるバイアス除去は必然的に意味の喪失を伴い、性別はAIによるテキスト分析においてバイアス除去が可能な要素の一つに過ぎません。人種、肌の色、宗教、国籍、年齢、性別、妊娠、家族状況、障がいの有無といった法的に保護された分類を同時にバイアス除去する過程で、どれほどの有用な意味が失われる可能性があるでしょうか?AIによる判断のバイアス除去は、未だ解決されていない人間の判断のバイアス除去よりも扱いやすいものになることを期待します。

Caliskan に加えて、「言語コーパスから自動的に導き出された意味論には人間のようなバイアスが含まれる」の著者には、Joanna Bryson と Arvind Narayanan が含まれています。