
マイクロソフトリサーチの責任者ピーター・リーが、医学と生命科学におけるGPT-4の応用について語る

Peter Lee 氏は最近、OpenAI がパートナーの Microsoft の協力を得て構築した、人間の会話をシミュレートする AI 搭載ツールである GPT-4 に多くの時間を費やしています。
「数週間、睡眠不足でした」と、リー氏は月曜日にワシントン大学で行われた講演で語った。「本当に大変でした」
マイクロソフトリサーチの責任者であるリー氏は、このツールが医療に及ぼす影響を評価する任務を負っています。彼は、このツールが医療システムの効率性、さらには共感性を高め、生物医学研究を促進する可能性があると考えています。
GPT-4には「驚くべき能力」があるとリー氏は講演で述べた。そして医療分野においては、「非常に有用なツールとなる可能性を秘めている」という。
リー氏と彼の同僚は、木曜日に発表されたニューイングランド・ジャーナル・オブ・メディシン(NEJM)誌の記事で、いくつかの潜在的な活用例を概説した。これには、診断の支援、医師と患者間のコミュニケーションの改善、オンライン上の書類処理の削減などが含まれる。
「医師や看護師の書類作成の負担は本当にひどい」とリー氏はGeekWireとの別のインタビューで語った。あらゆるアプリケーションの中で、彼が最も重視しているのは、医療文書作成などの負担軽減だ。
GPT-4チャットボットは、医療情報源を含むインターネット上の膨大な公開情報に基づいて学習されました。このツールは、米国の医師免許試験の試験問題に90%以上の確率で正答します。
しかし、限界もある。GPT-4はクエリに対してしばしば誤った回答を「幻覚」のように提示する。こうした誤りは微妙で、ユーザーが見分けるのが難しい場合があるとリー氏は述べた。例えば、医師の診断書で計算を通常の四捨五入ではなく切り捨ててしまうことなどがその例だと、リー氏はワシントン大学で示した。GPT-4はまた、自信過剰を装うこともある。
リー氏と共著者らはNEJM誌の記事の中で、医療現場では誤りと確信の組み合わせが「危険」になり得ると述べている。NEJM誌の付随論説では、医学的背景を持たない人はGPT-4に騙されやすい可能性があると指摘されている。
しかし、GPT-4は自身の出力をレビューするよう求められた場合、誤りを修正する能力も備えている。そして、その過程でいくつかの癖が明らかになった。リー氏によると、以前のGPT-4のバージョンは、自身の回答に「感情的に執着する」傾向が強かったという。
外部の研究者たちは、GPT-4の内部構造を理解するのは難しいと述べています。OpenAIは、その基盤となるアルゴリズムや学習プロセスについてほとんど詳細を明らかにしていません。しかし、リー氏のようにGPT-4の仕組みをよく理解しているコンピューター科学者でさえ、GPT-4の思考方法を理解しようと努力を続けています。
「これらの機能がどのようにして、そしてなぜ登場したのか、私たちには理解できません」とワシントン大学のリー氏は述べた。GPT-4は、OpenAIの無料チャットボットに搭載されているGPT-3.5とは「全く異なるもの」だとリー氏は述べた。
スタートアップ企業もこの分野に参入し、GPT-4を自社の能力強化に活用しています。「スタートアップ企業にとって、GPT-4を導入した世界で、自社の既存の価値提案がどれほど通用するかを理解することはおそらく重要でしょう」とリー氏はGeekWireに語りました。さらに、「これはスタートアップ企業だけでなく、マイクロソフト社内の自社製品にも当てはまることです」と付け加えました。
リー氏はさらに先を見据えている。OpenAIは、画像解析が可能なGPT-4版のリリースを準備している。ワシントン大学のリー氏は、長期的にはこうしたモデルが病理学や医用画像データの評価に役立つ可能性があると述べた。さらに、「GPT-4は破壊的なものではありません。次に登場してくるモデルなのです」と付け加えた。
リー氏は同僚らと共同でその影響を深く探究した著書「医療におけるAI革命:GPT-4とその先」を近々出版する予定で、木曜日のポッドキャストにも出演した。
医療分野での使用例と、Lee による GPT-4 の思考プロセスに関するヒントについては、以下をお読みください。
ヘルスケア文書
医師は患者との面談記録に毎日何時間も費やすことがよくあります。リー氏によると、GPT-4はそうした負担を解消するのに役立つ可能性があります。このツールは、請求コードを添付した様々な形式で診療記録を要約できるとリー氏は述べています。マイクロソフトの子会社であるNuanceは、医療データでトレーニングされた医療記録作成システムにGPT-4を既に組み込んでおり、今夏にアプリケーションのプレビュー版をリリースする予定です。
最近AI搭載のチャットボット「Bard」をリリースしたGoogleも同様に、患者の病状を要約するツールを開発した。
GPT-4 のその他の潜在的な使用例としては、臨床検査や処方箋の注文の生成、事前承認リクエストのテキストの記入などがあります。
GPT-4のような大規模言語モデルは「医療文書作成における長年の課題を解決しようとしています」とリー氏は講演の中で述べた。多くの企業がGPT-4を活用して、そのような目的のためのツールを構築するだろうと付け加えた。
GPT-4チャットボットは、患者に安心感とサポートを与えるための言葉遣いを提案することにも長けています。「診察室にいるのがどんな感じかといった状況を想像することができます」とリー氏は講演の中で述べました。「世界の仕組みを理解している兆候が見られます。」

医療診断
リー氏によると、チャットGPT-4は、症状に合致する可能性のある疾患をリストアップし、それらをランク付けすることで、医師の鑑別診断にも役立つ可能性があるという。彼は、医師たちが同僚とアイデアを交換するような形でこのツールを活用していると考えている。
データの相互運用性
医療データは異なる形式や異なるシステムに分散しており、臨床記録へのアクセスを望む患者や臨床医、そしてそれらを研究したい研究者にとって大きな障害となっています。Lee氏は、GPT-4は形式変換をサポートするのに役立つと述べています。
研究論文
科学者たちは、科学論文の執筆を支援するために大規模言語モデルを使い始めています。「私が経験した中で最も素晴らしいやり取りの一つは、GPT-4に医学研究論文を読んでもらい、それについて会話をさせた時です」とリー氏は講演で述べました。
マイクロソフトの新しい検索エンジン「Bing」はGPT-4と連携しており、科学的なクエリに対して要約を提供します。Bingは、インターネットから切り離されたスタンドアロンのチャットボットよりも、関連性のない科学的な参考文献を幻覚的に提示する頻度が低いとリー氏は述べています。
科学研究の分かりやすい要約を提供するスタートアップ企業Consensusは、すでにGPT-4をサービスに追加しています。また、Microsoftは最近、研究論文で学習した大規模言語モデルであるBioGPTのデモ版をリリースしました。
生物医学研究
リー氏によると、ユーザーはGPT-4に、既存の様々な研究アプリケーションを単一のAIアシスタントにまとめるよう指示できるという。アシスタントはアプリケーションに接続されたデータを活用し、フォーマットを標準化することで、分析や新しい機械学習モデルのトレーニングを容易にすることができる。
リー氏は、GPT-4モデルを特定の生物学的データセットで微調整し、最終的には大規模なニューラルトランスフォーマーを用いてタンパク質構造を予測することを構想している。リー氏はGeekWireに対し、マイクロソフトはDeepMindが開発した高く評価されているシステムであるAlphaFoldと同様のタンパク質構造予測能力を見出していると語っている。
「研究者がより多くの成果を上げるのに役立つ、本当に便利なツールが登場すると思います」とリー氏はGeekWireに語った。
機械の心
GPT-4は数学、統計、論理の面で「あなたより賢く、そしてあなたより愚か」だとリー氏は講演の中で述べた。
GPT-4は数独パズルを解くのに苦労します。なぜなら、数独パズルはバックトラックと解答の再評価を必要とするからです。GPT-4は「フィードフォワード」ツールです。「これは人間とは違います。異なる種類の知能です」とワシントン大学のリー氏は語りました。
マイクロソフトの研究者たちは、ニューラルネットワークを言語テキストで訓練すると、特定の数学の問題をより良く解けるようになることを発見したと、リー氏はGeekWireに語った。「これは不思議で奇妙なことです」と彼は述べた。この発見は人間の知能にも影響を与える。リー氏はこう述べた。「私たちの脳は言語のためにハードワイヤードされているため、私たちが気づいていない数学の形態があるのでしょうか?」
リー氏はGeekWireに対し、タンパク質構造のようなデータでモデルを学習させることで、人間の頭では想像しにくいアルゴリズムや回路を生み出せる可能性があると語った。その結果は、人間の論理の盲点やコンピューターの思考への洞察を明らかにする可能性がある。「これらは、コンピューターサイエンスが取り組んでいる謎のようなものなのです」とリー氏は述べた。