Ipad

AI vs. 医師: マイクロソフトのAIツールは複雑な症例の診断で医師を上回る

AI vs. 医師: マイクロソフトのAIツールは複雑な症例の診断で医師を上回る

リサ・スティフラー

CATスキャン画像。(国立がん研究所写真、Unsplash経由)

マイクロソフトは本日、複雑な症例の診断において医師団よりも優れた成績を収めた人工知能ツールを発表した。

Microsoft AI Diagnostic Orchestrator(MAI-DxO)は、ニューイングランド・ジャーナル・オブ・メディシン誌に掲載された複雑な症例を扱った、米国と英国の経験豊富な医師21名と対決しました。MAI-DxOはテストケースの85.5%で正確な診断を下しましたが、医師の診断は20%の確率で的中しました。

このツールはまだ臨床使用には利用できません。

「私たちは医療におけるスーパーインテリジェンスに向けて大きな一歩を踏み出しています」とマイクロソフトAIのCEO、ムスタファ・スレイマン氏はLinkedInの投稿で述べた。

Microsoftは、GPT、Llama、Claude、Gemini、Grok、DeepSeekといった著名なAIモデルとこのツールを使用しました。最適な組み合わせは、MAI-DxOとOpenAIのo3を組み合わせたものでした。

MAI-DxOは、人間の医師のように、症状を分析し、質問を行い、医療検査を推奨することで診断を行います。その重要な特徴は、医療費の過剰支出につながる不要な診断の発注を防ぐことで、コストを最適化する能力です。

MAI-DxO は医療提供者を上回る成績を収めたが、通常の状況では医師は孤立して手術を行うことはなく、同僚やオンラインおよび印刷されたリソースを参照できるとテクノロジー企業は認めた。

新しい診断パフォーマンスのベンチマークは、ニューイングランド・ジャーナル・オブ・メディシン誌に記録された最近の 304 件の症例から作成されました。

このツールは、米国医師免許試験(USMLE)の標準試験でAIボットに質問し、医療分野におけるAIの性能を検証した以前のテストに基づいています。マイクロソフトによると、AIツールは試験でほぼ満点を獲得できるほど進化しているものの、多肢選択式の問題構成は「深い理解よりも暗記を優先する」傾向があるとのことです。

マイクロソフトのブログ投稿によると、複雑な症例を使用する新しいベンチマークでは、「現実世界の医療上の意思決定の基礎となる連続的な診断」を実行するための高次のスキルが求められる。

このツールを一般向けに開発するための次のステップには、より一般的な疾患に対する能力の試験が含まれます。医療現場での導入には、臨床現場での安全性と性能の試験と規制当局の承認が必要になります。

マイクロソフト AI のヘルス担当副社長ベイ・グロス氏は、LinkedIn の投稿でこの取り組みについて、「[大規模言語モデル] システムが、専門医が毎日使用しているのと同じ段階的な推論と議論のプロセスに従うことで、医学の最も複雑な診断上の課題を克服できることを示す概念実証」と説明しました。

他の AI アプリケーションと同様に、マイクロソフトのリーダーたちは、ボットは人間に取って代わるものではなく、この場合、日常的なタスクの自動化、診断の支援、および個別のケア戦略の作成など、人間の成果を最適化するためのものであると強調した。

この研究の詳細は、まだ科学雑誌に掲載されていない論文で見ることができる。