
マイクロソフト、プロビデンス大学、ワシントン大学がデジタル癌診断に生成AIを活用
アラン・ボイル著

マイクロソフト、プロビデンス・ヘルス・システム、ワシントン大学の研究者らは、3万人以上の患者の組織サンプルの10億枚以上の画像を分析し、がん診断用の新しい人工知能モデルを開発したと発表した。
Prov-GigaPathとして知られるこのオープンアクセスモデルは、本日Nature誌に掲載された研究で説明されており、すでに臨床応用に使用されています。
「病理標本に含まれる豊富なデータは、Prov-GigaPathのようなAIツールを通して、人間の目では判別できない新たな関係性や洞察を明らかにすることができます」と、研究共著者でプロビデンス・ゲノミクスの最高医療責任者であるカルロ・ビフルコ氏はニュースリリースで述べています。「このモデルががん研究と診断を大きく進歩させる可能性を認識し、世界中の患者さんのために広く利用できるようにしたいと考えました。この画期的な研究に参加できることを光栄に思います。」
Prov-GigaPathの開発では、プロビデンス大学から提供された171,189枚のデジタル全スライドから得られた13億枚の病理画像タイルのパターンをAIツールを用いて識別しました。研究者らによると、これは全スライドモデリングを用いたこれまでで最大規模の事前学習であり、がんゲノムアトラスなどの他のデータセットの5~10倍の規模を持つデータベースを活用しています。
腫瘍組織の顕微鏡スライドを高解像度のデジタル画像に変換するホールスライドイメージングは、デジタル病理学において広く利用されるツールとなっています。しかし、標準的なギガピクセルのスライド1枚は、一般的な自然画像の数千倍の大きさであり、従来のコンピュータービジョンプログラムにとって課題となっています。
Microsoft の GigaPath プラットフォームは、一連の AI ベースの戦略を採用し、大規模な画像を扱いやすい 256 x 256 ピクセルのタイルに分割し、さまざまな癌のサブタイプに関連するパターンを探しました。
プロセスのもう一つのステップは、画像データを実際の病理報告書と関連付けることで、Prov-GigaPathモデルを微調整することでした。研究者たちは、OpenAIのGPT-3.5生成AIプラットフォームを用いて報告書を「クリーニング」し、がん診断に無関係な情報を削除しました。
Prov-GigaPath のパフォーマンスを評価するために、研究者らは、9 つの癌サブタイプ分類タスクと 17 の分析タスクを含むデジタル病理学ベンチマークを設定しました。
「Prov-GigaPathは26のタスクのうち25で最先端のパフォーマンスを達成し、18のタスクでは2番目に優れたモデルよりも大幅に改善されました」と、マイクロソフトの研究著者の2人、ホイフン・プーン氏と臼山直人氏は、この研究に関するブログ投稿で述べています。
プーン氏と臼山氏は、デジタル病理学に対するAI支援アプローチは「患者ケアを進歩させ、臨床発見を加速させる新たな可能性を切り開く」と述べたが、まだやるべきことはたくさんあると付け加えた。
「最も重要なことは、腫瘍微小環境のモデル化や治療反応の予測など、多くの重要な精密医療タスクにおいて、GigaPathと全スライド事前トレーニングの影響をまだ調査していないことだ」と研究者らは書いている。
Bifulco、Poon、Usuyama に加え、Nature 論文「実世界データからのデジタル病理学のための全スライド基盤モデル」の著者には、Hanwen Xu、Jaspreet Bagga、Sheng Zhang、Rajesh Rao、Tristan Naumann、Cliff Wong、Zelalem Gero、Javier González、Yu Gu、Yanbo Xu、Mu Wei、Wenhui Wang、Shuming Ma、Furu Wei、Jianwei Yang、Chunyuan Li、Jianfeng Gao、Jaylen Rosemon、Tucker Bower、Soohee Lee、Roshanthi Weerasinghe、Bill J. Wright、Ari Robicsek、Brian Piening、Sheng Wang が含まれます。