Iphone

より安価で賢いAI?UW、Ai2、スタンフォード大学の研究者らが、より長く「考える」ことでモデルを強化

より安価で賢いAI?UW、Ai2、スタンフォード大学の研究者らが、より長く「考える」ことでモデルを強化

トッド・ビショップ

S1 研究論文のグラフでは、思考時間が長くなるにつれて精度が向上することが示されています。

ワシントン大学、シアトルのアレンAI研究所(Ai2)、スタンフォード大学の研究者らは、多額の費用をかけずに人工知能を改良できる可能性を新たに実証し、AIモデルが答えを出す前に「考える」時間を長くする技術を開発した。

トレーニングコストを大幅に削減しながら、AI の推論能力を高めることが目的です。

最近の研究論文で説明されているシンプルな「テスト時間スケーリング」という手法は、AIがクエリへの応答開始が早すぎる場合に、AIに処理を強制的に継続させるというシンプルな手法を用いています。研究者たちは、この手法がモデルの回答の見直しと改善に役立ち、多くの場合、出力の誤りを回避できることを発見しました。

s1 と呼ばれるモデル、データ、およびモデルのコードは、GitHub でオープンソース化されています。

これは、DeepSeekに代表される、AIモデルの学習コストを削減しながらAIの性能を向上させる効率的な新しい方法を見つけるという、より広範なトレンドの一部です。TechCrunchの報道によると、論文で説明されているS1推論モデルの学習に必要なコンピューティングリソースは、クラウドコンピューティングクレジットで50ドル未満です。

論文に記載されている研究者は、Niklas Muennighoff (スタンフォード大学、Ai2、コンテキストAI)、Zitong Yang (スタンフォード大学)、Weijia Shi (UW)、Xiang Lisa Li (スタンフォード大学)、Fei-Fei Li (スタンフォード大学)、Hannaneh Hajishirzi (UW、Ai2)、Luke Zettlemoyer (UW)、Percy Liang (スタンフォード大学)、Emmanuel Candès (スタンフォード大学)、およびTatsunori Hashimoto (スタンフォード大学)です。

前回:アレンAI研究所が新たなオープンソースAIモデルでDeepSeekの主要ベンチマークに挑戦