
マイクロソフトのマーチマッドネス:Bing が大学バスケットボールの試合結果を予測する方法

Microsoft Bingは既に、2015年のアカデミー賞や先月のスーパーボウルといったイベントの結果を予測するためにアルゴリズムを活用しています。しかし、この検索エンジンの最新の予測エンジンは、これまでで最も強力なものになるかもしれません。
月曜日にお知らせしたように、Bing は膨大な量のデータを処理し、今年の NCAA 男子バスケットボール トーナメントの 92 京通りの可能性のある結果を分析し、「Bracket Builder」という新しいツールで一般の人々が優勝者を予想し、その過程でオフィスの予想プールで優位に立てるようにしています。
Bing Predictsが大学バスケットボール界に参入した経緯と理由について詳しく知るため、GeekWireはBingのプリンシパル応用科学マネージャーであるウォルター・サン氏と、シニアプロダクトマーケティングマネージャーであるブライアン・サフトラー氏にインタビューを行い、データに基づいたマーチマッドネスのアドバイスを提供するという同グループの使命について伺いました。会話は簡潔さと明瞭さを考慮して編集されています。
GeekWire: Bing はなぜこれを行っているのでしょうか?
ブライアン・サフトラー氏: 「マーチ・マッドネスに関する情報を探す際、Yahoo、ESPN、MSNといった情報源が挙げられます。しかし、これらは情報源が限定的で、特定の情報源に偏りがあるかもしれません。一方、BingやGoogleといった検索エンジンは、偏りがなく、まずはそこから検索して状況を把握しようとする傾向があります。私たちは、この検索エンジンをプラットフォームとして活用し、トーナメント表の作成、スケジュールの確認、そして各チームの詳細情報の収集を支援する機会だと捉えました。」
GW:「ブラケットビルダー」について詳しく教えてください。
サフトラー氏:「皆さんがブラケットを作成する際に、2つの意図が見えてきました。それを解明したいと思いました。まず、平均的な人がフォローするチームは5チームまでです。ブラケットに64チームある場合、残りの対戦をどのように予想するでしょうか?Bing Predictsでは、その意図を「ブラケットビルダー」の要素とレイヤーとして追加しました。これは、皆さんの選択を置き換えるものではなく、皆さんを支援するためのものです。
ブラケットを空白のまま「自動入力」をクリックする人も少なくないでしょう。しかし、「ブラケットビルダー」が特に役立つのは、試合ごとに予想を進める時です。興味深いのは、人々がシナリオゲームをしたいと考えていることです。Bing Predictsが真に価値を発揮するのは、2回戦以降のチームの動向を把握できる時です。例えば、スウィート16でヴィラノバ大学とルイビル大学が対戦したらどうなるでしょうか?接戦になりそうです。しかし、もし同じ状況にルイビル大学ではなくヴィラノバ大学を置いたらどうなるでしょうか?ヴィラノバ大学の勝率は10%上昇します。こうしてシナリオプランニングを始めることができます。これは、多くの人がブラケットに欠けていると感じていたもう一つの機能です。私たちは、この機能を提供したいと思っています。
GW: NCAAとのパートナーシップのおかげで、チームは10年以上にわたる過去のデータにアクセスできました。これはどのように予測に役立ちましたか?
サフトラー氏:「これは予測モデルの構築に非常に役立ちました。過去10シーズンを振り返り、そのデータを用いて、まるで結果を知らないかのように各トーナメントを予測できたからです。このデータを用いてモデルをトレーニングし、シーズンの流れやトーナメントの結果を理解できるようにしました。興味深いのは、ここ数シーズン、多くの番狂わせが起きていることです。モデルをトレーニングすることで、番狂わせがどのようなものになるかを理解し、どの試合で番狂わせが起きやすいか、そして実際に番狂わせを引き起こすシナリオはどのようなものかを予測できるようになりました。」
GW:データに基づいた予想やヒントが、かつてはシンプルなブラケット入力の体験だったものの「楽しさを台無しにしている」という意見を耳にしました。それについてどう思われますか?

ウォルター・サン氏:「楽しさが損なわれるわけではありません。皆さんは自分の好み、例えばアリゾナのファンならファイナルフォーに進出するだろうと予想するなど、様々な意見をお持ちですが、同時に私たちが考える統計的な傾向も確認できるようになっています。皆さんの予想の仕方はそれぞれ違います。私たちはただ、統計データを提供することで、皆さんのお役に立ちたいと考えています。」
変動性が非常に大きいため、完璧な予想は不可能です。100%の精度を期待できる段階ではありませんが、75%の精度を目指しています。しかし、もし特定のチームをよく知らない場合でも、私たちの予想を参考にしていただければ、そのチームの信頼性は高まります。
GW : Bing の予測は、たとえば FiveThirtyEight の予測と何が違うのでしょうか?
サフトラー氏:「誰もが過去のデータに注目していますが、私たちはウェブとソーシャルデータのレイヤーを追加しました。これは、ウェブで検索したりソーシャルメディアで会話したりするすべての人々の集合知という知識を、製品に取り込み、重み付けすることを意味します。私たちは、できるだけ多くの情報を見つけ出し、あらゆる情報を考慮することで、最も包括的な予測を提供することに重点を置いています。」
GW:つまり、Twitter で多くのファンがケンタッキーの素晴らしさを語っているから、それを考慮に入れるということですか?
サン:「信じられないかもしれませんが、確かに価値があります。私たちは、肯定的な感情と否定的な感情を分析する感情分析ツールを使っています。面白いのは、感情を総合的に見ると、チームの勝算の良し悪しを適切に評価する上で、ある程度のシグナルが得られるということです。誤解のないよう申し上げますが、統計モデルは存在します。しかし、私たちは群衆の知恵も加えています。例えば、昨日トーナメント表が発表された時、人々は特定のチームとそのシード順について不満を言い始めました。こうした情報は、総合的に見ると、実際に価値があるのです。」
GW:皆さんは「ザ・ヴォイス」やワールドカップ、スーパーボウルなどの結果を予測してきましたが、これはこれまでで最も集中的なプロジェクトのように思えます。
サン氏: 「今回のモデルでは、ユーザーが利用できる情報が大幅に増えました。また、あらゆるシナリオを想定したデータも提供しようとしています。ワールドカップでは、各試合の結果を予測して、そこから先を見据えるだけでした。今回のモデルでは、あらゆる組み合わせを想定したモデルを構築しました。例えば、ハンプトンが何らかの形でファイナルフォーに進出した場合、その結果を予測する必要がありました。従来のモデルには、こうしたすべての情報が備わっていませんでした。」
サフトラー氏:「Bing Predictsでは、優勝チームを予測するだけでなく、番狂わせが起こるために必要なシナリオを説明するデータも初めて提供しています。ケンタッキーがマンハッタンと対戦する場合、ケンタッキーの勝利確率は99.9%です。では、マンハッタンが勝つためにはどのようなシナリオが必要なのでしょうか?実際にそれらのシナリオを作成し、ユーザーと共有しています。」