
データはシアトルの交通問題の解決に役立つでしょうか?

シアトル市民にとって、交通渋滞は深刻な障害となり得ます。シアトルの人口増加は道路やバスの混雑を招き、多くの住民にとって仕事、通学、子育てに支障をきたしています。
しかし、シアトルの交通問題の解決策は、私たちが想像するよりもずっと近いかもしれません。データセットの奥深くに埋もれているのです。この夏、ワシントン大学の社会貢献のためのデータサイエンス(DSSG)プログラムの2つのグループは、このデータを活用し、市民と交通当局が交通問題に取り組むのに役立つツールの開発に着手しました。
ある研究グループは、乗客がバスに乗車する際にORCAカードをタップするたびに収集されるORCAカードの9週間分のデータを調査しました。データセットは、場所、路線番号、乗車時刻などを含む2,100万個の個別データポイントで構成されていました。
研究チームはまた、バス停留所での歩行数を測定し、バスに乗車する人数を推定するバスセンサーのデータも使用した。
「データに光を当てるために、統合ダッシュボードに一連のアプリケーションを作成しました」と、DSSGフェローのビクトリア・サス氏は述べています。これらのアプリケーションは、データのさまざまなサブセットを視覚化し、利用者数、混雑状況、さらにはORCA利用者数と他の決済方法利用者数の比較といったパターンをユーザーが確認できるようにします。
「私たちが作成したこれらのアプリケーションは、このデータを使って何ができるかについて多くの洞察を提供しました」とサス氏は言う。「しかし、やるべきことはまだたくさんあります。」
同グループは、交通当局がこれらのツールを活用することで、バスの利用状況をリアルタイムで監視し、混雑などの問題に迅速に対応できる可能性があると提案した。同グループは現在もアプリケーションの微調整を行っており、データの公開承認を待っているが、早ければ今秋にも交通当局と市民がツールを利用できるようになることを期待している。
プログラムの別のグループは、別の交通問題、つまり歩道の問題に取り組みました。移動に制限のある住民にとって、適切なデータがなければ、新しい地域を移動することは困難、あるいは不可能になることもあります。
「ここで重要なのは、地図を作成するときに歩道を忘れてしまうことです。それが大きな問題になります」とDSSGフェローのトーマス・ディスリー氏は語った。
Googleマップなどの地図アプリには、横断歩道、歩道の傾斜、カブストップ(道路から歩道に通じるスロープ)といったデータポイントが含まれていません。移動に制限のある人にとって、これらのデータは日々のナビゲーションに不可欠です。
プログラムの過程で、グループは、クラウドソーシングの地図データベースである Open Street Maps (OSM) に歩道データを追加する経路を作成しました。

同グループは、既存のデータと地方自治体のデータを集め、公開前にユーザーがデータを検証できるプラットフォームを構築し、この複雑なプロジェクトをクラウドソーシングで行えるようにした。
同グループのプロジェクトリーダー、ニック・ボルテン氏は、作業を継続するために国の補助金を申請する可能性があると述べた。
ワシントン大学eScience研究所が主催する「社会貢献のためのデータサイエンス」プログラムは、世界中から学生と科学者を集め、データサイエンスを社会のニーズに役立てることを目指しています。eScience研究所のプログラムマネージャー、サラ・ストーン氏によると、プログラム期間中に取り組んだプロジェクトの多くは夏休み後も継続されるとのことです。
今年のプログラムには、運輸業界以外で活動する 2 つのグループが参加しました。
ある人は、Amazonのレビューを利用して製品のリコールを予測する機械学習プログラムを構築しました。このプログラムは、レビューのテキストから「腐った」「カビ」「嘔吐物」といった単語を抽出し、特定の単語の出現頻度に基づいて予測を行います。
このグループは、製品のリコールを予測し、現在のリコールプロセスの時間を短縮することを目指し、プログラムの精度向上に取り組んでいます。そのために、ソーシャルメディアなどの情報源から追加データを取り込むことも検討しています。
最後のグループは、古くからある問題である国勢調査に取り組みました。通話記録とオープンソースの地図データを用いて、大都市の貧困レベルを予測するモデルを構築しました。現在、多くの都市の貧困レベルは人口の生データに基づいて推定されています。
彼らのモデルは現在、ベースライン予測の2倍の精度で機能しており、チームはこのモデルの開発を継続し、最終的には国連のグローバル政策フォーラムに発表する予定です。