Vision

ルワンダでも国内でも、携帯電話のデータがあなたについて何を明らかにするのか

ルワンダでも国内でも、携帯電話のデータがあなたについて何を明らかにするのか
ルワンダの携帯電話ユーザー
ルワンダの携帯電話普及率は70%を超えています。(写真提供:ジョシュア・ブルーメンストック)

研究者たちは、ルワンダでの携帯電話の使用に関するデータを分析し、携帯電話のユーザーがどの程度裕福であるかを解明した。研究者たちは、他の国でも同様の分析ができる可能性があると述べている。

本日サイエンス誌に掲載されたこの研究では、ビッグデータモデルを用いて所得以外の多くの側面を分析する。例えば、ルワンダのデータは、携帯電話利用者のうちバイクやテレビを所有しているかどうかを予測するために活用できる可能性がある。

この研究の主著者であり、ワシントン大学の情報科学者であるジョシュア・ブルーメンストック氏は現在、このコンピューターモデルがルワンダ以外の地域にどれほど容易に適用できるかを調べるための後続プロジェクトに取り組んでいる。

「どの国でも、人々の携帯電話の使い方と富裕度の間には関係があるという仮説を立てています」と、彼はサイエンス誌のポッドキャストで述べた。「その関係の具体的な性質は国によって異なり、同じ国でも年によって変わる可能性があります。しかし、根本的には、こうした関係性が存在すると考えられます。」

ルワンダの地図
ルワンダの貧困に関する高解像度地図は、携帯電話のデータを使用して作成されました。(クレジット:ジョシュア・ブルーメンストック)

なぜルワンダなのか?ブルーメンストック氏とその同僚がこのアフリカの国を​​選んだのは、質の高い調査データを入手するのが困難で費用もかかる発展途上国における人口動態プロファイリングへの新たなアプローチを見つけることに興味があったからだ。

「私たちは発展途上国の貧困をモデル化することに重点を置いています。なぜなら、それが最もニーズが高いと考えられる応用分野だからです。こうした状況では、人口統計データの代替ソースは往々にして信頼できなかったり、古くなったり、存在しなかったりするのです」と彼はGeekWireへのメールで述べた。

研究者たちは、ルワンダの携帯電話普及率が70%を超えているという事実を活用しました。これは発展途上国では一般的で、固定電話の普及率は低く、携帯電話料金は米国よりもはるかに低いのです。「月に50セントか1ドルで、SMSを数回送信したり、電話をかけたりできます」とブルーメンストック氏は説明します。

ルワンダの塔
ルワンダの田園地帯に携帯電話の塔がそびえ立っている。(写真提供:ジョシュア・ブルーメンストック)

研究者たちは、国内最大の携帯電話ネットワークの加入者150万人が1年間に交わした詳細な匿名メタデータを入手することに成功した。このデータは通話内容を明らかにするものではなく、通話時間、通話時間、場所といった指標を扱っていた。

研究チームはまた、加入者856人を対象に調査を行い、電気の有無や冷蔵庫、テレビ、自転車、スクーター、ラジオなどの所有の有無など、加入者の経済状況に関する詳細なプロフィールを作成した。

携帯電話の統計と個々のユーザーの調査データを一連のコンピュータモデルに統合し、最適な適合性を見出した。モデルは、特に富裕層を予測する上で重要な携帯電話の使用パターンを特定した。

例えば、9時から5時までの勤務時間中に通話が集中している人は、そうでない人よりも裕福な傾向がありました。プリペイドサービスを一度に10ドル分購入する人は、50セントから1ドル単位で購入する人よりも裕福な傾向がありました。ルワンダの携帯電話加入者は、電話をかけるときには料金を支払う必要がありますが、電話を受けるときには料金を支払う必要はありません。そのため、通話量が相対的に少ない人は、より貧しい傾向がありました。

モデルの性能は、研究者が何を予測しようとしたかによって大きく異なりました。モデルは、富裕層階層の下位25%に属するユーザーをうまく予測しました(「曲線の下の領域」と呼ばれる統計尺度で0.81)。また、冷蔵庫(0.88)やテレビ(0.84)を持っているユーザーを予測するのもかなり正確でした。しかし、ラジオを持っている人と持っていない人を予測するとなると、ランダム抽出と同等の精度でした(0.50)。その理由の一つは、ルワンダ人が非常に多くラジオを持っているため、ラジオを持っていない人を予測するのが難しいことにあると考えられます。

実験の第二段階は、150万人というより大規模な加入者サンプルでモデルがどれほど正確に機能するかを検証することだった。研究者らが加入者サンプル数をルワンダの国勢調査データと比較したところ、モデルは驚くほど正確にルワンダの富裕層と貧困層の分布をマッピングできることがわかった。「相関は90%以上でした」とブルーメンストック氏は述べた。

彼によると、コンピューターによる分析には4週間かかり、費用はわずか1万2000ドルだった。ルワンダで全国調査を実施した場合、数百万ドルの費用がかかるだろう。この研究は、携帯電話の利用状況に関する統計を適切に分析すれば、発展途上国の経済政策を導くのに十分な情報が得られると結論付けている。

しかし、プライバシーの懸念はどうでしょうか?携帯電話の使用状況に基づいて、誰かがあなたの富裕度を割り出せると考えると、少し不安になります。しかも、これは携帯電話に限った話ではありません。「電話のデータ自体は特別なものではありません。…TwitterのデータやFacebookのデータなど、他のデータストリームでも同様のことが起こり得ると想像できます」とブルーメンストック氏は言います。

ブルーメンストック氏は電子メールの中で、ビッグデータのダークサイドについて次のように述べている。

管理された研究環境の外に出れば、派生的な手法が、私を含め多くの人々が不快に感じる方法で利用される可能性があるという懸念は当然あると思います。ある程度、これはすでに起こっています。実際、このプロジェクトの着想の一部は、Googleが広告をターゲットにしたり、Amazonが商品の推奨をターゲットにしたりするのと同じくらい効果的に貧困をターゲットにできるかもしれないという考えでした。つまり、主に商業目的で開発された最先端の手法を人道支援ツールに転用できるのではないかという考えです。しかし、この論文が最先端の研究を前進させる限り、商業団体による他の応用も可能になるかもしれません。…

「ですから、より一般的に言えば、この研究は、私たちが生成するデータの取り扱いについて、慎重な保護と規制を整備する必要があることを浮き彫りにするものだと考えています。携帯電話のデータだけでなく、ソーシャルメディア、eコマース、クレジットカード、モバイルアプリなどの日常的な利用で生成されるデータも対象となります。具体的にどのような保護策を講じるべきかは、活発な議論が交わされている分野です。ウィスコンシン大学とバークレー校の同僚の中には、この分野の思想的リーダーもいますが、現時点では、こうしたデータの収集と利用方法には、依然として「ワイルド・ウェスト」的な雰囲気が漂っています。」

ビッグデータに関しては、私たちは皆発展途上国にいます。では、悪用されないようにするにはどうすればいいのでしょうか?それとも、もう手遅れなのでしょうか?

「携帯電話のメタデータから貧困と富を予測する」の著者には、ブルーメンストック氏のほか、ガブリエル・カダムロ氏とロバート・オン氏もいます。