https://frosthead.com

あなたのツイートは、いつインフルエンザにかかるかを予測できます

1854年、ロンドンを席巻した壊滅的なコレラの流行に対応して、英国の医師ジョンスノーは公衆衛生の分野に革命をもたらすアイデア、すなわち疫学マップを紹介しました。 市内のさまざまな地域でコレラの事例を記録し、患者の居住地に基づいて地図上にプロットすることで、彼は単一の汚染された水ポンプが多くの感染症の原因であることに気付きました。

マップは彼に、そして最終的には公的機関に、病気の有毒ガスの理論(病気は有毒ガスを介して広がると主張している)が間違っていること、そして微生物理論(微生物が原因であると正しく主張している)が真実であると説得した。 彼らは、アウトブレイクの原因となったポンプのハンドルにロックをかけ、感染症や衛生状態への対処方法を永久に変えたパラダイムシフトを示しています。

マッピング技術は病気とはまったく異なりますが、Snowの地図とロチェスター大学のHenry Kautz率いる研究者グループが実施した新しいプロジェクトとの間には一定の類似性があります。 インフルエンザの流行を特定し、一般公開されているジオタグ付きツイートのキーワードに基づいて予測を行うアルゴリズムを作成することで、彼らは病気の伝播を研究するための新しいアプローチを取っています。 。

「私たちは人々を周囲の世界を見ているセンサーと考えることができ、それから彼らが見ているものや体験しているものをソーシャルメディアで報告します」とカウツは説明します。 「これにより、人口規模で詳細な測定を行うことができ、ユーザーが積極的に参加する必要はありません。」

言い換えれば、痛みを伴う咳と発熱によって私たちが身を低くしたばかりであるとツイートするとき、私たちは無意識のうちに、インフルエンザのような病気の動きを追跡するために研究者が使用できる膨大な公衆衛生実験のための豊富なデータを提供しています高解像度かつリアルタイムで。

SocialHealthと呼ばれるKautzのプロジェクトは、さまざまな公衆衛生問題を追跡するためにツイートやその他の種類のソーシャルメディアを利用しました。最近、彼らは投稿したすべての人を記録することで、ニューヨークレストランで食中毒のインスタンスを監視するためにツイートを使用し始めましたレストランからのジオタグ付きツイート、その後の72時間のツイートのフォロー、嘔吐、下痢、腹痛、発熱または悪寒の言及をチェックします。 そうすることで、彼らは480の食中毒の可能性の高いインスタンスを検出しました。

しかし、季節が変わると、最も目を見張るのはインフルエンザウイルスを追跡する彼らの仕事です。 Googleインフルトレンドも同様に、Googleサーチャーを使用してインフルエンザの動きを追跡しようとしましたが、モデルは昨年のアウトブレイクを大きく過大評価しました。 Twitter分析は、いくつかの品質(地理的解像度が高く、時間の経過に伴うユーザーの動きをキャプチャする機能)を備えた新しいデータセットを表します。

インフルエンザ追跡プロジェクトを開始するために、SocialHealthの研究者はニューヨークに特化した調査を行い、3か月間、600, 000人のユーザーから1か月あたり約1600万のジオタグ付きツイートを収集しました。 以下はニューヨークのTwitterの1日のタイムラプスで、その場所でのツイートの異なる頻度を表す異なる色で表されています(青と緑はツイートが少なく、オレンジと赤はツイートが多いことを意味します)。

このすべてのデータを活用するために、彼のチームは、各ツイートがインフルエンザに似た症状の報告を表しているかどうかを判断するアルゴリズムを開発しました。 以前は、他の研究者は単にツイート内のキーワード(「病気」など)を検索することでこれを行っていましたが、彼のチームはこのアプローチが誤検出につながることを発見しました。気分が悪い。

これを説明するために、彼のチームのアルゴリズムは(1つではなく)3つの単語を連続して探し、手動でラベル付けされたツイートのセットに基づいて、特定のシーケンスが病気を示す頻度を考慮します。 たとえば、「インフルエンザの病気」というフレーズは病気と強く関連していますが、「病気や疲れ」はそれほど関連していません。 頭痛、発熱、咳などの特定の単語は、それらがどの3単語シーケンスに属しているかに関係なく、病気と強く関連しています。

これらの数百万のツイートがコード化されると、研究者は彼らといくつかの興味深いことをすることができました。 まず、インフルエンザ関連のツイートの経時的な変化を調べ、CDCによって報告されたインフルエンザのレベルと比較して、ツイートがインフルエンザ率の全体的な傾向を正確に捉えていることを確認しました。 ただし、CDCデータとは異なり、事実から1〜2週間ではなく、ほぼリアルタイムで利用できます。

しかし、同じ場所から2人のユーザーが同じ場所でツイートする(GPSの解像度は都市の約半分)ことを表す、異なるユーザー間の相互作用を調べて、健康な人がどの程度発生する可能性があるかをモデル化しました。インフルエンザにかかった人と接触すると病気になります。 明らかに、40分離れた同じブロックからツイートする2人は必ずしも直接会う必要はありませんでしたが、会った確率は2人のランダムユーザーよりもわずかに高くなっています。

その結果、相互作用の十分な大きさのデータセットを見ると、伝達の様子が現れます。 健康なユーザーが、インフルエンザの症状で自分自身が病気であると報告する他の40人のユーザーに遭遇すると、翌日のインフルエンザの症状が現れる確率は1%未満から20%に増加することがわかりました。 60のインタラクションにより、その数は50パーセントに増加します。

また、チームはTwitter自体のインタラクションにも注目し、互いにフォローしているユーザーのペアを分離して「友情」と呼んでいます。Twitterの関係の多くはWeb上にのみ存在しますが、実際のインタラクションに対応するものもあり、ユーザーは10人の友人が自分が病気であると報告している人は、翌日に病気になる可能性が28%高くなります。 全体として、これらの両方のタイプの相互作用を使用して、彼らのアルゴリズムは、健康な人が病気になるかどうかを予測できました(そして、それについてツイートします)90%の精度。

私たちはまだこの研究の初期段階にあり、多くの制限があります:ほとんどの人はまだTwitterを使用していないので(そうです)、たとえ使用しても、病気になることについてつぶやくことはありません。

しかし、この種のシステムをさらに開発できれば、あらゆる種類のアプリケーションを想像するのは簡単です。 たとえば、インフルエンザにかかっている人がいる場所で時間を費やしすぎて、家に帰って感染経路に立ち入らないように促した場合、スマートフォンは自動的に警告を発します。 市全体の住民は、発生の危機にさらされている場合でも警告を受ける可能性があります。

ジョン・スノーの疾患マッピングのブレークスルーから150年が経過しているにもかかわらず、疾患情報にはまだ完全には理解されていない側面があることは明らかです。 さて、そのように、データをマッピングすることで答えが得られる可能性があります。

あなたのツイートは、いつインフルエンザにかかるかを予測できます