私たちは皆、以前よりもはるかに多くの情報が私たちの世界にあることを知っています。 どれだけ多くのことについて、まあ、私たちのほとんどはかなり無知です。
関連性のあるコンテンツ
- 時代を超えたインフォグラフィックが科学の視覚美を強調
- Googleインフルトレンドがインフルエンザを追跡できない理由(まだ)
IBMのスーパーコンピューター開発の責任者であるDave Turekの賛辞について、これらすべての情報に関する貴重なナゲットを以下に示します。2003年から人類の歴史の始まりまで遡って、IBMの計算によると、5エクサバイトを生成しました。 50億ギガバイトの情報。 昨年までに、2日ごとに大量のデータを収集していました。 来年までに、Turekは予測します。10分ごとに実行します。
しかし、これはどのように可能ですか? データはどのようにしてこのようなデジタル葛になりましたか? 簡単に言えば、携帯電話がGPSロケーションを送信するたびに、オンラインで何かを購入するたびに、Facebookで「いいね」ボタンをクリックするたびに、別のデジタルメッセージをボトルに入れます。 そして今、海はほとんどそれらで覆われています。
そして、それは物語の一部にすぎません。 テキストメッセージ、顧客記録、ATMトランザクション、セキュリティカメラの画像…リストは延々と続きます。 これを説明するための流行語は「ビッグデータ」ですが、それは私たちが作成したモンスターの規模にほとんど正義を加えません。
これは、使用する能力を超えた最新のテクノロジーの例です。 この場合、私たちは情報を取得する能力に追いついていないので、最近の経営評論家のお気に入りの理由は、将来は彼らが持っているすべてのデータを理解できる企業と政府に属するということですできればリアルタイムで収集します。
顧客が置き去りにしているすべてのデジタルパンくずを解釈できる企業は、過去1時間に誰がどこで何を買ったのかだけでなく、ソーシャルネットワークの渦中にそれについてツイートしたり、写真を投稿したりするかどうかという考え方が有利になります。 同じことが、都市の景観に点在し、交通の流れなどの都市生活の気まぐれを科学に変える数千のセンサーからデータを収集できる都市にも当てはまります。
当然のことながら、政治キャンペーンはすでに「ナノターゲティング」有権者の焦点の一部として猛烈な勢いでデータを採掘しているので、投票やお金を投じる方法を正確に知っています。 ニューヨーク・タイムズのコラムニスト、トーマス・エドソールによると、アナリストが導き出した結論の中で、共和党員は「オフィス」とクラッカー・バレルのレストランを好み、民主党員は「デビッド・レターマンと一緒に夜遅くまで」を見て、チャック・Eで食事をする可能性が高いということです。 チーズ。
デジタルフロッサムを解釈するラッシュは、Googleが先週、BigQueryと呼ばれる、テラバイトの情報を数秒でスキャンできるソフトウェアの販売を開始すると発表した理由を説明しています。 そして、大量の顧客データやトランザクションデータを分析できるテクノロジーを備えたSplunkという名前のスタートアップが、先月公開された日には株式の価値がほぼ90%急騰したのを見た。 これは、昨年1100万ドルを失った会社にとって。
データサイエンティストの台頭
しかし、最高のデータ解読ツールへのアクセスでさえ、大きな知恵を保証するものではありません。 何百万ものFacebookページやスマートフォンからの大量の非構造化された情報を評価するだけでなく、実際にそれを使ってデータを評価するだけでなく、トレーニングを受けたスタッフがいる企業はほとんどありません。
昨年、McKinsey Global Insituteは、「ビッグデータ」を「イノベーションの次のフロンティア」として説明するレポートを発行しましたが、2018年までに、米国の企業は必要な分析スキルに関して才能が深刻に不足すると予測しています。 190, 000人ほど。 さらに、データの急流が来て戦略的な決定を下すために、さらに150万人のマネージャーを訓練する必要があると主張しています。
しかし、誰もがビッグデータの魔法を信じているわけではありません。 Penn's Wharton School of Businessのマーケティング教授であるPeter Faderは、データが多いほど良いとは思いません。 会社は顧客についてできる限り学習しようとすべきではないと考えているわけではありません。 今では、データのすべてのビットを集約することに重点が置かれているため、彼はボリュームが真の分析よりも価値があると考えています。
MITのTechnology Reviewの最近のインタビューからのFaderの見解は次のとおりです。 「過去の行動に関する無限の知識があったとしても、将来について有意義な予測を行うのに十分な情報がないことがよくあります。 実際、データが多くなればなるほど、誤った信頼が生まれます。重要なのは、限界とは何かを理解し、ギャップを埋めるために可能な限り最高の科学を使用することです。 世界のすべてのデータが私たちにとってその目標を達成することは決してありません。」
あなたのデータは誰ですか?
ビッグデータを使用して大きな問題を解決する方法のサンプルを次に示します。
- 彼らは悪い時も良い時も知っています:ほとんどの企業は顧客の分析に焦点を合わせていますが、Amazonはビッグデータを使ってポイントを獲得しています。
- スタッズの研究:どの牛が最も生産性の高い乳牛を産むか知りたいですか? 酪農業界は数字を計算する方法を考案しました。
- データによる診断: SUNY Buffaloの研究者は、多発性硬化症と日光への露出不足などの環境要因との関連性を判断するために、膨大なデータセットを分析しています。
- トラブルを探している: Recorded Futureという会社は、ソーシャルネットワーク、政府、金融サイトから情報をマイニングして、人口増加、水不足、極端な天候が将来の政治不安とテロにどのようにつながるかを予測しています。
ビデオボーナス:データのキャプチャは1つのことです。 それを魅力的で理解しやすいものにすることは、まったく別の課題です。 David McCandlessは、このTEDトークで「情報マップ」の力を強化します。