インソースマーケティングデザイン
2014.08.18 システム
ビッグデータって何だろう?
こんにちは。エンジニアの高田です。
「ビッグデータ」というキーワード、最近よく目にします。
ビッグデータって何なのでしょう?
おそらくデータにビッグをつけるくらいなので読んで字のごとく、
すっごく大きい大量なデータのことなのかなと想像はつきます。
参考サイトの言葉を借りると…
「ビッグデータとはインターネットの普及とIT技術の進化によって生まれた、
これまで企業が扱ってきた以上に、より大容量かつ多様なデータを扱う新たな仕組みを表すもので、
その特性は量、頻度(更新速度)、多様性(データの種類)によって表される。」
とのことです。
へぇ~…
て感じですが…
つまりビッグデータとは様々な側面があり、ただ単に大量なデータ
そのものを指す言葉ではないようです。
まだ共通定義はコレというものはないようですが、
共通の特徴としては、上記説明にもあるように、
「多量性」、「多様性」、「リアルタイム性」が挙げられるようです。
1番分かりやすい多量性という側面からあげると、
現在、日本の企業で扱われる大規模データの容量は、数テラバイトの規模が多いそうです。
それが数十テラバイトから数テラバイトに及ぶデータはビッグデータに分類されてきます。
次に多様性という側面として、ビッグデータとして扱われるデータは以下のものがあり、多種多様となっています。
・ソーシャルメディアデータ (ソーシャルメディアにユーザが書き込むデータ)
・マルチメディアデータ (WEB上の配信サイト等で提供される音声、動画等データ)
・ウェブサイトデータ (ECサイトやブログ等に蓄積されるデータ)
・センサーデータ (GPS等で検知される位置、乗車履歴、温度等のセンサーデータ)
などなど様々な分野のデータが想定されており、
各データを連携させることでさらなる付加価値の創出も期待されているそうです。
ビッグデータといえばよく引き合いに出されるFacebookですが、
Facebookは大量のデータを扱う企業であり、アクティブユーザーが10億人以上も存在するそうです。
次回は、このFacebookで開発されたビッグデータ処理も可能な
分散SQLエンジン「Presto」を紹介します。
すでに同社社内でも使用されているそうです。
<参考:ビッグデータへの道 第1回「ビッグデータとは」:ビッグデータ:日立>
<参考:ビッグデータとは何か|総務省|平成24年版 情報通信白書>