ビッグデータとは?身近な例などを挙げてわかりやすく解説
更新日:2022年11月2日
近年、ビッグデータという言葉を聞くことが増えてきています。
ビッグデータは、行政の手続きや企業の商品・サービス開発、医療研究促進等、様々な分野で活躍しており、今後もデータ量は増加し続けます。
ビッグデータを活用した身近な事例や様々な分析方法をチェックし、具体的な活用方法を探っていきましょう。
ビッグデータとは
ビッグデータとは、人間がすべてを把握することが困難な巨大なデータ群を指します。
以下がビッグデータの具体的な内容です。
- ソーシャルメディアデータ(SNS)
- マルチメディアデータ(動画、音声、画像)
- ウェブサイトデータ(行動履歴、購買履歴)
- カスタマーデータ(販促データ、会員データ)
- センサーデータ(位置情報、加速度、温度)
- オフィスデータ(文書、メール、社内ツール)
- ログデータ(アクセスログ、エラーログ)
- オペレーションデータ(POSデータ、取引明細)
上記のビッグデータを集めて行われる分析により、様々な場面で多くの成果を生み出すことに成功しています。
総務省が発表したビッグデータの定義
総務省では、ビッグデータを大きく以下のように分類しています。
オープンデータ | 国や地方公共団体が提供 |
---|---|
産業データ | 企業が保有するパーソナルデータ以外の幅広いノウハウなどのデータと、M2M と呼ばれる産業用機械の機器間通信時のデータ |
パーソナルデータ | 個人の属性情報、移動・行動・購買履歴などの個人情報 |
仮想空間と現実空間を融合させた次世代社会を目指す現代において、上記3つの構成要素を連携してデータを効果的に活用することが重要視されています。
ビッグデータをうまく連携させることで、新たなソリューションやイノベーションを生み出せるでしょう。
ビッグデータを活用した身近な例
ビッグデータを活用し、地域住民や顧客のニーズに応えるための取り組みには以下のようなものがあります。
- 天気予報・災害情報
- GPS機能による位置情報
- 医療情報システム
- 経営分析を行うBIツール
天気予報・災害情報
気象観測では、地上、上空、海洋などの様々な場所で膨大な気象データを集めています。
こうしたデータを集めて数値予報を行うことで、天気予報や防災気象情報として発信されるのです。
気象データを扱うスーパーコンピュータは5〜8年ごとに更新され、その度にデータ量は大幅に増加し、より精度の高い予報が行われています。
GPS機能による位置情報
GPSを活用した位置情報のビッグデータを活用する業界の1つが、観光業界です。
スマートフォンやタブレットの普及やSNS利用者の増加により、位置情報や投稿内容をデータとして蓄積できるため、観光客の行動パターンを分析することが可能となっています。
ある観光事業者ではスマートフォンのアプリを活用して、観光客の混み合う時間帯や人気の高いショップを把握し、観光客の構成(家族連れ・カップル・友人同士)を知ることで、まちづくりや観光客向けサービスの展開、広報活動などに役立てています。
医療情報システム
医療分野においても、ビッグデータが広く活用されています。
たとえば、個人の健康診断データや医療情報などをまとめ、履歴情報として個人に提供し自身の健康管理や疾病予防行動に活かしてもらう「PHRヘルス」という取り組みがあります。
母子手帳や学校の健康診断結果、社会人になってからの健康診断の結果、お薬手帳などの記録をデータ化し、一人ひとりの健康促進のために活かすというものです。
また、組織毎に分断されている医療や介護などのビッグデータを匿名化して収集し解析することで、各分野の課題について分析し、医療の発展を目指すための研究開発に用いる「データヘルス分析」も注目を集めています。
今後は健康寿命を延ばすため、疾病や介護を未然に回避するための施策や治療法を発見することが可能となるでしょう。
経営分析を行うBIツール
ビジネスにおいて経営分析を行うためのBIツールを利用することで、営業活動の改善につながるケースがあります。
たとえば、レジで購入記録を残すIDレシートから、購入された商品と注文者の属性、曜日や季節などのあらゆるデータを集め、BIツールで得た分析結果をもとに売上向上のためのマーケティング戦略の立案が可能です。
売れやすいメニューの予想や商品開発に役立てることができ、企業の業績アップも目指せるでしょう。
ビッグデータの問題点とは
ビッグデータを扱うには、以下のような問題点があります。
- コストがかかる
- データの収集に手間がかかる
- 個人情報の管理に注意が必要になる
コストがかかる
ビッグデータは、管理と維持にコストがかかる点が大きな問題点です。
大量の情報を保存できるシステムが必要であることや、ツールに問題が見つかった場合に修理や調整に時間と手間、費用がかかってしまいます。
外部のサービスを使う場合のみならず、社内サービスを利用する場合にも管理と維持にはコストを要するのが現実です。
データの収集に手間がかかる
データの収集には手間がかかります。
たとえば、質・信用性が低い情報源である場合には、不完全なデータ、データのゴミ、重複データなど、データとして価値がないものが含まれている可能性があるでしょう。
また、データを大量に集めたものの、かえってデータの取捨選択が難しいという問題も発生します。
質や精度が高く、かつ使いやすいデータを集めるには手間がかかる場合があるのです。
個人情報の管理に注意が必要になる
ビッグデータには、顧客個人の情報が入っているケースがあります。
たとえば顧客のプライバシーを侵害しないようにデータ加工して使う、データが流出しないようセキュリティー面を強化する、などの対策を講じなければ、大きな問題に発展する可能性があるため注意が必要です。
ビッグデータの代表的な分析方法
本章では、ビッグデータの代表的な分析方法について見ていきましょう。
- クロス集計
- ロジスティック回帰分析
- アソシエーション分析
- クラスター分析
- 決定木分析
- 主成分分析
異なるグループごとのニーズを知れる「クロス集計」
クロス集計とは、属性別の情報収集やデータ分析を行う場合に使われる分析手法です。
データを集める属性を決定し、アンケートを実施、その結果をもとにさらに属性や項目を細分化し、再度アンケートを実施していきます。
この手法により、単純な集計方法では得られにくい属性の傾向やニーズを把握できるのです。
クロス集計は、業種や業界を問わず用いられているのが特徴でもあります。
結果に対する原因が知れる「ロジスティック回帰分析」
ロジスティック回帰分析とは、膨大なデータから異なるデータの関係性を比較・分析していく集計方法です。
手順として、まず異なるデータの関係性を定量的に分析しますが、たとえばマーケティング部が今後の戦略を立てるために「問い合わせ数」「広告宣伝費」の2つのデータの関連性を分析するといったようなものです。
この分析により、問い合わせ客1人あたりの広告宣伝費を算出できます。
問い合わせ客が増加した結果に対する原因が広告にあったのか、口コミによるものなのか、といったことが具体的にわかるため、ブランディングや商品開発を目的に分析を行う企業が主に用いる手法です。
データの相関性を割り出す「アソシエーション分析」
アソシエーション分析とは、顧客データを集計しデータの相関性を割り出し、データ単体では見つけられない隠れた法則を探り出します。
たとえば、顧客が購入した商品をデータとして保存し、その商品を購入した顧客が同時に購入する他の商品をデータ分析すれば、相関性を把握できるでしょう。
商品Aと商品Bは同時購入されやすい傾向にある、といった関係性がわかれば、店舗でAとBを並べて販売することで売上を伸ばせる可能性があります。
また、ECサイトのレコメンド機能にも活用されている手法です。
類似グループごとの特性やポジショニングが知れる「クラスター分析」
クラスター分析では、異なる種類が混ざる集団の中から類似した集団をグループにわけ、それぞれのグループの特徴を分析する手法です。
たとえばアンケート結果や購買履歴に基づき、顧客を「流行り重視」「価格重視」のグループに分類します。
こうした分類ができれば、前者には新製品やテレビで特集された商品の情報を提供するメルマガを配信、後者にはとくに限定感・お得感をアピールしたメルマガを配信する、といった施策を打ち立てられます。
見込み客の潜在ニーズを把握し、ニーズに合わせた商品開発を行うために役立つ情報を得られるのが特徴です。
ターゲットを絞り込むことができる「決定木分析」
決定木分析では、クロス集計を繰り返して複数の要因から関係性を見出すことで、より強い要因を把握することができます。
決定木分析を行うことで樹木のような経路図が作成され、今後のターゲットを絞り込む場合の判断材料として活用するものです。
ターゲットを絞り込み、自社サービスを購入する可能性が高いユーザー属性を予測し、自社商品に満足の高いユーザーの属性を判別、分類します。
たとえば「商品Aは◯◯地域の50代独身男性に売れやすい」、という細かいところまでターゲットを絞れるのです。
決定木分析は、自社サービスの提供や、オリジナル商品の開発を行う企業に多く導入されています。
データを見やすくする「主成分分析」
主成分分析は、複雑なデータをシンプルにしてデータを見やすくするものです。
要因が多いほど正確な分析が行えますが、データが多いほど分析が複雑化して扱いにくくなるのも事実です。
たとえば顧客のアンケート結果で「流行を重視している」「新しい商品情報は必ず確認する」「中古品を買うことがない」という情報を得られた場合でも、まとめて「新しいものが好き」とシンプルにまとめることができます。
メディアや研究機関、商品・サービス開発を行う企業など、様々な現場で活用される手法です。
まとめ
今後はさらなる技術進歩が予測され、収集できるデータはさらに増加し、ビッグデータは個人にとってもより身近なものとなるでしょう。
様々なデータを分析することで、消費者行動心理の理解や、どの商品開発に力をいれるべきか等を把握し、顧客満足度を高めることで企業にとっては売上向上にも繋げられます。
DX人材育成会社のデジタルグロースアカデミアでは、ビッグデータを活用して取り組みが行われる「DX」に関する研修や、いつ・どこにいても受講できるe-ラーニングの整備から企業別コンサルティングまで、幅広いサポートを提供しています。
ビッグデータを活用し事業を成功させるためには、ぜひデジタルグロースアカデミアにご相談ください。
【監修】
日下 規男
ディジタルグロースアカデミア マーケティング担当 マネージャ
2011年よりKDDIにてIoTサービスを担当。2018年IoTごみ箱の実証実験でMCPCアワードを受賞。
2019年MCPC IoT委員会にて副委員長を拝命したのち、2021年4月ディジタルグロースアカデミア設立とともに出向。
資料・研修動画ダウンロード申し込みページ
DXに関する様々な資料や動画がダウンロード可能です。