ビジネスでのビッグデータ

ビジネスでのビッグデータの利用は、いろいろな難しさ、見えにくさがあります。状況、規模、マーケット、顧客の広さ・深さ、時間規模、リアルタイム性など、どの部分に注目して、どこで、どの範囲でビジネスをするか、戦略が多様な状況では、考えしだいで方向性がいくらでも変わります。データを利用するかしないか、ITを使うか使わないか、という根本的なところから、どのデータをなんの技術で解析するか、それを何に使うか。同じ結果が得られるならデータはどのように使ってもいいわけですし、むしろ簡単にできるのなら、目的を変えて、より効率よくビジネスができる方向に舵を切り直してもよいわけです。こうなると、考えるポイントも範囲もなかなか絞り込めず、なかなか納得のいく解を見いだせないものです。

ビジネスでのデータの利用では、どの場面で何を狙うかによって、作るもの調べるものが大きくかわり、それによって使われる技術も大きく変わります。何をしていいかわからない、このわかりにくさの難しさは、ここから来ていると言ってもいいでしょう。ただ、製造、開発、営業、サービスなど、企業活動の部分部分で典型的な利用というものは存在します。たとえば、ビッグデータを使ってなんらかのサービス、とくにWebやスマホを使ったサービスであれば、大規模なデータを高速に扱い、すぐに反応を返すことができるリアルタイムシステムの開発が重要になります。データの質を上げようとしてデータが大きくなってしまうより、多少荒削りでも少ないデータでシンプルに攻める、というような感覚が重要になります。

経営判断、営業や開発の判断のサポートに使うなら、データ解析が良いでしょう。人間がじっくりデータを見てもとらえにくいような、全体的な、あるいは局所的な、目立たない、あるいは大量の特徴を見つけてくることができます。データの特徴を大まかに捉え、特徴が出やすい方向でデータ解析を行い、それに意味解釈をつけていく、といったことが重要になります。企業コンプライアンスのために、データを保存し、事故が起こった際の追跡や原因究明、あるいは事故や犯罪を未然に防ぐための警戒を行うのであれば、検索能力が優れたデータベースと圧縮保存の技術が重要になります。見つけ損ない、聞き漏らしといったことをなるべくなくしたいので、できるだけ多量のデータを集めることになりますので、それに対応できるようなデータ検索・データ保存システムが必要になるのです。

工場や作業所での日常業務の低コスト化なら、デバイスとの連携が重要になります。従業員やユーザの移動経路や作業内容をカメラやスマホなどのデバイスで検知し、作業者の負担にならないようにデータを集め、隠れたボトルネック、コスト要因や、危険性の高い場所や作業を割り出し、適切な情報、次の作業や道筋の案内や、次にすべき作業や、売り場の案内などを提示します。また、作業に必要な補助情報の提供も行います。作業者に負担をかけないようにすることが大事ですので、どのようなデバイスを使いどのようにデータを集めるか、という点が重要になります。また、作業者に提示する情報をどのようにするか、といった業務デザインも重要になり、その材料として、行動パターンやボトルネック工程の抽出といった、データ解析も重要となってきます。

データの解析も、学術的な発見をするというより、役立つことをするのが目的ですので、ほんとのところがわからなくても、うまくいけばいい、という考え方もあります。たとえば広告やマーケティングの場合、もちろんユーザの好みやライフスタイル、今必要なものを深く知り理解することも重要ですが、理解せずとも購買行動が誘発できればそれでいいということもあります。これは、どちらがいい、というものではなく、両者がともに異なる特色を持つ、重要な解析になります。ユーザの好みを深く理解すれば、適切な情報を広告として届けることができます。一方で、あまり詳しく好みを知られると気持ち悪い、広告はむしろ、自分の興味からちょっと外れたものを提示してもらって、ちょっと刺激をもらえるくらいでちょうどいい、という考え方もあります。どちらの方向性を選ぶかでどのような商品の広告を見せるか、いつ、どこで、どれくらいの頻度で広告を見せるか、といった広告戦略全体のデザインが変わってきます。データ解析技術の結果を見据え、あるいは予測し、デザイン全体を考えることが大事です。

 データの保存に関しても、完全性や妥当性ももちろん大事ですが、役に立つ、という観点が重要になります。過去のデータについてある程度の全体的な概要が知りたい、ということであれば、1%程度のサンプルを残して他を破棄する、毎分とっていたデータを1時間に一回に間引く、という形でデータを荒くすることで、保存容量を1/100近く減らせます。保存方法も大きなポイントで、1年以上昔のデータはそれほど頻繁にアクセスされず、アクセスされるとしてもまとめて参照する、というような状況であれば(大多数の企業ではこのような使われ方のようです)、高価なデータベースにデータをしまっておく必要はなく、生のデータをテープや大容量HDDに安価に保存することができます。このように、考え方しだいでいくらでも効果的な保存ができますが、実際のところ、たとえばサービス業では、現在の顧客の動向に興味があるので、1年以上過去の詳しいデータはあまり必要でないことが多いです。各個人の詳細なデータは捨て、少しのサンプル、統計情報のみを残しておけば十分という考え方もあります。

最後に、ビジネスでのビッグデータの利用で、よく見かけるものについて、どのようなビジネスをしているのか、技術として何を使っているのか、どの範囲をカバーするのか、ということを解説いたします。データの利用やビジネスの展開の仕方は、技術に関してもビジネスに関しても、様々な視点からあまたの要因を考えなければなりません。自身で勉強するのも良いですが、いろいろな人に聞いて、相談してみてもいいと思います。そもそも、考えてた方向性が、成功の可能性がなかったり、根本的にコストがかかるものだったりする場合には、時間とコストをかけて判断するより、さっさと見切りをつけられたほうが良いです。その意味では、いろいろな人に聞いて、ビジネスの可能性だけでも早めに判定した方が良いでしょう。

工場での移動経路分析

工場や事業所などで、作業する人や製品などの移動経路を蓄積し、それを解析することで、業務の問題点を洗い出し、効率性や信頼性をあげようという取り組みがあります。RFIDやBluetoothなどの小型デバイスを使い、位置情報を得る技術はすでに十分発達していますので、あとは、どこまで細かくデータをとり、どう分析するかという話になります。ただ、人の動きは複雑であることが多く、自動的な分析よりは、上手に可視化して、人間が問題点を把握しやすくすることが重要でしょう。何か問題点があり、改善ができるのであれば、それを見いだすことはさほど難しくないと思われます。

鬱病の発見、情報漏洩、人材評価

社員の勤怠情報やメールのやりとりなどから、社員の活動や健康の状態をはかったり、仕事の質や量を評価したり、情報漏洩などの危険がないかどうかを調べようという取り組みがあります。メールに含まれる単語や勤務体型のばらつきをチェックし、仕事が厳しすぎないか、怪しい動きをしていないかを見張るものです。情報を得ることは比較的簡単なのですが、その一方で、正確性を高めた判断をするのは非常に難しいです。データの意味解釈や、奥に隠れた感情を推測することは、現在の技術では、手が届かないほど難しい問題なので、怪しげなもの、兆候などを見つけることも、なかなか難しいのが現状です。ただ、分野によっては、これがあったら明らかにおかしい、というものもあるので、そういうものが利用できれば、効率・精度を高めることができます。

ロジスティクス、配送ルート決定など計画立案

工場や倉庫の建設場所を決め、配送・運送の仕方などを効率化することをロジスティックといいます。最適な配送ルートの決定などを含め、数ある選択肢や組合せの中から最適なものを選ぶ作業になります。ここで使われる技術は最適化で、コストなどの評価軸を決め、その元で最適なプランを計算することになります。技術的には成熟しており、精度高い計算ができるのですが、問題はデータの取得や算定のところで、「どこにどれくらいの需要があるか」「今日の配送先は、留守宅がどれくらいあるか」といった、不確定な要素をどうやって見積もるか、というところが鍵になります。数理モデルを使うかどうかを含め、いろいろな難しさがあります。

故障診断

機械の故障や部品の交換時期を自動的に知るために、機械にセンサーを付け、異常事態を検知しようというものです。ただ、機械のどの部分の、振動や音、温度のデータがどのようになると異常なのか、そういうったことはわからず、異常事態に何が起こるのかを理解するのが難しいものです。異常事態のデータは非常に少なく、再現もできないので、データをどう集めるか、条件をどのように設定するかが難しいポイントです。

不良品の発見など、作業工程管理、低コスト化

製造業には、人間の認知や判断が必要なプロセスが多くあり、たとえばベルトの上を流れる品物をチェックし、機械が扱いやすいように整頓したり、不良品を見つけたり、いく種類もの物体を分類したり、と、様々なものがあります。工作機械などでできることはすでに実行されているので、それより高度な、認識、判断などが必要な作業を機械にさせることが目的になります。画像認識による分類やセンサーのデータからの不良品の判断を行うことになりますが、故障診断と同じような難しさがあります。

移動データ

スマホや車、工作機器などにはGPSと通信機能を搭載したものがあり、それらは自身のいる場所の情報を常時送信でき、位置情報データとして蓄積されます。これが移動データ、位置情報データです。移動しているか、していないか、あるいは移動距離などを算定し、地図上で何があるかを調べて、そこから何かをするのは比較的簡単ですが、その移動の意味を知る、遊びに行っているか、仕事をしているのか、買い物か、待ち合わせか、ということを知るのは比較的難しいです。また、データから、町における人の移動の概要や、車の流れなど、おおまかなことを知ることもまた難しいです。

ログ解析

インターネットのアクセス履歴や、ポイントカードの情報から、ユーザの状態、気持ちや目的を推定する、あるいは、システム全体の状態や、社会の様子、全ユーザの変化を俯瞰する、といったことを行うのが、ログ解析です。機械の動きのログや、天候、動物などのログデータも利用されます。

マッチングと広告

他人のサイトや検索結果ページなどに広告を出す場合に、自身のサービスや製品に興味のある人だけに上手に広告を見せる、あるいは、お互いに興味や利害が一致するユーザや企業などを結びつけるのが、ターゲッティング広告やマッチングです。アンケートや行動ログ、アクセス履歴や購買履歴などのデータからユーザの興味や性格を、一部分だけでも推定し、それに合う商品や人を提示することになります。様々データが様々な場面で使えるので、応用先が広いものになります。

トレーサビリティ

販売した製品の購入元や製造過程がどのようであったかを検査できるようにすることをトレーサビリティの確保と言います。コンプライアンスや製造者責任の一環として取り組まれる課題ですが、この目的では、製造過程のデータとをコスト低く取得し、購入台帳や小売店への配送と合わせ、どの材料で作られたどのデータがどこで売られたかを、データ損失の危険を低くして保存することが大事にまります。検索されることも少ないので、複数の、磁気テープなどの1000円程度の安い記録媒体に、1年分のデータを記録して保管、というようなことになります。

個人情報

ビッグデータにおいて、個人情報の取り扱いは大変重要な課題です。しかし、プライバシーに関しては、人々の意識も大きく異なり、社会制度やユーザの意識、データ利用の方法において、危険性や評価が大きく変わります。たとえば、単にサイト内のどのページが何回見られたかというデータであれば、それが商品紹介などのページであれば、データ利用に対してさほど抵抗はないでしょう。逆に個人の思考や人間性が色濃く反映されるもの、たとえば就職活動や病院・病気の検索データは、たとえ個人情報がしっかりと保護されたとしても、そのデータが社会一般に流通していたら、あまりいい気持ちはしないでしょう。また、データが危険かどうかもありますが、しっかりと同意をとったか、リスクが小さいことが説明されたか、透明性が高いか、といったことが、より大きく気にされることもあります。将来必要となる可能性があるものも含め、目的のために必要最小限のデータを、個人情報を侵害しないように上手に蓄え分析する、そのために、ビジネスのモデルを上手に作る、といったことが重要になるでしょう。