ビッグデータとバズワード
産業、ビジネスの分野でも、ビッグデータは大きな注目を集めています。ビッグデータを使えば、何かできそうなイメージはあるが、どうにも手がかりすら見つけられない。ビッグデータを使わずにいると、時代から取り残されてしまい、二度と追いつけないのではないか、といった、ある種の焦りのようなものも感じられます。このような焦りは、ここ15年、ITというものが世間に浸透して以来、継続して見受けられるように思います。その多くは、「バズワード」とよばれる、ある種の事柄や概念を示すキーワードとともに世に広まっていきます。ビッグデータも、このバズワードの一つと言っていいでしょう。IT分野では、他にも様々なバズワードが現れては消え、を繰り返しています。どれもコンピュータやデータ、社会の変革に関わるようなものなのですが、一見すると、同じようにも見え、正直区別が付かないという肩もいらっしゃるでしょう。産業ビジネスの話に入る前に、まずはこのバスワードを整理してみましょう。
もっとも早期に現れたバズワードは「IT化」でしょう。手作業で、アナログで行っていた業務をコンピュータシステムで置き換えることにより、大きな業務効率改善を図ろうというものです。現在は普通に使われてコンピュータシステムの走りは、このころに生まれたと言ってもいいでしょう。当時は、IT化によって、業務改善だけでなく、データ収集による様々な副次的な効果が期待されていました。たとえば営業活動の効率化、マーケティングの精度向上などなど、これらは今ビッグデータに期待されているものと同じでしょうし、当時も、IT化に伴うものとして、一緒くたに説明されていたと思います。しかし、IT化の真の進歩は、コンピュータシステムの導入による作業効率の改善、というところにとどまると思います。
少し後に、物流の分野では、「ロジスティクス」とか「サプライチェーンマネジメント」などの言葉が踊っていました。ロジスティクスは倉庫や工場の設置場所を最適にしてコストを下げること、サプライチェーンは製造から保管、運送、仕分け、配送などの業務を一緒くたに管理して最適化し、コストを下げ、効率を上げ、信頼性を増すのが目的です。これらも、IT化によって情報の収集がスムースに行われるようになって実現可能になりました。ちなみに核となる技術は最適化、統計などのデータ分析です。
やがて世はインターネット時代に突入し、購買や手続きなど様々なことがネットを介して行われるようになりました。このころはインターネットがバズワードだったのだと思います。しかし、インターネットの利用による変革は大きく、バズワードの意味を超え、インターネットは我々の生活と社会を大きく変えました。その意味で、インターネットは真の変革であり、バズワードとよぶべきでないのかもしれません。同時にケータイやスマホの爆発的な普及があり、これも同じように大きな社会の変革でした。
「Web2.0」は、この後に登場したバズワードです。インターネットが、発信者が人々に情報を提供する場から変化し、情報の受取手たる個々の人々にいたるまでみんなが情報を発信する世の中に変わっていく、というコンセプトです(これ以降、様々なものに、2.0だの4.0だの3.14だのという数値が付くことになったという意味で、このバズワードはエポックメイキングでありました)。これは、ブログや twitter、mixi などの情報発信、コミュニケーションツールの登場によるもので、これらにより人々のインターネットとの関わりは大きく変わりました。
ケータイやスマホの普及により、「ユビキタス」という概念がバズワードとして登場してきました。ユビキタスとはどこにでもある、という意味で、どこにいてもIT・情報の恩恵を受けられる、という意味です。GPSで得た位置情報を元に、その場所にいる人に最適な情報、広告や時刻表、地図などの情報を届け、人々の活動をスムースにしていこうというものです。実現可能なコンセプトではあったのですが、届けるべき情報がまだ十分練られておらず、適切なものを適切な量だけ送ることが難しかったため、消えていったように思います。
その後、ITの進化によってデータが大量に手に入るようになり、計算パワーが安価になるにしたがって、似たようなバズワードがいろいろと登場しました。ビッグデータもむろんその一つです。「アルゴリズム」も一時期バズワードとなっていたようです。株の自動取引が」アルゴリズムトレード」とよばれ、一世を風靡しました。様々な現象がアルゴリズムによって説明され、解決されるという言い方ですが、これはデータ分析、モデル作り、計算までをひっくるめたものをあらわそうとしていたと思われます。「アルゴリズム」という言葉が実際意味することは、計算のプログラムの設計、およびその設計理論のことで、モデルやデータとはあまり関係がありません。
「マイニング」という言葉もありました。これも、データを分析してモデルを得て役立てようというもので、ビッグデータ分析と同じような意味合いです。マイニングは、データマイニングという言葉から来ているのですが、データマイニングはデータの中から何か面白いもの役に立つものをデータ分析により見つけて役立たせようという手法のことで、データ解析の中でも、認識、検証などとことなり発見的なものに限定されます。
IoT(インターネット・オブ・シングス)という言葉もあります。様々なものにセンサをつけ、ネット経由でリアルタイムに情報収集と制御をする、というものです。これも、得られるデータを使っていいことをしよう、というところまで含めて喧伝されていますが、技術の真のところは、いかに安価なセンサーを大量に接続し、長い時間持続的にデータを収集し、それをデータセンターまで送信するか、というところにあります。
人工知能(あるいはAI)も、最近大きな話題になっている言葉です。コンピュータに賢いことをさせたい、という意味で使われていますが、データ解析からデータの利用、やがてはコンピュータ将棋や囲碁に至るまで、データと計算を使った様々なことからが人工知能とよばれているようです。感覚的には、難しいことをしたら人工知能、そうでなければ単に計算とかデータ処理とかよばれる、と、感覚的に理解しています。しかし、「知能」の部分は、つまり計算で思考を行うところであり、そういった意味で真の人工知能たるものは、コンピューター将棋やコンピューター囲碁でしょう。これらは純粋に思考を行うものですから。対して、画像の中から人やものを見つけ出す技術は画像認識、売り上げ予測や故障診断はデータ解析と確率モデル、災害や防犯などのアラートは高速センサーと機械学習、翻訳は自然言語解析、といった形で、どれも思考と言えば思考、でないと言えば思考でない、という感じで、知能かどうかはよくわかりません。何が言いたいかというと、人工知能というものは、人間の知能をコンピュータや他の機械で構築する、というゴールを持った学問・技術であるのに対し、現在ちまたで言われている人工知能は、情報技術の中で賢く見えるものを人工知能とよんでいる、と見えます。バズワードがはやるときは、得てしてこのような「バズワードがなんでも吸収する」という現象が発生しているものです。さらに言えば、世の中では、人工知能に過度の期待がかかっているように思います。人間が考えることを、人工知能がより正確により高度に考えてくれるようになる、というのは大きな間違いです。人工知能ができることはほんの一握り、認識や検索といったことだけで、人間の論理的な思考や、意味や状況を理解する能力は、コンピュータにとってはまだまだ難しい作業です。これができるようになるためには、相当な技術の進歩が必要で、今後50年かかるか100年かかるか、見通せないレベルのものです。人間が考える必要のない世の中、は、まだまだ来そうにありません。まずは、画像の認識や音声認識、簡単な文章のチェックなどから始まっていくのでしょう。
ロングテール、スケールフリー、スモールワールド、という言葉も、ちょっとではありますが、バズワードとして流行したように思います。聞き慣れない方も多いと思いますが、どれもデータの特徴を示す言葉です。ビッグデータの特徴、多様、マイノリティを含む、ほとんどの部分はすかすか、意外と密につながっている部分もある、といった特徴を持つデータは、分布の真ん中でなく、端っこに面白いものがある(ロングテール)、意外とみんなのネットワーク上での距離が近い(スモールワールド)、一部分を取り出しても全体と同じような構造、性質が見える(スケールフリー)といった性質が見られる、というもので、ビッグデータ的なデータを扱うと、今までとは違った知見が得られますよ、ということを言うときに使われていました。
最近は、フィンテックという言葉も現れてきました。銀行や証券を中心とした金融業にITの最新技術を導入して、新しいタイプの商品やサービスを展開していこうというものです。簡単なところでは、生涯の収入・支出シミュレーションや、様々なファンドの検索など。技術的なところでは、リスク・期待値最適化を含むポートフォリオ最適化、金曜商品の価格評価や設計、アルゴリズムトレードなどを含みます。今活発な分野ですので、これから言葉の意味する範囲がどんどん大きくなっていくものと思います。
その他、計算に関わるものとしては、クラウドコンピューティングやGPU計算、などがあります。GPUは画面を描画するチップで、大量の単純な計算を高速に行うことができます。これを使って、低コストなシステムで高速計算を行おうとするものです。クラウドコンピューティングは、データセンターに個人のデータ、プロジェクトのデータを置き、各端末と常に同期することでどこでも同じ環境で作業できることを可能にし、データの保存やアプリケーションの設定などを、どの端末でも簡単に同じ設定にできるようにしているものです。
デバイスに関しては、AR、VR といったものがあります。VRはバーチャルリアリティ(仮想現実)のことで、実際には存在しない空間、あるいは遠く離れた空間を再現し、ヘッドマウントディスプレイなどのデバイスを使って、臨場感高くユーザに伝える技術です。AR(Augmented Reality、拡張現実)は、ユーザの周りの現実空間に、あたかもそこにものがあるかのように映像を重ねて表示したり、音声を加えたりして、現実空間の上に他のものが存在しているように知覚させる技術です。