TOP>セミナー/イベント>開催報告>注目の新領域「データ準備」の最前線

注目の新領域「データ準備」の最前線

注目の新領域「データ準備」の最前線

2017年2月7~8日、日本初開催となるイベント『Big Data Analytics Tokyo』が六本木アカデミーヒルズで開催され、世界で注目されている新進のデータサイエンティストたちが2日間にわたって登壇しました。

12カ国から300名の参加者が集った会場では、英語をはじめ様々な言語が飛び交い、まるで海外で開催されているカンファレンスそのもの。インターナショナルな交流に刺激を受けつつ、ビッグデータ分析やマシンラーニング、データレイクなどのデジタル戦略は、グローバルで共通のビジネステーマになっていることを実感した方も多かったのではないでしょうか。

メイントラックでは、今注目されているデータ準備(データ・プレパレーション)分野のリーディングカンパニーとして、Paxata社の共同創業者兼CPO(最高製品責任者)のネンシャド・バードリワラ氏が招聘され講演を行いました。当日の講演をダイジェストでレポートします。

【データ準備の最前線】 ETLからの解放 ~思考速度の情報を求めて~

Paxata 共同創業者 兼 最高製品責任者(CPO)Nenshad Bardoliwalla氏

SiriやGoogleアシスタントは身近な人工知能の活用事例。でもビジネスの世界では?

この「Big Data Analytics Tokyo」では、人工知能やアルゴリズムなどの革新的なテクノロジーの実践例が次々に発表されています。SiriやGoogleアシスタントに質問をすると即座に答えを返してくれるような体験は多くの方が経験されていると思いますが、これも人工知能のテクノロジーを享受している身近な例です。しかし、これらのテクノロジーがビジネスにも同じように活用されているかというと、かなりの遅れを取っていると言わざるを得ません。

データドリブンな経営とともに、データを情報に換え、その情報をもとに意思決定する志向が一般化した一方で、ソーシャルメディアや決済機能をもったWebサイト、センサーなどの機械が絶え間なく作り出す新しいタイプのデータはどうでしょうか?

ログファイルのデータのままでは、意思決定をすることができません。完成されているか、整理されているか、統一されているか、そしてビジネスの課題に対して意味をもつのかどうか。実際に使える情報に換えられていなければ、データ活用は前進していかないのです。

講演の様子

ETLツールの専門性の高さが、データ準備のボトルネックに

この30年ほど、データの問題を解決するツールとしてETLが使われてきました。
ETLはITの専門家向けのプロフェッショナルなツールで、機能もそれぞれの用途ごとに専門化しています。業務部門からデータの提供を依頼されたら、ITの専門家たちはいくつものツールを使い分け、手作業でスクリプトを書き、コンピューターに指示を出さなければなりませんでした。

さて、その結果どうなったでしょうか?
このイベントに登壇されたデータサイエンティストの方々が口々に言っていたように、どの分析においても、分析を始める前の「データ準備」に80%の工数がかかるようになりました。分析を深めて最適な意思決定を導くための時間はごくわずかで、多くの人がデータをクレンジングすることに膨大な時間を費やしてしまっています。ですから今、データ分析の現場は非常に大きなボトルネックを抱えています。これまで誰も、この問題を解決できるツールを作ってこなかったからです。

データが必要なのは、データサイエンティストではなく「ビジネス部門の現場のユーザ」

私たちはこの問題に注目して、2012年にPaxataを設立しました。その時に描いたビジョンを共有させてください。

私たちは、「データを扱う人」に着目しました。データを扱う人は誰なのか、具体的に登場人物を挙げてみましょう。
まず筆頭に挙がるのは、データサイエンティストですね。彼らは高度なITスキルでRやPython、Scalaといったオープンソースのツールを使いこなし、組織にとって非常に価値のある人達ですけれども、人数としてはごくわずかです。

次に、データエンジニア、データディベロッパーと呼ばれる人達がいます。彼らはもう少し層が厚くて世界でも数億人にのぼり、企業から提供されるInformaticaなどの優れたツールを使っています。

続く大きな層には、ビジネスアナリストやインフォメーションワーカーがいます。Microsoft ExcelのピボットテーブルやVLOOKUP関数を使ってデータを検索、集計、可視化しながら、実際の業務に役立てている現場のユーザです。データの活用者として最大数を占める人たちですね。
彼らが手にしているデータは、データエンジニアやデータディベロッパー、IT部門が準備して提供したデータです。つまり、データが必要になったらそのデータが提供されるのを待たなければならないのです。

Paxataのビジョン:データ準備のセルフサービス化という新しい概念

この層の人たちに、これまでITの専門家だけが利用できていた「データを準備する機能」、たとえばデータ統合やデータ品質、マスターデータマネジメントなどの機能を提供できたらどうなるだろうか、と私たちは考えました。すぐにデータ準備ができるようになったら、データのクリーニングに80%の時間を使うのではなく、その80%をアルゴリズムや結論を導くための時間に使うことができます。間違いなく、次の大きな改革が起こるはずです。

これは2012年時点のアイデアでしたが、5年たった今、現実のものとなっています。
ビジネス部門の人たちは、Paxata をセルフサービスのデータ・プレパレーション・ツールとして使い、自分たちでデータ準備ができるようになりました。ビジネス部門の人たちだけではありません。データサイエンティストやデータエンジニアの人たちもPaxataを使っています。Excelを操作するのと同じ感覚のまま、クリック操作だけで、Paxataのプラットフォーム上であらゆる作業ができるようになりました。いくつものツールを使い分け、コードを記述しながらデータ準備を進めていた時代は過去のものとなったのです。

データ準備に必要なのは、思考速度でデータを情報に換えること

データ準備(データ・プレパレーション)分野の製品を比較調査したレポートでも、Paxataは業界リーダーとして評価されています。

シリコンバレーを拠点にしていますので、シスコやヤフー、インテルといった企業をはじめ、世界的な銀行や金融機関にもPaxataを採用いただいています。

データサイエンスの世界で3億のプロセスを実行する場合、これまでのETLツールでは難しかったことが、Paxataであれば短時間で完了できます。AIや分散コンピューティングなどの革新的なテクノロジーを採用していますから、どれだけ大容量のデータであっても、ユーザの思考と同じスピードで瞬時にデータを可視化し、必要なデータを準備できるのです。ひらめきや気づきを即座にデータに反映させられたら、これまで80%を費やしてきた時間を分析モデルやビジュアライゼーションの構築に充てることができるようになります。ビジネスの重要な判断を行えること、それこそが本来あるべき姿だと思います。

Paxataにご興味をお持ちいただけたら、アシストにご相談ください。皆さまのデータ準備をぜひご支援させていただきたいと考えております。

Paxataについてもっと詳しく

データ準備「Paxata(パクサタ)」

データ準備やデータ・プレパレーション・プラットフォームについての最新情報、またビッグデータの分析や、HadoopやSparkのテクノロジーの活用にお取り組みのお客様をご支援・ご提案させていただきます。
お気軽にお問い合わせください。

「Paxata」がデータ・プレパレーションツールの業界リーダーに!

独立系テクノロジー調査会社フォレスター・リサーチ社が2017年3月、初めて「データ・プレパレーション」をテーマとした製品調査結果を発表しました。データ・プレパレーション分野の代表的な7製品を評価し、それぞれの項目のスコアを公開しています。

Forresterリサーチレポート

Paxataは、「現在提供中の製品機能・サービス」において最高スコアを獲得し、総合スコアでも1位に評価されました。

ユーザ企業からの回答結果でも、Paxataはクリック操作だけでデータ準備ができるユーザビリティ、インサイトを得るまでの所要時間の短さ、などの項目で最高スコアをマークしています。

このレポートを期間限定でダウンロードしていただけます。
下記のボタンをクリックして、ぜひご覧ください。

資料をダウンロード

講演動画(全編)

Big Data Analytics TokyoでのPaxata社の講演を「動画」でご覧いただけます。

ページの先頭へ戻る