TOP>セミナー/イベント>開催報告>アナリティクスがビジネスを変える!~AIデータ・プレパレーションがもたらす確かな知見とは。~

アナリティクスがビジネスを変える!~AIデータ・プレパレーションがもたらす確かな知見とは。~

アナリティクスがビジネスを変える!Paxata事例セミナー

「AI」と「データ・プレパレーション」をテーマにした本セミナーは、満席の300名で開会を迎え、会場内のブースにはデモやご相談に訪れる方であふれるほどに盛況なイベントとなりました。機械学習やデータ戦略への取り組みは、多くの企業に共通するビジネステーマとなっていることを実感された方も多かったのではないでしょうか。

このレポートでは、DataRobot シバタアキラ様による特別講演や、米国でのデータ・プレパレーションの先行事例をダイジェストでご紹介します。

目次

機械学習活用の発想術とそれを実現するデータマネジメント

DataRobot Japan
チーフデータサイエンティスト シバタアキラ様

今ビジネスの現場では、データ活用が大きなトピックになっています。
データ活用というと、これまでは統計分析やダッシュボードに代表されるように、過去のデータを見て、過去を理解することで、未来に何をすればよいのか知見を得るようなデータの使い方が主流でした。今はさらにテクノロジーが進んで、未来を予測するデータの使い方ができるようになっています。

今日は「機械学習」をテーマに、Paxataで準備したデータをもとにDataRobotで予測モデルを作りながら、将来何が起こるのかを予測したり、過去だけでなく未来を理解する新しい方法をお見せしたいと思います。

DataRobotシバタアキラ様

データ・プレパレーションは、機械学習の予測モデル構築に欠かせないステップ

機械学習では、人間がデータから学ぶのではなく、機械にデータを読み込ませて機械に学習してもらいます。これによって、より大量のデータを使って、より正確に、より早くモデルを作り、未来に対する予測を行えるようになります。

機械学習というと、このアルゴリズムの習得から入る方が多いのですが、実際に始めてみるとアルゴリズムは全体のプロセスのごく一部でしかないことがわかります。もととなるデータのクリーニングや欠損、変換、変数の掛け合わせなどにすべて対応して、ようやくアルゴリズムにデータを入れられるようになりますから、今日のセミナーのテーマになっている「データ・プレパレーション」がいかに重要かは、ここで強調しておきたいと思います。

ビジネスの価値を知っている現場のユーザーが、機械学習でアクションを変えていく

さて、皆さんは、予測モデルができあがったら機械学習はそこで終わりだと思っていませんか?
もしそう思われていたら、今日はDataRobotのすばらしさをご理解いただくチャンスですね(笑)。

DataRobotは世界のトップデータサイエンティストたちが集まった会社(本社:米国ボストン)で、機械学習のプラットフォーム開発にそのノウハウをつぎ込んでいます。DataRobotには、ニューラルネットワーク系のアルゴリズムを含めて1,000~2,000のアルゴリズムがあり、常に最新で最適なアルゴリズムを利用して非常に精度の高い予測モデルを構築できるようになっています。

機械学習の採用事例の中には、せっかく作った予測モデルがビジネス現場で使われていないというケースが少なくなく、予測モデルを作る側と使う側に乖離が見られることがあります。データの扱いに長けたビジネスを知らないデータサイエンティストと、データには詳しくないけれどデータの意味と業務を知っているビジネスユーザーという構図です。

DataRobotはこのギャップにアプローチできる機械学習のプラットフォームです。ビジネスの価値をわかっている担当者が、難しい数学や統計学をまったく意識せずに使える夢のようなツールをご提供しています。DataRobotが1番重要視しているのは「モデルを実際に使うこと」ですから、事業の中に導入して、その予測が人間の意思決定や行動を変えていくところまで、全体の枠を自動化できるのが最大の特長です。

DataRobotシバタアキラ様講演風景

Paxataでデータを準備して、DataRobotで予測モデルを構築!機械学習の実例を公開

ここからは実際に、予測の問題を解いてみたいと思います。

マーケティング担当者が、製品をシェアしてくれた顧客の傾向をつかみ、将来シェアしてくれる人を予測する

【仮説】顧客の購買動向とSNS上の口コミは関連があるのではないか?
【施策】将来口コミをしてくれそうな顧客を予測して、事前に施策を打ちたい
【データ】購買履歴/オンライン行動履歴(HDFS)、顧客マスタ(RDBMS)、SNSデータ(JSON)
【Paxata】顧客ごとのRFM集計、ターゲットフラグの作成、テーブルの整形
【DataRobot】予測モデルの作成、顧客の傾向を予測

【デモの手順】
(1)Paxataにローデータを取り込み、1つのデータに結合して集計処理を実施。
(2)機械学習にかけるためのデータ準備を完了させ、DataRobotに取り込む。
(3)DataRobotで機械学習を開始。データに応じた基本的な相関分析や多変量で自動的にパターンを導出。
(4)最適で精度の高い予測モデルを構築して、デモが完了。

Paxataデモ

ここまでのデモで、機械学習を使って予測モデルを作りました。DataRobotでは、できあがったモデルをすぐに使うことができます。先ほどお話したように、モデルは実際にビジネスで使うことが重要ですから、さっそくこのモデルを使って予測を立ててみましょう。

ここに新しい顧客データがありまして、将来製品をお薦めしてくれるかどうかまだわからない状態ですが、今作ったモデルに入れてみると、このようにすぐに予測値を出して、製品をシェアしてくれる確率の高い人が算出されました。マーケティング担当者はこの結果を見ながら、確率の高い人へのアプローチや、そうでない人へのアプローチを検討していけるようになります。この考えるプロセスはAIではリプレースできませんから、業務のご担当者が機械学習の予測値を見ながら、効率よく様々な施策を決めていけるところが機械学習の価値になっていきます。

機械学習では、何度もデータを作り直してモデルを完成させる。だからデータ・プレパレーションが重要

機械学習でモデルを作るとき、できあがったアルゴリズムはどのような特徴を見ているのか、要因や特徴量を必ず確認されますよね。今回のデモでは、購買頻度やソーシャルメディアの利用頻度などがインパクトを与えていることがわかりましたが、他にも重要なデータがあることがわかったり、別の仮説が立てられれば、またデータ準備のフェーズに戻って、Paxataで新しいデータを追加したり、必要のないデータを無くす作業が繰り返されます。

機械学習では、何度も何度もデータを作り直さなければならないので、いいモデルを作るためにはデータ・プレパレーションは非常に重要なステップです。Paxataを使うと、データ準備にかかる時間は半分以下になると思いますが、データ準備の手間や時間を減らせればモデルの生成もより簡単になり、モデルの精度が高ければモデルを検証する時間も短くなります。DataRobotのようにすぐに使えるプラットフォームがあれば、インプリにかかる時間はさらに減らすことができます。

機械学習のテクノロジーはまだまだ新しい分野ですが、もうすでにビジネスの現場で使うことができます。ビジネスの価値をわかっている現場の方が、現場にある課題を見つけて、課題設定をして、機械学習のテクノロジーを使ってその課題を解いて、アクションに落とし込んでいくことが可能になっていますから、ぜひ皆さんにチャレンジしていただきたいと思います。

アナリティクスに必要なデータを素早く手に入れる方法とは?

株式会社アシスト
情報基盤技術統括部 部長 花井正樹

急速なデジタル化の進行とともに、私たちの日常生活も、そしてビジネスの世界でも、よりいっそうデータが身近になってきています。企業内では、増え続ける多種多様なデータをいかに活用するか、近年は特にAIやBIのテクノロジーと融合した手法が模索されています。

アナリティクスに必要なデータを素早く手に入れる方法とは?_アシスト花井

キーワードは「セルフサービス化」

データドリブンな意思決定に欠かせないツールとして「セルフサービスBI」が広く普及した現在、データをめぐる志向にも大きな変化が見られています。アシストがこの夏に実施したアンケートでは、セルフサービスBIユーザー300名のうち8割を超える人が「分析に必要なデータも、セルフサービスBIと同じように自分で準備したい」と回答。これまではデータを受け取る側にいたビジネスユーザーが、データを収集して加工、準備するプロセスまで積極的に関わりたいと考えていることがわかりました。

データをめぐる構図にも、変化が起きています。エンタープライズ向けのクラウドサービスを利用して、現場のビジネス部門が自分たちで運用するケースも多くなってきました。これにより今までは社内だけにあったデータが社外で、つまりIT部門の外で生成されるようになり、IT部門の領域にも変化が迫られています。

また、それらのデータは構造化されていなかったり、RDBには入りきらない類のデータが多いため、まずはデータレイクに集約する手法が主流になっているかと思いますが、そこから先どうやって活用できるデータに換えていくか、新たな命題となりつつあります。

Paxata事例セミナー_講演会場

機械学習やアナリティクス用のデータを今すぐ準備するには

ビジネス部門は、どのようなデータを必要としているのでしょうか?

特徴としては、ワンタイム(One Time)性が高く、必要になる頻度の多さが挙げられます。この条件のこのデータがほしいという1回きりのリクエストがひっきりなしにあり、IT部門にデータの抽出や整形をいくつも依頼しているような状況です。たとえばマーケティング部門のキャンペーン分析を例にすると、MAの顧客行動履歴やSFAのパイプライン、基幹システム内の顧客情報や売上情報、メディアからのデータなどをそれぞれから取り寄せなければ、分析のスタートラインに立てません。機械学習用のインプットデータの準備でも、同じことが起きているはずです。

さらに、これらのデータはCSVやJSON、XMLと形式がバラバラなために、ETLやSQLを駆使したデータ準備が従来から行われてきたわけですが、この状況は「データ・プレパレーション 」によって一変しようとしています。

セルフサービスでデータを準備できるプラットフォーム「Paxata」

データ・プレパレーション は、これまでIT部門が担ってきたデータの収集、抽出、加工のプロセスをそのままビジネス部門に移し替え、現場のビジネスユーザーが自分たちでデータを準備していく手法です。冒頭にご紹介したセルフサービスBIユーザーの意向と一致するように、アナリティクスや機械学習を利用するユーザーがセルフサービスでデータを準備できる環境とそのための手段が求められています。

アシストでは昨年から「Paxata(パクサタ) 」のご提案を開始し、ビッグデータを扱う部門やデジタル戦略、AIや機械学習などに取り組む多くの企業が導入検討を進められています。

Paxataは、Excelのようなスプレッドシートであらゆるデータ処理を実行できます。そのままでは判読できないような可視性の低いJSONデータも自動的に構造化して可視化したり、ピボットテーブルはストレートテーブルに戻した上でスプレッドシートに展開してくれますから、ビジネスユーザーも簡単に使いこなせます。

複数データの結合では、キー項目の値を自動で検知して結合を提案してくれますから、SQLのJOIN処理を知らなくてもクリック一つでデータを結合できます。また、処理を実行する前には、プレビュー表示で変換後のデータを確認できますから、対話的にデータ・プレパレーションを進められるアプローチも大きな特長です。

次のセッションでは、米国でのデータ・プレパレーション事例をご紹介していきます。ご興味やご相談がありましたら、ぜひアシストにご相談いただければと思います。

データ・プレパレーションのユーザー事例(ダノン、Yahooのプロジェクト)

ahatis ゼネラルマネージャー
元ダノンCIO、デルモンテ・フーズCIO Timothy Weaver様

データ・プレパレーションの最新事例として、米国のダノン、デルモンテ・フーズ、Yahooを買収しAOL事業と統合したOathのデータ・プレパレーションプロジェクトを主導されたTimothy Weaver様から講演いただきました。

TimothyWeaver氏

【ユーザー事例】 ダノン

ギリシャヨーグルトの大ブームに、ダノンのサプライチェーンが追いつかなくなる

これまでプレーンヨーグルトが主流だったヨーグルト市場で「ギリシャヨーグルト」の大ブームが起こり、2009年にはわずか5%だった米国の市場シェアが2011年には50%へと拡大しました。このブームに商品の提供が追いつかず、米国全土で品切れが続出。消費者がヨーグルトを買いに店舗を訪れた時には、必ず棚にダノンの商品が陳列されて購入できるように、早急な対策が求められていました。

すべてのビジネスプロセスで発生する「データ」に注目

ダノンの事業全体にわたるサプライチェーンを見直したところ、まず、小売業者からダノンへの発注に問題があることがわかりました。小売業者は、過去の発注履歴をもとに発注数を割り出すため、急速に成長している商品は予測が難しく、売れるはずの数よりも少ない発注が続いていました。

また販売店舗では、ギリシャヨーグルトに割り当てられる棚割りスペースが従来のままだったり、棚の商品が品切れになってもバックヤードからすぐに補充されないなど、オペレーションの問題もありました。

ダノン側にも、原材料、需要計画/供給計画、プロモーション計画、配送にそれぞれ個別の問題がありましたが、どのビジネスプロセスにも共通しているのは、プロセスごとにデータが発生していることでした。

私たちはこのデータに注目することにしました。すべてのデータを集めて組み合わせることで、より詳細な、そして全体を俯瞰できる分析が可能になり、課題を解決できるのではないかと考えたのです。

「データ・プレパレーション」で、ビジネス課題をデータで理解し、データから改善策を探る

そこで、「Own the Order」という新しいプログラムをスタートしました。これは、ダノンに関するオーダー(発注や依頼)はすべて自分に関係するものとして扱っていこうという取り組みです。

B2Cではよくあることですが、発注を考えるのは小売、製造して提供するのはメーカー、と機能で分断されています。ダノンは、すべてのビジネスプロセスをつなぎあわせ、すべてのプロセスに関わっていけるように発想を切り替えました。

この取り組みの基盤となったのが、「Paxata」です。以前であればETLを採用していたと思いますが、今回は3つの理由からPaxataの採用を決めました。

Paxataを評価したポイント

【1】 多様なデータセットに対応できる
各プロセスからデータを集めてみると、形式も種類もバラバラで多様化を極めていた。Paxataなら1つのプラットフォームですべてのデータを扱えるのが魅力的だった。

【2】 短時間でスピーディにデータを準備できる
ETLではロジックを作るだけでも1ヶ月はかかっていたはず。Paxataならその場ですぐにデータを準備でき、そのままQlikViewに取り込んで分析をスタートできる。

【3】 現場のビジネスユーザーが自分でデータを準備できる

複雑なビジネスロジックに基づいたローデータをそのまま見て意味を理解し、そこから改善の施策を立てられるのはビジネス部門のユーザー。Paxataなら特別なITスキルがない現場のユーザーでも、すぐに使いこなせる。

ビジネス部門がセルフサービスで、サプライチェーンの最適化戦略を実行

Own the Orderのプログラムを開始した初年度、ダノンは18%もの急速な事業成長を達成できました。対象の全米4,000店舗に対して、個々の店舗ごとに販売の予測を立て、在庫の推移をわかるようにし、棚から商品がなくなった時には補充のタイミングを提案できるようになりました。在庫の状態に合わせて、正しい価格で、正しいタイミングで、正しいプロモーションを適切に実行し、販売機会を拡大できるようになったのです。

このプロジェクトのポイントは、ビジネスを理解している現場部門のユーザーが、自分たちでデータを見ながら課題を発見し、改善に取り組んだことです。ダノンはセルフサービスBIとしてQlikViewを導入していましたので、ビジネス部門はすでにデータの価値をわかっていて、データの持つ力を知っていました。ローデータを分析することの重要性も理解していましたから、パワフルにデータを活用できました。

データ・プレパレーションは、新しい手法として注目している方も多いかと思います。データの価値を最大化できる有用な選択肢ですから、データ活用に取り組まれている企業はぜひいちど試していただきたいと思います。

Paxataについてもっと詳しく

Paxata

機械学習やアナリティクスに必要なデータの準備に、Paxataはパワフルなプラットフォームとしてご利用いただけます。
クラウドサービスの「Paxata Cloud」や、Paxataを実際に操作できるハンズオンセミナーも開催しています。
ぜひお気軽にお問い合わせください。

データ準備の課題を解決する10のヒント

「データ・プレパレーションとは?」AIや分析用データをすぐに準備できる新しい方法

機械学習やアナリティクスに欠かせない「データ・プレパレーション」について、動画でご覧いただけます。


Facebookで情報をお届けしています

Facebookでは、アシストの「今」を週3回のペースでお届けしています。「めげない、逃げない、あまり儲けない」を合言葉に日々頑張っておりますので、応援よろしくお願いします。



ページの先頭へ戻る