アシスト

テーマ

教師データをPaxataで準備してDataRobotで予測!
より大きなビジネスインパクトへ

DataRobotがもたらしたAIの民主化により、機械学習へのチャレンジはこれまでになく身近になりました。

あらゆる事業部門のユーザーが最新のテクノロジーを簡単に利用しながら、難しい数学や統計学をまったく意識することなく、最先端のアルゴリズムに基づいた予測を手に入れられるようになっています。


ところが、「DataRobotにデータを入れるとわずか10分で予測モデルを作成できるのに、そのデータの準備に80時間もかかっている」というようなユーザーの声が聞かれるようになりました。機械学習の取り組みが進むほど、新たな次の課題として、教師データの準備がボトルネックになるケースが増えてきています。

  • DataRobot チーフデータサイエンティスト シバタアキラ氏

    DataRobot チーフデータサイエンティスト シバタアキラ氏

    アシスト主催セミナーでの講演より(2017年10月20日 )


    機械学習は、何度も何度もデータを作り直さなければならないので、いいモデル作るためにはデータ準備は非常に重要なステップです。データ準備手間時間を減らせれば、モデルの生成もより簡単になり、モデルの精度が高ければ、モデルを検証する時間も短くなります。

機械学習における「データ・プレパレーションの重要性」とは?

教師データの準備では、データの結合や名寄せ、クレンジング、変換、欠損値の補正などに多くの時間がかかっていませんか?
予測モデルが生成された後も、モデルの要因や特徴を見ながら、何度もデータを作り直してモデルを洗練させていくため、データの準備は手間も工数もかかりがちです。
予測モデルの精度向上には、入力されるデータが確かなものでなければならないため、データ・プレパレーションは機械学習の成功を左右する重要なファクターとなっています。

90%がデータ・プレパレーションの重要性を実感!

実際に、機械学習の現場では、ユーザーの90%が「事前のデータ準備が重要である」と考えています。
機械学習の実践が長く、より多くの予測分析テーマを検証しているユーザーほど、その重要性を実感しています。

アンケート回答結果

つまづきやすいデータの準備

機械学習のためのデータは、その重要性が認識されながらも、なかなか簡単に思いどおりには準備できません。
DataRobotに代表される、すぐれた機械学習プラットフォームによってモデルの生成プロセスは自動化が進む一方、元となるデータは私たちが手動で準備しなければならないからです。モデルの生成スピードが上がるほど、データ準備にかかる時間が機械学習のボトルネックになってきています。

《データ準備の課題》

  ・ExcelやR、Pythonでのデータ加工はもう限界
  ・センサーの時系列データは、コーディングでしか整形できない
  ・高度で複雑なデータ加工は、専門スキルを持った人にしかできない
  ・サンプリングでは予測の精度が下がるから、全件データを扱いたい
  ・JSONやXMLは可読性が低くて、簡単に扱えない
  ・いろいろなパターンの予測モデルを検証したいのに、データを準備できない

DataRobotのスタートボタンをもっと早く押すには

DataRobotを導入して、これまでにないほど早く多くの予測ができるようになったなら、データ準備における時間のロスは早期に解決しておきたい課題です。

モデル生成のスタートボタンをもっと早く押すには、これまでのデータ準備の方法を疑い、新しい方法に置き換えることで、従来は当たり前のようにかかっていた時間と手間を圧倒的に短縮できます。

Paxataでデータ準備をスピードアップ!
DataRobotでより多くの予測分析テーマを検証できるようになる

Paxataなら、DataRobotのための教師データをすばやく短時間で準備することができます。
今までのExcelや、R、Python、SQLなどのプログラミング言語、さらにETLやEAIとも異なるまったく新しい方法で、機械学習や分析のためのデータを作成できるようになります。
教師データの準備にかかる時間を圧倒的に短縮することで、予測モデルへのステップを早め、データを簡単に作り直せることで、さらに多くの予測分析テーマを検証し、モデルを洗練させていくことが可能になります。

予測分析テーマを検証


《Paxataなら》
  ・ビジネス部門のユーザーが、自分で思いどおりのデータを準備できる
  ・Excelのようなスプレッドシートで、データの取り込みから加工、整形ができる
  ・あらゆる形式のデータを簡単なクリック操作で扱える
  ・加工を選択するだけで加工後のデータをプレビューでき、手戻りなく進められる
  ・大量データを全件扱えるため、サンプリングによる精度低下を解消できる
  ・加工の手順や内容を何度でも繰り返し再利用できる
  ・サーバ環境でデータを準備するため、ガバナンスを両立できる

PaxataとDataRobotで、もっと大きなチャレンジへ

教師データをPaxataで準備し、DataRobotで予測モデルを作成できるようになると、これまでとは桁違いのスピードで、桁違いの仮説や分析テーマを導き出すことが可能になります。

機械学習の価値は、ビジネス部門のユーザーが現場にある課題を見つけて仮説を立て、機械学習のテクノロジーを使って検証し、課題を解いてアクションにつなげていくことにあると言われています。

予測モデルの生成がDataRobotによって自動化された今、機械学習の成功のカギは、ビジネスの現場にいるユーザーが事業の知見を活かしながらデータを活用できるかどうかにかかっています。Paxataのデータ・プレパレーションを新たな手段に、さらなる機械学習のチャレンジを進めてみませんか?

※アシストとDataRobotはテクノロジーパートナーシップを締結しており、機械学習における取り組みをご支援しています。

【ホワイトペーパー】機械学習とデータ・プレパレーション

機械学習とデータ・プレパレーションをテーマに、「予測モデルの精度を上げる10のヒント」をわかりやすくご紹介しています。

DataRobotセミナー(名古屋)
keyboard_arrow_up