Paxataブログ

Paxataブログ>Paxataでデータプレップしてみよう!

  • データプレップを学ぶ
  • データ加工の悩みを解決
2019.08.23

Paxataでデータプレップしてみよう!

こんにちは。
アシストでPaxata(パクサタ)のエンジニアを担当しているフジイです。

前回の「Paxataとは?」の記事 に続いて、
Paxataがどんな製品なのか特長を知りたい!という方向けに、
Paxataの使い方を画面付きでご紹介します。

ログインから、データのプロファイリング、加工、データセットの作成まで、
具体的な流れをつかんでいただけます。

Paxataの基本操作

1.Paxataへログイン

まずは、Paxataにログインします。

ブラウザのログイン画面に、
「アカウントID」と「パスワード」を入力します。

Paxataは、すべての操作をサーバー上で行うので、
特別なモジュールやアプリケーションのインストールはいっさい必要ありません。

2.データのインポート

ログインしたら、
まずは、加工するデータをPaxataにインポートします。

今回利用するデータは、Webで実施しているキャンペーンの利用実績です。

データがPCにある場合(端末のローカルファイル)は、
エクスプローラーからその対象ファイルを
ドラッグ&ドロップでインポートします。

データベースやアプリケーションなどのデータソースを登録しておけば、
そこからインポートすることもできます。

3.データのプロファイル

データの加工を始める前に、
インポートして取り込んだデータの中身を確認してみましょう。


Paxataのプロファイリング機能を使うと、各カラムに、

  • 値が何レコードあるのか
  • ユニーク値はいくつあるのか

などを、すぐに把握できます。

このプロファイルを見て、もし不要なデータが見つかれば、
簡単に削除もできます。

4.データの加工

プロファイリングでデータの中身を把握できたら、
次はいよいよデータの加工へと進めていきます。

アンケートや顧客情報など、データに手入力された値が含まれる場合、
バラつきやゆらぎが多くなるため、
クレンジングや名寄せをして、データの精度を上げる必要があります。

ここでは「会社」に注目すると、
「株式会社」や「(株)」など、法人格がバラバラになっていることがわかります。

そこで、企業名の値をグループ化して、一括変換をかけていきます。

上記のように、Paxataが値を解析して、
グルーピング後の結果を自動で提案してくれます。

また、そのほかにもテーブルを整形する機能として、

Groupbyによる集計

Pivot(表形式からクロス形式への変換)

Depivot(クロス形式から表形式への変換)

Transpose(縦横変換)

なども簡単にできます。

下記の画面は、
キャンペーン名ごとのリードスコアを合計する際の「Groupby」の処理を画面上の操作で行っています。

また別の例として、
2つのデータを結合していくケースでは、

Paxataがデータを解析して、
この値とこの値で結合できそう、とおすすめの結合キーを提案してくれます。

JoinやVLOOKUPなどのお作法をまったく知らなくても、
Paxataの提案にそってクリックして選択していくだけで、結合を完了できます。

データの加工を進めていくうちに、
不要なカラムが発生すれば、カラムの削除も簡単です。

カラムの入れ替え、カラム名の変更なども、一括で行えます。

ここまで進めてきたすべての加工は、
加工ひとつひとつが「ステップ」として、
すべて自動的に保存されています。

下から上に向かって、加工や処理の流れがわかるようになっていますので、
処理の内容を変更したり、
処理の順序も、簡単に入れ替えることができます。

5.データのエクスポート

加工が完了して、データセットができあがったら、
CSV形式でエクスポートしていきます。

もちろん、CSV形式だけではなく、
DBやアプリケーションへ直接エクスポートすることもできます。

まとめ

「Paxataでデータプレップしてみよう!」というテーマで、
ログインからデータセットの作成まで、
Paxataの基本操作をご紹介してきましたが、いかがでしたでしょうか?

前回の記事「Paxataとは?」 では、
企業のデータ活用にPaxataをおすすめする理由として、
「ビジネス部門の現場のユーザーが使いやすい」を挙げたように、
どの操作も簡単で、使いやすいことがおわかりいただけたかと思います。

実際にPaxataを使ってみたい!という方は、
体験型のハンズオンセミナー を毎月開催していますので、ぜひご参加ください!

より本格的なご検討へと進まれる場合は、
1カ月間の無償トライアルやPOCのメニューもご用意しています。
ご利用にあわせて提案させていただきますので、ご相談ください!

【セミナー】この記事を読まれた方におススメ!

Paxataは毎月、体験型のハンズオンセミナーを開催しています。

セミナー会場では、お1人1台ずつのPCを使いながら、
講師のレクチャーにそって、Paxataの使い方をお試しいただけます。

2時間ほどのプログラムで、
概要と事例のご紹介、ハンズオンを体験できますので、ぜひご参加ください!

この記事をかいた人

クラウドベースのインフラエンジニアを経て、Paxataチームに加入。フィールドエンジニアとして、お客様のPoCの支援や、導入時の支援、コンサルティングを担当している。趣味は、読書。

関連している記事

  • データ加工の悩みを解決
2019.09.06

センサーデータの前処理ってどうする?大容量、JSON、縦横変換の課題を解決

IoT化の進展とともに、センサーデータの活用が目指されています。しかし、いざセンサーデータを扱おうとすると、そこには大きな壁が立ちはだかります。この記事では、大容量、JSON、縦横変換の3つのポイントからセンサーデータを簡単に扱う方法をご紹介します。

  • データプレップを学ぶ
  • データ加工の悩みを解決
2019.08.22

Paxataとは?

データプレップを採用する企業が、急速に増えています。今回のブログでは、Paxataがどんな製品なのか特長を知りたい!という方向けに、ややエンジニア目線からご紹介します。

  • 戦略/部門別アプローチ
  • データ加工の悩みを解決
2019.08.16

デジタルマーケティングに立ち向かう、マーケターのためのデータプレップとは

皆さまのマーケティング部門では、マーケターがデータをフル活用して企画や施策に活かしていく、そんなサイクルがまわっていますか?デジタルマーケティングが進むほど難しくなる、データの扱い方をテーマに取り上げます。

Paxata

ページの先頭へ戻る