Paxataブログ

Paxataブログ>データプレップでよく使われるPaxataの機能 ベスト20

  • データプレップとは
2020.03.24

データプレップでよく使われるPaxataの機能 ベスト20

よくあるデータ準備とは?代表的なデータ加工の例をクローズアップ

AIや分析、機械学習の事前準備として、どのようなデータ加工を実施されていますか?
多くの方がExcelなどのスプレッドシートを使って、手作業でデータを仕上げているのではないでしょうか。

たとえば、よくあるデータ準備の例として、このような加工があります。

よくあるデータ準備の加工例

  • VLOOKUP
  • IF関数
  • 日付データの加工
  • 行列の入れ替え
  • ピボットテーブルの変換
  • フィルター、フィルタリング
  • 検索
  • 置換
  • 重複削除
  • セルの分割、結合
  • 文字列の分割、結合、抽出
  • 空白やスペースの削除

「まさにこの加工をしている」という方も、「難しくてできていない」という方もいらっしゃるかもしれません。

今まで当たり前のように時間を費やしていたデータの加工は、データプレップという新しい手段があれば、もっと簡単にもっと早く進めることができます。

この記事では、企業向けデータプレップツールの「Paxata(パクサタ) 」を使って、上記のようなデータ加工をどのように解決できるのか、くわしくご紹介していきます。

Paxataの機能を一挙に紹介!よく使われる機能ベスト20

Paxataでよく使われる代表的な機能について、画面イメージとともにわかりやすくご紹介していきます。
記事の最後では、すべての機能を一覧できるPDFもダウンロードしていただけます。


1.空白

値に含まれる空白をハイライトで表示。
スペース、タブ、改行、改ページをひとめで見つけられます。

2.パターン

同一の値を色分けして表示。
重複や繰り返しを把握できます。

3.範囲

数値の大きさをグラフで表示。範囲の大小を視覚的に確認できます。

4.分割

1つの値を複数のカラムに分割。
カンマやアンダーバー、スペースなどで区切られた文字を分割して、新しい列として追加できます。

5.プロファイリング

データの傾向を把握したり、値を選択して絞り込めます。

6.削除

不要なデータを削除。
行や列、05のチェックのように条件に基づいた削除もできます。

7.よこ結合

JOINのよこ結合。
データを解析して、マッチングできそうな結合キーを表示してくれます。

8.たて結合

UNIONのたて結合。
複数データも簡単に統合できます。

9.自動採番

データに連番を持つ列を追加。
すべての行に一意の番号を割り振ります。

10.名寄せ

類似値をグルーピングして、表記のゆらぎをまとめて検出。
揃えたい値に一括変換できます。

11.置換

指定した文字列を任意の値に置換。
表記のゆらぎを瞬時に解消できます。

12.集計

カラム内の同一の値をカウントして、レコード件数を表示します。

13.ピボット

ストレートテーブルのデータをクロス集計表へ変換。
対象の列と行を選択するだけで、ピボットテーブルを作成して集計処理を行えます。

14.デピボット

クロス集計表を単純集計の表形式にボタンひとつで変換。利用しやすいデータに戻せます。

15.ステップ

データ加工の順序と内容を自動で記録してくれるので、どうやって加工を進めてきたのか一目瞭然でわかります。

16.ステップの入替

ステップはドラッグ&ドロップで入替が可能。
ステップの変更に合わせて、データも連動して変更されます。

17.データの入替

各ステップで使用しているデータを選び直すだけで入替が完了。
即座に処理プロセスの再利用が可能に。

18.エクスポート

利用先のフォーマットを選択するだけで、できあがったデータセットをエクスポートできます。

19.バージョン

データが登録されるたびにバージョンを自動記録。
データの版管理も自動化できます。

20.共有

ステップやデータセットは、他のメンバーやグループと共有。
ガバナンスを強化しつつ、再利用して生産性を向上できます。

Paxataで、データプレップをもっと簡単に!

ご紹介した20パターンのデータプレップは、Paxataならすべてクリック操作で実行できます。
そのため難しい関数や数式を記述することなく、必要なデータを必要な人が自分で準備することができます。

Excelの達人やデータサイエンティストが身近にいれば心強いですが、いつも同じメンバーを頼るわけにはいきませんし、いつまで頼れるかもわかりません。

DXの取り組みが進むほど、データを自由に扱えるメンバーは多ければ多いほうが望ましく、データの活用度も飛躍的に高まります。

また、データの民主化を目指す組織では、データリテラシーの向上はマスト要件になりつつあります。


誰でも簡単にデータプレップができる新しい手段として、ぜひPaxataを使ってみませんか?


【資料】機能一覧をPDFでダウンロード!

【セミナー】20のデータプレップを2時間で体験!

この記事をかいた人

2001年、アシスト入社。BIやSFA、EAI、ETL製品のマーケティングを経て、2016年より「Paxata」の立ち上げに参加。データプレップ分野のアウェアネス向上とマーケティングを担当している。
趣味は、レンタルファームでのオーガニックの家庭菜園と、ファームで飼っているヤギたちのお世話。

関連している記事

  • データプレップとは
2019.08.23

Paxataでデータプレップしてみよう!

ログインから、データのプロファイリング、加工、データセットの作成まで、実際のデータプレップの流れをPaxataで進めていきます。

  • データプレップとは
2019.08.22

Paxataとは?

データプレップを採用する企業が、急速に増えています。今回のブログでは、Paxataがどんな製品なのか特長を知りたい!という方向けに、ややエンジニア目線からご紹介します。

  • データプレップとは
2019.08.06

データプレップとETLは、何がちがうの?

Paxataはデータプレップという分野の製品ですが、お客様から「データプレップとETLは、何がちがうの?」と聞かれることがあります。そこで今回は、データプレップとETLツールの違いをいくつかの観点から比較してみたいと思います。

ページの先頭へ戻る