アシスト

製品

Paxataとは

データ・プレパレーションにセルフサービスの発想を

Paxata(パクサタ)は、エンタープライズのデータ・プレパレーションを実現するまったく新しいツールです。
分析や機械学習、レポートに必要なデータは、これまでIT部門が主体となってETLやプログラミング言語など高度なITスキルで準備していましたが、Paxataは従来の手法とは完全に異なるアプローチで、データの準備を可能にします。

セルフサービスの発想をいち早くこの領域に導入したPaxataは、ビジネスデータに知見を持つ現場のユーザーが自分のほしいデータを自分で準備できる環境を提供します。ユーザーは視覚化されたデータを見ながら、クリックだけのシンプルな操作で、すばやく簡単にノンコー ディングでデータを作成できるようになります。すべてをサーバで管理するため、セキュリティとガバナンスの効いたプラットフォームと して、企業のデータ・プレパレーションへの取り組みをご支援します。

データの可視化から、整形・加工・抽出まで!
あらゆるデータ準備のニーズをカバーする機能群

9つの主な機能

  • データ追加

    データベースやHadoop、Amazon S3、Amazon Redshift、Salesforceなど、ビジネスで利用されている様々なシステムをはじめ、半構造化データを含めたローカルファイル(Excel、CSV、JSON、XML、Avro、Parquetなど)を取り込みます。

  • 探索

    データを視覚的にプロファイリングすることで、データの傾向を即座に把握できます。
    データの検索や、異常値・重複値の検知や削除など、ゆらぎのない高精度なデータを作成します。

  • 整備と変更

    SQLやマクロなどをコーディングすることなく、選択肢をクリックするだけのシンプルな操作でデータを加工できます。
    実施した処理の結果はリアルタイムに画面に表示されるので、加工内容をひとつひとつ確認しながらデータ準備を進められます。

  • 整形

    クロス集計表を通常のテーブル形式へ変換したり、テーブルの縦横変換、ピボットテーブルの作成、明細データの集計など、様々な整形処理を画面上の操作で行えます。

  • 統合

    データを取り込むと結合キーの候補が自動的に表示されるため、ExcelのVLOOKUPやSQLのJOINを用いることなく、クリックの操作だけでデータを結合できます。
    結合結果はプレビュー画面に瞬時に表示されるため、結合条件の変更もミスなく正確に実行できます。

  • 強化

    アルゴリズムを指定するだけで自動的に値のグルーピングを実施。
    データに含まれる表記の揺れを効率的に解消し、良質なデータを生成します。
    これまで目検でチェックしていた名寄せ作業から解放されます。

  • 発行

    Paxataで加工したデータをアンサーセットとして発行し、他のユーザーと共有したり再利用できます。
    条件を指定してアンサーセットを発行したり、任意の加工ステップを自由に指定し、特定の処理までの結果を発行することもできます。

  • エクスポート

    アンサーセットをCSVやExcel、JSON、XMLなどのファイル形式でエクスポートしたり、データベースやHadoopなどのエンタープライズシステムへもエクスポートできます。

  • 共有とガバナンス

    データセットやアプリケーションはすべてPaxataのサーバ上で一元管理されるため、セキュアな環境でリソースを共有できます。
    ユーザーが実行した作業は常にログに記録されるため、だれが、いつ、どのデータに対して、どのような加工を実施したのかをトレースできます。

10

Excelを使わない10の理由

あらゆる種類のデータやテーブル、大量データを全社規模で扱う場合は、Paxataが最適です。

1データプロファイリング


zoom_in クリックで拡大

Excel

  • Excelで列にフィルターを作成する場合、列に何千もの異なる値や、スペルミス、重複が多数含まれているとまずはその対応から始めなければなりません
  • 列内にあるすべての値を表示するには長いスクロールが発生し、値の選択には何度もクリックを繰り返さなければなりません
  • Excelのフィルターは、値の分布を見やすく可視化してくれないため、ピボットテーブルとフィルタリングされたデータを行ったり来たりしてデータを理解する必要があります

Paxata

  • 値のハイライト機能でデータを視覚的にプロファイリングし、即座にデータの傾向を把握できる
  • 値をクリックするだけで、データにドリルインして品質をチェックし、そのまま変換や加工へと進められる
  • filtergrams™(フィルターグラム:フィルタ ーとヒストグラムを組み合わせたフィルターパネル)を利用して、重複や異常値をすばやく検知し、エラーや空白を取り除ける
  • 膨大なデータであっても、高い精度ですばやく簡単に作業できる

2データクレンジング


zoom_in クリックで拡大

Excel

  • 単純なロジックを適用するだけでも、複雑な数式を記述しなければなりません
  • データにスペルミスやゆらぎがあると、手作業で表記を統一する必要があります
  • データの加工途中で表記の誤りに気付いた場合、再度手作業で修正する必要が出てきます

Paxata

  • 自然言語処理を採用したデータクレンジングのアルゴリズムを内蔵しています
  • フィルターグラムを利用して特定の値に絞り込みを行い、ロジックを適用できます
  • Cluster & Edit™機能で列内のすべての値を解析し、近似値をグループ化して表示
    データの正規化を簡単に、システムに負荷をかけずに実行できます

3データ結合


zoom_in クリックで拡大

Excel

  • データセット内のすべての列名を読み込むため、列数が多いテーブルを扱う場合はやっかいな作業になります
  • 認識できないような列名の場合は、データの中身を目検でチェックして理解する必要があります
  • データのマージにはVLOOKUP関数を多用しなければならず、エラーが発生しやすくなります
  • データの中身を理解していないと、正確で完全な分析ができなくなるリスクが高まります

Paxata

  • 機械学習を活用した結合処理のアルゴリズムを内蔵しています
  • キー項目の値を行単位でプレビューしたり、結合条件をUIで指定するなど、インタラクティブに直観的な操作でデータを結合できます
  • どのようなデータ結合を行ったのかをプレビューで即座に確認できます
  • 列結合結果をアンサーセットとして登録できます(登録後、必要なデータ形式で 抽出可能)

4ビッグデータ


zoom_in クリックで拡大

Excel

  • 最新バージョンのExcelを使用している場合でもデータが100万行を超えるとデータ が切り捨てられてしまいます
  • 行数が多くなるほど処理速度が遅くなり、クラッシュするとそれまでに実施していたすべての変更を失う可能性が高くなります

Paxata

  • Excelを操作している感覚で、あらゆるサイズのデータをインタラクティブに扱えます
  • データの一部のみをサンプリングするのではなく、すべてのデータに対して加工を実施できます

5再利用と反復性


zoom_in クリックで拡大

Excel

  • ワークフローを再利用するには、マクロやVBAでのコーディングが必要となり、現場のビジネス部門で使うには難易度が高くなります

Paxata

  • データの処理内容と手順を自動的にドキュメント化して、プラットフォームに保持します
  • ドラッグ&ドロップだけで、データ処理の順番を入れ換えたり追加できます
  • すべての人が、データ処理の履歴をブラウザから見られます(権限に応じた範囲について)
  • 各データ処理に注釈を付けて、業務に即した情報を記録しておけます
  • 新しいデータに対してもこれまでの処理を適用したり、任意の時点からやり直すこともできます
  • 処理ステップを複製して、別のデータやプロジェクトに再利用できます

6データソース


zoom_in クリックで拡大

Excel

  • Excelにインポートできるのは下記のデータに限られます:
    - 構造化フラットファイル
    - SharePoint / OneDrive
    - SQLデータベース

Paxata

  • 様々なエンタープライズシステムおよびクラウドのデータソースに、すばやくアクセスしてインポートできます
  • Excel、CSV、txt、JSON、XML、Avro、固定幅などのフラットファイル
  • Hadoopデータレイク、Amazon Redshift、S3、NoSQLデータベースの半構造化データ
  • データベースや、Salesforceのようなビジネスアプリケーション内の構造化データ

7コラボレーション


zoom_in クリックで拡大

Excel

  • Excel 365のライセンスが無い場合には、ユーザーとの共有手段はメールでの添付ファイルの送信に限られます
  • 業務のサイロ化につながりかねません

Paxata

  • AWS、Azure、その他企業で利用しているクラウドサービスで運用できます
  • 透明性の高い共通基盤で、データの共有や処理の再利用をチームや全社で行えます
  • セキュリティの保たれた安全な環境で、機械学習のアルゴリズムを取り入れながら作業できます
  • 加工処理の履歴管理や監査、バージョン管理、使用状況のトラッキングなど、エンタープライズに必要なデータ・プレパレーションを実現します

8バージョン管理


zoom_in クリックで拡大

Excel

  • バージョン管理ができないため、ブックや版の複製がいくつも作られます
  • 行った操作を「元に戻す」ことができる回数は限られています
  • ファイルを閉じると「元に戻す」ことができなくなります

Paxata

  • いつ時点のデータであっても抽出や保存ができます。どのようにデータのソート、フィルタリング、クレンジング、変換が行われたのか履歴も保存できます
  • データの取得から変換、公開までのすべての履歴をドキュメントとして残せます
  • 加工処理が作成/変更された日時や、作成者を記録しています
  • 「元に戻す」回数は無制限ですので、どの状態にも何回でも戻すことができます

9透明性とデータガバナンス


zoom_in クリックで拡大

Excel

  • 監査やデータリネージ(このデータがどのような経緯を経て作成されたか)の考え方はありません
  • 複雑なマクロの記述に膨大な時間を費やすにも関わらず、その手順は記録されません
  • 版管理するためには、すべてのバージョンのExcelを保存し、変更箇所を記述しておく必要があります
  • ファイルを閉じてしまうと、変更を「元に戻す」ことはできません

Paxata

  • データリネージとすべての履歴は自動的に保存されます
  • 権限を持つユーザーであれば、ユーザーごとのアクション履歴をすべて見ることができます
  • すべてのステップと処理内容は自動的に保存されドキュメント化されます
  • Click to Prep™を行うことで、QlikSenseやTableauなどのBIツールで指定したデータをPaxata内で加工できます。データ処理から分析までを管理するため、監査に必要な追跡調査に対応できます

10セキュリティとアクセス制御



zoom_in クリックで拡大

Excel

  • 機密性の高いデータを個人のローカルPCに保管するのは、セキュリティ上の問題を残したままとなります
  • ドキュメントが壊れたら、データを損失するリスクがあります
  • データの一部を他のユーザーと共有するには、別のスプレッドシートにデータをコピーする必要があります
    これは、データをそのコンテキストから取り除くことを意味します

Paxata

  • 情報は安全な共有基盤で管理されます
  • 共有基盤を利用することで、すばやく簡単に、そしてセキュアにデータにアクセスできます(IT部門に依存するこ となく)
  • アクセス権限は、ユーザー、グループ、データセット(Paxataで利用するデータ)、データプロジェクト(Paxataで作成するアプリケーション)ごとに設定できます

ライセンス
ご利用方法をお選びいただけます

Paxataは、2つのライセンス形態をご用意しています。利用用途や目的にあわせて選択いただけます。

keyboard_arrow_up