TOP>企業情報>コラム>技術情報>ビジネスを加速する、ストレスなき情報活用インフラ!Vertica活用ケーススタディ

ビジネスを加速する、ストレスなき情報活用インフラ!Vertica活用ケーススタディ

Vertica

情報系システムのパフォーマンス改善、運用管理コスト削減に貢献するデータベース、「HPE Vertica」。データ処理の高速化は、ビジネスを加速します。本稿では、検索/分析用途専用のデータベースであるHPE Verticaを導入した企業が、どのような課題を抱え、それを解決する手段としてなぜHPE Verticaを選択したのか、代表的な事例パターンをピックアップしてご紹介します。BIやビッグデータ分析基盤のパフォーマンス、運用コスト、導入費用などに課題をお持ちの方の参考になれば幸いです。



HPE Vertica(以下、Vertica)は、2012年の米国大統領選挙において、オバマ陣営がクラウド上でビッグデータ分析に活用したことでも知られるデータベースですが、業種/業態に関係なく、様々な企業の情報系システム全般で幅広く活用されています。

Verticaの特長については、アシストが運用する「Vertica技術情報サイト」でご紹介していますので、そちらも併せてご参照ください。

Verticaとは

それでは、代表的な事例をもとに、Verticaがどのような理由で採用されているのかをみていきましょう。

  • A社:既存汎用データベースからの検索性能を大幅改善。チューニングレスでも5分が3秒に
  • B社:既存DWHアプライアンスの検索性能が最大20倍向上。コストは5分の1に
  • C社:Hadoop上のビッグデータ分析が数時間から数分に
  • D社:1,000人が2TBのデータをクラウドで活用。ピーク時のレスポンスも5秒以内に
  • E社:BIごと刷新して大幅なコスト削減と様々な情報提供が容易に

A社:既存汎用データベースの検索性能を大幅改善。チューニングレスでも5分が3秒に


A社は、汎用データベースで構築した大規模DWHシステムで、売上/収益/在庫などの分析業務を全社的に展開していました。しかし、運用を開始して間もなく、次のような課題が顕著になってきました。

課題


  • 検索業務の多様化/データ量の増加によって、慢性的な性能劣化が発生している
  • 業務繁忙期の大幅なレスポンス劣化で、ユーザ満足度が低下してきた
  • チューニングにかかる運用工数が増加傾向にあり、他業務を圧迫してきた

A社は、ユーザの業務効率化のため、これまで個別に運用していた分析システムの統合を進めていました。しかし、分析データ量やユーザ数の増加などにより、検索結果が戻らない、タイムアウトするといった状況が発生していました。そのため、データベースにインデックスを追加したり、実績データをサマリーしてから提供するなど、暫定的な措置で回避していましたが、バッチ処理を遅延させるなど、システム全体に与える影響が無視できなくなり、抜本的な解決のためにプラットフォームの刷新を決断しました。

そこで、DWH専用のデータベース製品をいくつか比較検討した結果、Verticaがチューニングをしなくても高い検索性能を持ち、将来的なデータ量/ユーザ数の増加にも不安がない製品であることが分かりました。具体的には、汎用データベースの検索性能と比較して数十~数百倍、他のDWH専用データベース(列指向型、DWHアプライアンス)と比較しても数倍~数十倍の検索パフォーマンスを発揮しました。また、大規模DWHシステムには不可欠な同時実行性の高さも実証されました。

Verticaを導入したことで、検索レスポンスが大幅に改善され、高度な分析も即座に実施可能になるなど、ユーザ満足度も大幅に向上しました。

解決/効果のポイント


  • DWH専用データベースを検討した結果、性能面/価格面で最もパフォーマンスが高かったのがVerticaだった
  • 汎用データベースからVerticaに置き換えるだけで、5分かかっていた処理がチューニングを行うことなく3秒で処理できるようになった
  • 検索レスポンスが大幅に改善され、ユーザ満足度が向上した
  • すべての処理で安定したパフォーマンスが提供できるようになり、チューニングにかかる運用工数が大幅に削減された

なぜ「Verticaはチューニングしなくても高速なのか?」については、過去の記事でもご紹介していますので、そちらもご参照ください。

検証結果に見る、Verticaの特徴と独自性

B社:既存DWHアプライアンスの検索性能が最大20倍向上。コストは5分の1に


B社は、データ量が20TB以上の検索業務を実施する必要があり、DWHアプライアンスを購入して運用していました。しかし、DWHアプライアンスの保守切れまで1年を切ったため、このままDWHアプライアンスの利用を続けるべきかどうか検討を開始しました。そのときの課題は、次のようなものでした。

課題


  • DWHアプライアンスは、EOSL(End Of Service Life)の5年ごとに買い直しとなり、その都度2億円程度の高額な費用を支払う必要がある
  • DWHアプライアンスの積み重なる高額なコストが、戦略的なIT投資の足かせとなっている

DWHアプライアンスの場合、専用ラックにマウントされる専用ハードウェアであるため、システム拡張もアプライアンス単位といった問題がありました。そのため、次のEOSLまでのデータ量や性能を考慮する必要があり、オーバースペックな機器構成になりがちでした。

そこで、専用ハードウェアを必要とせず、柔軟にシステム拡張ができるDWH専用データベースをいくつか比較検討した結果、オンラインで容易にシステム増強でき、高い検索性能を発揮したVerticaが採用されました。また、システム拡張しやすいデータ容量課金であること、検証/開発/DR環境に対しては課金されないことも高く評価されました。

Verticaを導入したことで、環境構築から運用後のメンテナンスコストが大幅に削減され、既存環境以上に高パフォーマンスを実現しました。その結果、データ量を数PB規模まで拡張して運用されているとのことです。

解決/効果のポイント


  • DWHアプライアンスに比べて、1TBあたりの所有コストを80%削減、バージョンアップライセンス費用(2億円程度)を大幅に削減できた
  • 15時間以上かかっていた検索業務が20分の1の1時間以下に短縮され、バッチロード時間も3倍高速になるなど、パフォーマンスも大幅に改善された
  • 必要に応じて、安価で高性能な汎用サーバで柔軟にシステム拡張ができるようになった

C社:Hadoop上のビッグデータ分析が数時間から数分に


C社は、大規模データ処理基盤のHadoopクラスタ上で、ゲームユーザのアクセスログ、行動ログなど数PB規模のビッグデータを蓄積して、KPI分析やアドホック分析を行っていました。拡大する対象サービスや新規サービスのリアルタイム分析環境の整備が求められる中、当時の課題は次のようなものでした。

課題


  • アナリストがより多くのサービスをよりスピーディに分析できる環境が必要になってきた
  • 試行錯誤しながら仮説検証を自由に行える環境が必要だが、結果が返るまで数時間かかる

Hadoopは、大量データのバッチ処理は得意ですが、リアルタイム処理は苦手と言えます。そのためC社では、Hadoop で処理されたHDFS(Hadoop Distributed File System)上の大量データを、簡単、高速、高度に分析できるVerticaを評価/採用しました。しかし、Verticaはデータ容量課金であるため、すべてのデータをVerticaに置くのではなく、Hadoop上のデータでも、重要かつリアルタイム性が求められる分析データのみを取り込んで処理することにしました。その結果、これまでデータサイエンティストにしかできなかったビッグデータ分析が、既存DBAもスキル習得なしにできるようになりました。また、Verticaは、空間解析などの独自の関数をあらかじめ用意しており、R言語などによるユーザ定義関数も容易に作成できるなど、豊富な分析機能も提供しているため、高度で高速なビッグデータ分析が、誰でも簡単に行えるといった副次効果もありました。

解決/効果のポイント


  • KPIレポート作成が数時間から数分に短縮され、分析業務を大幅に高速化できた
  • アドホック分析の高速化により、試行錯誤しながら分析することが可能になった
  • ANSI SQL-99準拠の汎用的なSQLが使用できるため、アナリスト以外のスタッフもビッグデータ分析が可能になった

ここで、VerticaのHadoop連携機能について補足しておきたいと思います。次の図は、VerticaのHadoop連携機能を要約したものです。

VerticaのHadoop連携機能

VerticaのHadoop連携機能

① 高速ローディング
前述の事例でもご紹介しましたが、Hadoop上のデータをVerticaにロードすることが可能です。通常のVerticaテーブルとしての検索が可能なため、Hadoop上での検索と比べて高速な分析が可能となります。

② 外部表参照
VerticaはHadoop上のデータを外部表として参照することができます。外部表の参照先は課金対象外となるため、Verticaのローカルディスクやライセンスを圧迫しません。

③ Hive Integration
Hiveで作成したスキーマをVerticaから参照することができます。この場合、HiveQLよりも高速で高度な分析が可能となり、MapReduceのプログラミングも不要であることなど、より簡単に分析することが可能となります。

④ 直接参照
VerticaのデータをHDFS上に配置することができます。通常のローカルディスクへの配置と比べてパフォーマンスは劣りますが、その他Hadoop連携機能やHiveでの検索よりも、高速に処理することが可能です。こちらの機能は、通常とは異なるノード課金のライセンス「Vertica for SQL on Hadoop」でご利用いただけます。

以上のように、目的/用途に合わせて各種Hadoop連携機能を利用することができます。

D社:1,000人が2TBのデータをクラウドで活用。ピーク時のレスポンスも5秒以内に


Verticaは、Amazon Web Services(AWS)などのクラウド上での利用も増えています。D社でも、ハードウェア資産を持たず、運用コストを削減できるクラウド環境への移行を検討していました。D社には、クラウドへの移行に際して、次のような課題がありました。

課題


  • クラウド上に2TB規模のDWHシステムを構築して、1,000人近いユーザが定型/非定型検索をストレスなく行える必要がある
  • ピーク時はそれなりの同時処理があるが、1リクエストの処理時間は5秒程度以内にしたい

D社は、PaaSの列指向型データベースも評価/検討しましたが、アクセス分散やリソース制御の機能に優れたVerticaの採用を決定しました。また、将来的なデータの増加が予測不能な場合、例えば、アクセスピークが読めない、柔軟に拡張できる環境が必要といった場合でも、ノード追加で柔軟に対応ができるなど、クラウドとの相性が良い点も高く評価しています。

最近は日本国内でも、クラウドでVerticaを利用したいという相談をいただくことが多くなってきました。VerticaがサーティファイしているAWSのEC2インスタンスには約10種類あり、企業の様々なビジネスシーンに最適な処理性能やデータ容量に対応した、利用環境の選択を可能にしています。

解決/効果のポイント


  • ピーク時の多重検索でも高い同時実行性を発揮している
  • ノード追加で追加ライセンスが発生しないため、柔軟にシステムの拡張ができた

E社:BIごと刷新して大幅なコスト削減と様々な情報提供が容易に


E社は、部門ごとに様々なBIシステムを構築して、基幹データや営業データなどを分析していました。しかし、BIツールを機能だけで選定した結果、様々なBIツールやデータベースが混在するスパゲッティ状態となり、次のような課題を抱えていました。

課題


  • ユーザ数/データ量の増加に伴うレスポンス劣化で、ユーザ満足度が低下している
  • リクエストごとにチューニングが必要となり、最終的には集計表に頼っている
  • フロント部分の開発で手一杯となり、データベースの設計/チューニングまで手が回らない
  • 業務機能の横断的な情報分析が困難になっている
  • 追加ライセンスが発生するため、ユーザ増加/サーバ増強への対応が容易でない
  • 独自データベースを持つBIツールでは、次のような問題も抱えている
    - レスポンスは独自データベースのチューニングに依存
    - チューニングに独自スキルが必要
    - データロードが夜間に終わらない
    - DBサーバのデータとの二重管理
    - 検索条件の変更でレスポンスにバラツキが出る

E社は、これらの問題を抜本的に解決するために、散在するBIツールやデータベースを刷新/統合することを決めました。その際の選定ポイントは、チューニングレスでも高速なデータベースと、独自データベースを持たず操作性も良いBIツールでした。いくつかの製品を評価した結果、BIツールのWebFOCUS(開発元:米Information Builders, Inc./提供元:株式会社アシスト)とVerticaが採用されました。また、製品の機能だけでなく、導入前の技術支援から運用後の製品サポートまで、一括してサポートする点も高く評価されました。

高速なVerticaと操作性の良いWebFOCUSの組み合わせにより、安定した検索性能と開発コストの低減、柔軟なBI基盤を実現しています。

参考:VerticaとWebFOCUSのオールインワン・ソリューション「WebFOCUS TurboV

解決/効果のポイント


  • 検索レスポンスの安定化により、ユーザ満足度が向上した
  • 検索レスポンス向上のための集計表が不要となり、システム全体のワークロードが下がった
  • フロント部分の開発に集中できるようになり、新規ユーザ要件への迅速な対応が可能になった
  • BIだけでなくDBも刷新/統合したことで、ライセンスコストと運用コストを大幅に削減できた
  • データベースの統合により、業務機能の横断的な情報提供が容易になった
  • ユーザ増加やサーバ増強による追加ライセンスが不要となり、システムを拡張しやすくなった

まとめ


Verticaの代表的な事例パターンをご紹介してきました。本稿でご紹介してきた事例において、お客さまの課題は次のようにまとめられます。

お客さまの課題

お客さまの課題

事例を通し、Verticaは、上記課題の解決を手助けする製品であるということをご理解いただけたのではないかと思います。

もし、読者の皆さまが該当する課題をお持ちであれば、ぜひVerticaを試してみてください。Verticaの評価版「Vertica Community Edition」と、Verticaを初めて使用する方向けの操作ガイド「はじめてのVertica」は、以下のサイトからダウンロードしていただけます。

http://www.ashisuto.co.jp/product/category/database/vertica/download/#tab

また、アシストでは、Verticaをより手軽に正しくお使いいただくために、既にお使いの方だけでなく、ご検討中の方にも役立つ情報を発信しています。ぜひ、以下のナレッジサイトもご覧ください。

Vertica技術情報サイト


執筆者紹介

高田京児

高田 京児(Kyoji Takada)

株式会社アシスト データベース技術本部 技術開発部

株式会社アシスト データベース技術本部所属。各種ソフトウェアのフィールド・サポートやテクニカル・セールス、各種システム設計/構築、データモデリングに関するコンサルティングや執筆などを経て、現在はVerticaの拡販に向けて幅広く活動している。


Facebookで情報をお届けしています

Facebookでは、アシストの「今」を週3回のペースでお届けしています。「めげない、逃げない、あまり儲けない」を合言葉に日々頑張っておりますので、応援よろしくお願いします。



ページの先頭へ戻る