JENNIFER
アシスト技術者が見た Webシステムの運用/開発現場の実態
多くの企業が基幹システムなど業務遂行に必要不可欠なシステムをC/SからWebへと移行しています。Webシステムは、Webサーバ/アプリケーションサーバ/データベースサーバの3層構成が多く、問題が起きたときの切り分けが非常に煩雑です。そのため、なかなか問題を解決できず業務遂行に重大な影響を及ぼすことがあります。特にECサイトなどはアプリケーション遅延によって多大な機会損失を招く可能性もあります。本稿では、JENNIFERの技術担当者がお客様先で伺ったアプリケーション運用/開発における課題と解決策を5回に渡ってご紹介します。
|
|
ケーススタディ Vol.4
監視をしているのに、各店舗から「システムが遅い!」と苦情が。
■基本情報 |
|
問題点は、システム性能劣化の傾向をリアルタイムに把握できていないこと
本来、在庫受発注システム(アプリケーション)に異常が起きた時は、監視システムから即座にアラートが通知されるべきでした。しかし、既存の監視システムではリアルタイムな監視ができておらず、利用者からのクレームで性能劣化が発覚していました。 |
|
<解決方法>性能の可視化と傾向分析で、システムの可用性を向上
システムの性能を把握するために、まずはブラックボックス化していた既存の監視システムの代わりとして、アプリケーション性能管理(APM)ツールJENNIFERをトライアルしていただきました。JENNIFERでアプリケーションの性能に関する監視項目をリアルタイムに取得/可視化した結果、クレーム発生前にシステム性能劣化の傾向が把握でき、迅速な原因特定による対応が実現しました。また、JENNIFERに蓄積されたモニタリングデータを、分析/レポート化し、関連項目と合わせシステム全体の性能劣化の傾向を把握/分析できる仕組みが実現しました。
アシスト技術者が実際に行った、問題解決までの4ステップ
|
STEP1:アプリケーションの監視項目を精査、JENNIFERの監視項目に置き換え
はじめに、これまで監視していた項目を棚卸ししました。ただ取得するだけで特に利用していなかった監視項目を精査し、本当に必要な監視項目のみに絞ることで、重要なデータが不要なデータに埋もれてしまうことなく、効率的に監視を行えます。精査した結果、監視項目数は約5分の1まで削減されました。 |
|
<精査後の監視項目>
ヒープメモリ使用率/Full GarbageCollectionの平均処理回数/JDBCコネクション数/
使用されている実行スレッド数/スタックスレッドの数/サービスへの現在の接続数/
総アプリケーションエラー数/アクティブなセッション数/直近のリクエストの処理に要した秒数
STEP2:アプリケーションの性能を可視化/共有できる環境に
JENNIFERをアプリケーションサーバにインストールし、モニタリングを開始しました。STEP1で決めた監視項目は、管理コンソール上の1つの画面で可視化されるので、各店舗の担当者と情報をやりとりしなくても、ひと目でアプリケーションの性能が確認できます。また、性能劣化の原因も視覚的にわかりやすく表示され、数クリックで原因箇所の特定が可能です。 |
|
STEP3:重要システムはアプリケーションをグルーピングし、重点的に監視
JENNIFERにて監視を続ける中で改善が必要だと判明したアプリケーション処理はメソッドレベルまで監視を行うことができます。これにより、問題の原因となるメソッド、レスポンス遅延箇所をピンポイントに確認/特定した上で問題箇所を修正していただきました。さらに業務に与える影響が大きいシステムは、システム内で動作する業務アプリケーションをグルーピングし重点的に監視を行いました。グルーピングすることで業務の視点で俯瞰的に性能監視ができるようになり、性能劣化の原因となるアプリケーションを容易に把握できるようになりました。 |
|
STEP4:定期的なレポート作成で、各システムの性能を比較/評価
さらに、社外向けシステム(ECサイト)を含め、あらゆるアプリケーションの性能を比較/評価するため、JENNIFERのレポート作成機能で、月次のアプリケーション性能レポートを自動作成しました。加えて、JENNIFERでモニタリングしたアプリケーションやアプリケーションサーバのリソース情報を起点に、システム運用管理ツールJP1で監視しているOSリソースなどのインフラ監視、データベースモニタリングデータのレポートも活用したキャパシティの比較/評価の実施により、具体的な根拠に基づくリソースの増強やシステム改修計画が可能になりました。
|
<効果>監視するだけではなく「データを活用できる」監視基盤の構築が実現
アプリケーションのモニタリングデータをはじめ、あらゆる運用監視データをレポート化することで、各システムの性能の詳細な傾向が把握でき、性能劣化が起こる前に対処ができるようになりました。その結果、社内/社外システムの継続的な安定運用と品質向上を実現されています。今後はシステムをクラウド環境へ移設するプロジェクトが控えているため、クラウド移行におけるシステムの性能指標としてもデータを活用していただく予定です。さらには、各種モニタリングデータを活用する次のステップとして、弊社が提供している分析ツール「千里眼」への連携もご検討いただいています。
|