開発から運用まで、IT部門のお役に立つ情報をお届けするサイトです

運用管理は変わらない変えるのは”やりかた”だ次世代型ITサービスマネジメント変革ソリューション『縁(ENISHI)』
  • システム管理

コンテナにクラウド…混在環境のシステム監視は「運用も大変、通知も大量!?」|コラム

  • #コラム
  • #クラウド
  • #システム監視

2020.11.11

コンテナにクラウド…混在環境のシステム監視は「運用も大変、通知も大量!?」|コラム

執筆者紹介

こんにちは。システム監視分野担当の中村です。入社以来システム運用管理分野のエンジニアとしてお客様サポートに従事。アシストのZabbixサポートビジネスの立ち上げにも携わり、現在はモニタリングツールチームに所属し、広くシステム監視に関する提案活動を行っています。本コラムでは、最近ご相談の多い、オンプレ・クラウド混在環境の監視について考察していきます。

コンテナにクラウド…監視ツールは分散&コストを抑える傾向


これまでのシステム監視は、オンプレミス環境での物理サーバ、仮想環境などの監視がメインでした。しかし昨今、システムリリースのスピードや、所有から利用へのシフトなどの理由でクラウドサービスやコンテナを利用する企業が増え、監視対象も多様化しました。


監視ツールは市場成熟度も高く、ツールの選択肢も多くあります。
各社、OSSを活用したり、サービス提供ベンダーの監視ツールを利用するなどの方法でコストを抑える傾向にあります。

管理が大変、通知が大量…運用担当者を悩ませる課題

しかし、監視ツールの分散を背景に新たな課題も生まれています。

実際に運用担当者様にヒアリングしたところ、以下のような課題を伺いました。

複数の監視ツールを日々チェック しなくてはならず、運用工数が膨らんだ
◎監視ツールからの 通知量が膨大 で、処理しきれない・大事な通知の見落としがある
◎何か問題が起きても、 情報が分散している ので原因追及に時間がかかる

そこに加えて、コロナ禍のもと急進したテレワーク。
対面でのコミュニケーションという前提が崩れ、これまでなら同じ空間にいることで把握できていた情報や雰囲気もリモートではわかりづらくなってしまいました。

Zabbixのアラート通知メール、1,000件超えも当たり前!?

ここで「通知の大量発生」についてZabbixを例にご紹介します。
オープンソースの監視ツールZabbixですが、監視対象のログがバースト(大量にログが出力される事象)すると、すべてのログに対して通知のアクションを行います。
つまり、1秒間に1,000件のログが出力された場合、1,000件のメールを発行します(!)

Zabbixのユーザーの中でも話題に上がることがあるのですが、例えば10件以上/秒が出力されたときは通知を一時的にサスペンドするといったことがZabbixの機能ではできません。(作り込みによって対応可能なケースはありますが。)

1秒間に1,000件もメールが来てしまっては、業務どころではないかもしれませんね。

オンプレミス・クラウド・コンテナ…。
あらゆる対象を1つのツールで監視する術は今のところありませんので、
それぞれにあったツールで監視することが現実解です。

では先に挙げた、 管理工数や通知の増加・コミュニケーションに関する課題を解決するにはどうすれば良い のでしょうか?

カギは「監視データの集約と可視化」「不要な通知の除去」

適材適所の監視がゆえに起こる情報の分散…。課題を解決するカギは、
監視データの集約と可視化 」「 不要な通知の除去(フィルタリング) 」です。

キーワード メリット
集約 各所に散在している「監視データ」の情報を1箇所に集めることで、個々の監視ツールのチェックが不要になる。
可視化 集約されたデータをわかりやすく可視化することで、スキルを問わず誰もが監視状況をチェックできるうえ、問題発生時の特定もしやすい。
フィルタリング 担当者が本当に知るべき通報通知だけに絞ることで、不要な確認作業を減らすことができる。必要な通知が他の通知に埋もれることを防ぐ。

集約に際し必要なことは、オンプレミス、コンテナ、クラウド様々な監視ツールのデータを集約できる受け口を持っているだけではありません。
監視データを分かりやすく可視化し、何か問題が起きてもすぐに状況を把握できる必要があります。

そして、もう1つ重要なのが「不要な通知(ノイズ)」を除去し、把握や対応が必要な通知だけを上手にフィルタリングできることです。

先ほど例に挙げたZabbixもそうですが、監視ツールによって通知の粒度や内容はバラバラです。各監視データにあわせてそれぞれ柔軟にフィルターできる機能も必須でしょう。


費用を抑えるところ・投資するところの見極めを!

監視ツールはコストを抑える傾向ですが、散在した監視ツールを個別で運用していると、結局は担当者の管理工数を多く割いてしまったり、障害の発見・対処が遅れビジネスに影響が出てしまう恐れがあります。

抑えるところは抑え、集約・可視化にはきちんと投資をする ことで結果的にはコストやリスクを削減できるのではないでしょうか。

【図解】オンプレもクラウドも!混在環境の監視をスマートに。

アシストでは、オンプレミス、クラウド(AWS)混在環境の監視課題を解決するソリューションを提供しています。本コラムでご紹介した内容やソリューションなどの情報を1つの資料にまとめました。お気軽にダウンロードしてください。


執筆者へ聞いてみたいことや、ご依頼はお気軽にお問い合わせください

本コラムの執筆者へのご質問やご依頼は、下記ボタンよりお気軽にお問い合わせください。IT運用に関するあらゆるお困りごとや具体的な課題のご相談などお客様のご希望に応じてご対応します。オンライン・対面などのご希望もお申しつけください。

執筆者からのひとこと

テレワーク中は、お昼ご飯を自分で作る機会が増えました。特によく作っていたのはパスタ。
一時はスーパーの店頭から、乾麺のパスタやレトルトのソースが品切れになっていましたね。最近では品ぞろえもだいぶ戻ってきた印象ですが
ちょうど品切れの時に、普段見慣れないパッケージのパスタを購入しました。国産でないため心配ではありましたが、茹でてみると「とてもおいしい!」国内メーカーの乾麺よりももっちりした触感が癖になります。原産国を見るとなんとあのZabbixと同じ「ラトビア」生まれでした。また、買いたいなと思っているのですが、品ぞろえが戻ったことで買えなくなってしまいました。通販で買おうか検討中です。