Alertmanagerとは
Alertmanagerとは、OSSのアラート管理システムである。Apache License Version 2のもとでオープンソースソフトウェアとして公開されている。またAlertmanagerは、監視システムであるPrometheusのアラート管理コンポーネントとして提供されている。Prometheusとは、DockerやKubernetesといったコンテナ/クラスタ管理ツールとの連携機能も持っている監視システムである。Alertmanagerは、独立したソフトウェアとして作成されており、Protetheus以外のソフトウェアのアラート管理システムとしての使用も可能である。
システム管理者はシステムの異常をいち早く検知し、対応を行う必要がある。その友好的な手段の方法として監視システムのアラート機能がある。アラート機能を利用することで、システムの異常があった時にシステム管理者にアラートを送信し、この通知によりシステム管理者は内容に応じてしかるべき対応をとることができる。そのため監視システムのアラート機能は、システム管理者にとって、とても重要な役割がある。
Alertmanagerには監視システムからのアラート(alert)により、複数の重複したアラートを集約したり、条件にマッチしたアラートをまとめて通知する機能がある。そのため監視システムからのアラートを効率よく受け取ることができ、アラート管理を強化することが可能となる。この記事ではAlertmanagerの特徴について記述している。
アラート管理の重要性
システム管理者にとって、監視システムのアラート機能はとても重要な役割を果たす。しかし、大規模なシステム障害が発生した場合、監視システムから大量のアラートが発行されることがある。また、長時間障害が復旧しない状態になった場合には監視システムから同じアラートを何度も発行通知することがある。こうした重複するアラートが大量に届いてしまうと、システム管理者がアラートの内容を把握するまでに時間がかかってしまい、障害対応の遅れが生じてしまう可能性がある。
Alertmanagerを利用することで、こうした監視システムの問題を解決し、監視システムからのアラートを無駄なく、効率よく取得することが可能となる。これによりシステム障害対応がスムーズに行うことができる。
Alertmanagerの特徴
Alertmanagerの主な特徴は以下である。
重複した内容のアラートを排除する
長時間システム障害が発生した際、監視システムが何度も同様のアラートを通知することがあるが、Alertmanagerは監視システムから発行される同じ内容のアラートを排除することができる。
条件にマッチしたアラートをグルーピング
Alertmanagerを利用することで、特定の条件にマッチしたアラートをグルーピングし、同一グループのアラートをまとめて通知することができる。例えば、ラベル(labels)の名前(alertname)とインスタンス(instance)が一致するアラートを同一グループとして扱う等のルールを指定する。大量の同一アラートが発生した場合にも、システム管理者への通知はひとつのアラートとして通知されるため、大量のアラートを1つずつ確認する必要がない。
アラートの静観設定
Alertmanagerを利用すると、特定の条件にマッチしたアラートを指定した日時まで無視することが可能となるため、メンテナンス等、計画的に特定のアラートを無視する必要があるような場合に便利な機能となる。
WEBユーザインタフェース
Alertmanagerは、発生しているアラートの一覧表示・詳細表示やアラート静観の設定など、WEBインタフェースからアラートの管理を実行できる。
アプリケーションへの通知
Alertmanagerは、受信したアラートを様々な方法で通知することが可能となる。 通知可能なアプリやツールは以下である。
- 電子メール送信
- webhook
- PagerDuty
- Pushover
- Slack
- OpsGenie
- VictorOps
Zabbixとの連携
Zabbixとは、サーバ、ネットワーク、アプリケーションを集中監視するための統合監視ソフトウェアである。Zabbixの通知機能ではZabbixで管理している1000台のサーバが接続されているスイッチに障害が発生した場合、1000個のアラートが発行されるという問題があった。しかし、Zabbix4.4以降から、アクションに設定可能なメディアタイプにWebhookが追加された。このZabbixのメディアタイプWebhookを使って、Alertmanagerと連携が可能となった。Alertmanagerと連携することによって大量のアラートを効率よく管理したり、同一アラートを抑制することが可能となる。
デージーネットの取り組み
デージーネットでは、調査検証の結果、ソースコードにパッチを適用すれば、日本時間(JST)へ表示の変更、インタフェースの日本語化を行うことができることがわかった。インストール方法や詳しい内容については「Alertmanager調査報告書」からダウンロードが可能である。
また、デージーネットでは、サーバを効率的に管理するために欠かせない様々な監視サーバを多くの企業に構築している。デージーネットで構築サービスを提供したお客様には、導入後支援サービスとして、Open Smart Assistanceを提供している。これは、ソフトウェア単体のサポートではなく、Linuxなどを含む全体に対するサポートである。(導入をご検討の方には、Webでの打ち合わせも可能)
【カテゴリ】:オープンソースソフトウェア  システム監視  
【Webセミナー】CentOS8 サポート終了に伴う今後の考え方
日程: | 1月22日(金)Webセミナー「BigBlueButton」を使用します。 |
内容: | CentOS8のサポートが2021年に終了すると発表されました。CentOS8を利用していたユーザは今後、どのようにしていくとよいのかわかりやすく解説します! |
ご興味のあるかたはぜひご参加ください。 |