オープンソース

Alertmanager〜アラート管理のOSS〜

システム管理者はシステムの異常をいち早く検知して、対応を行う必要があります。監視システムの導入は、ネットワークやコンピュータシステムを正常に維持するために有効な手段となります。監視システムの導入後、管理システムからのアラートを受け取り、その対応をシステム管理者が行います。このため、アラート機能は重要な役割を担っており、システム管理者に無駄なく、効率よく障害対応できるためのアラート管理の仕組みが必要になります。ここでは、オープンソースソフトウェアのアラート管理システムAlertmanagerを紹介します。

Alertmanagerとは

Alertmanagerは、Apache License Version 2のもとで、オープンソースソフトウェアとして公開されているアラート管理システムです。Alertmanagerは、監視システムであるPrometheusのアラート管理コンポーネントとして提供されています。

独立したソフトウェアとして提供されていますので、Prometheus以外のソフトウェアのアラート管理システムとして使用することもできます。Alertmanagerは、Prometheus等のクライアントアプリケーションからのアラートを受信して処理します。重複排除、グルーピング、アラートの抑制、電子メール等によるアラートの送信を行うことができます。Prometheusと連携する場合のシステム構成は以下の図になります。

AlertmanagerのPrometheusと連携

Prometheusはアラート発行を行う際にAlertmanagerにAPIを使用してリクエストを送信します。Alertmanagerは受信したリクエストをルールに従って処理します。AlertmanagerのAPIに接続できれば、どのようなアプリケーションでもAlertmanagerを使用することが可能です。

Alertmanagerの特徴

Alertmanagerには、以下の特徴があります。

重複した内容のアラートを排除

Alertmanagerは、同じ内容のアラートを排除する機能があります。例えば、長い時間障害が発生した場合、監視システムは同じアラートを何度も発行通知することがあります。システム管理者側からすれば、一度の通知以外は不要となります。Alertmanagerのアラート重複排除機能は、同じアラートが連続して発行された場合、システム管理者への通知を一定期間抑制することができます。そのためシステム管理者は、不要なアラートを受信せずに対応することができます。

同一グループのアラートをまとめて通知

Alertmanagerは、同一グループのアラートをまとめて通知する機能である、グルーピングという機能があります。グルーピングは、特定の条件にマッチしたアラートをまとめて通知することができます。大規模なシステム障害が発生した場合では、監視システムはアラートを大量に発行することがあります。Alertmanagerのグルーピングでは、大規模なシステムを同一グループとして設定しておけば、システム管理者には1つのアラートとして通知することが可能です。システム管理者は、大量のアラートを1つずつ確認することなく、1つのアラートだけを確認すればよくなるので管理が楽になります。

特定の条件にマッチするとアラートを送信しない

Alertmanagerは、特定のアラートについて、一定期間無視するように設定することができます。静観の開始日時、終了日時、条件を入力して設定することでその時間アラートの送信がなくなります。システムメンテナンスを行う場合に有効です。アラート静観は、発生したアラートの内容からアラート静観設定を作成する方法と新規にアラート静観設定を作成する方法の2つの設定方法があります。

様々なアプリケーションに通知が可能

Alertmanagerでは、受信したアラートを様々な方法で通知することができます。Eメールはもちろん、webhookやPagerDuty、Pushover、チャットシステムのSlackやWeChatなどにも通知することが可能です。

ウェブユーザインタフェースが利用できる

Alertmanagerでは、アラート管理のためにウェブユーザインタフェースを使用することが可能です。ウェブUIでは、発生しているアラートの一覧表示・詳細表示やアラート静観の設定・一覧表示などの設定を行うことができます。

デージーネットの取り組み

デージーネットでは、AlertmanagerのウェブUIが日本時間で表示されていなかったため、Alertmanagerのソースコードにパッチを適用を適応して日本時間(JST)での表示、インタフェースの日本語化をおこないました。また、インストール方法や使用例などは、Alertmanager調査報告書に掲載しています。

「情報の一覧」

Alertmanager調査報告書

無料資料ダウンロード

Alertmanagerは、オープンソースソフトウェアのアラート管理システムです。Alertmanagerは、監視システムであるPrometheusのアラート管理コンポーネントとして提供されています。独立したソフトウェアとして提供されているので、Prometheus以外のソフトウェアのアラート管理システムとして使用することもできます。本書は、Alertmanagerについて調査した内容をまとめたものです。

OSSのおすすめ監視サーバ・監視ツール比較17選

無料資料ダウンロード

監視サーバは、以前は製品を利用することが多い分野でしたが、最近ではオープンソースのソフトウェアの機能が向上し、オープンソースソフトウェアを使う場合も多くなりました。ここでは、OSSの監視サーバの選定ポイントを紹介し、いくつかの監視サーバソフトウェアの比較をしてみます。

Zabbix〜ログ監視も可能なOSSの監視ツール〜

無料資料ダウンロード

Zabbixとは、サーバ、ネットワーク、アプリケーションを集中監視するための統合監視ソフトウェアです。OSSですので誰でもインストールし導入できます。Zabbixは、統合監視に必要な監視、障害検知、通知機能を備え、多数のプラットフォームに対応しています。そのため、Zabbixを導入することでシステム全体を監視することが可能です。

Cacti〜監視とグラフ生成のOSS〜

無料資料ダウンロード

Cactiとは、ネットワーク監視、グラフ生成のソフトウェアです。CactiはraXnetにより開発され、オープンソースソフトウェアとして公開されています。Cactiをインストールし導入することで、サーバやネットワーク機器のネットワークトラフィック、CPU使用率、空きメモリ量、ディスク使用率などを監視し、グラフ化することができます。

Icinga2〜コマンドでも使える監視OSS〜

無料資料ダウンロード

Icinga2は、Nagiosという監視ツールから派生して開発されたシステム監視のためのオープンソースソフトウェアです。Icinga2では、WEBインタフェースだけでなくコマンドラインでも監視の設定を行うことができ、大量の監視も行うことができます。Icinga2のWEBインタフェースはデージーネットで日本語対応を行っています。

デモのお申込み

もっと使い方が知りたい方へ
操作方法や操作性をデモにてご確認いただけます。使い方のイメージを把握したい、使えるか判断したい場合にご活用下さい。デモをご希望の方は、下記よりお申込みいただけます。


デモをご希望の方

デモの申し込みイメージ

Alertmanager〜アラート管理のOSS〜の先頭へ