複数のメトリックから計算された値や将来の予測値を監視する、機械学習を使って過去の傾向から異常を検知するなどの高度なメトリック監視機能を有しています。閾値やエラーの検知回数設定、メンテナンス期間のダウンタイム設定など、利用要件に合わせて柔軟に設定できます。
関数を組み合わせた式によってさまざまな表現の独自グラフを描画できます。例えば、あるロールのサーバーへのアクセス数の合計値を描画する、特定のメトリックの現在の状態と前年の状態を重ねて描画して傾向の変化を見るなどのケースに使えます。
独自に描画したグラフに対して、監視を設定することもできます。ウェブサーバーのエラー数をアクセス数で割ることでエラーの割合を監視する、過去のディスクの空き容量の推移から線形回帰によってそれが枯渇するまでの日数を計算しそれに対して監視を行う、といった複雑なメトリック監視を柔軟に実現できます。
外形監視とは、指定したURLに定期的にリクエストを送り、ステータスコードやレスポンスボディの中身、レスポンスにかかった時間などを監視する機能です。対象URLへアクセスするプロトコルがHTTPSの場合は、SSL証明書の有効期限を監視することもできます。
外形監視は、Mackerelの監視項目の中で最も「監視対象のサイトを利用しているユーザー」に近い箇所の監視を担います。つまり、ユーザーがサイトに対して不調を感じている状態を最も直接的に監視します。
メトリックに対して閾値を指定する監視設定には、経験や知識が必要です。運用知見が豊富なシステムならまだしも、リリースから間もないシステムでは、監視設定自体にも試行錯誤が必要です。
Mackerelは機械学習を用いたロール内異常検知の機能を持っています。ロール内異常検知を使うと、指定されたロール内のサーバーのメトリックについて過去の傾向を学習し、そこから外れた値を検知するとアラートを発報できます。運用するシステムの周期性にも対応しており、土日や夜間帯など時間帯で傾向が異なるなどの特徴がある場合でもそれを踏まえて学習を行います。
運用知見に基づいた監視に加えてロール内異常検知を補助的に使うことで、過去の知見が適用できない障害の発見につながり、監視自体の改善ができます。
Mackerelでは、監視もしくは通知を停止するための機能をいくつか持っていますが、スケジュールされたバッチやメンテナンスなどに対応するために停止タイミングを任意のスケジュールで設定できます。時間帯、対象のサービス、ロール、監視ルールを指定して監視を停止することが可能です。また、APIからも設定できます。
サーバーに監視エージェントをインストールするだけで、すぐにサーバー監視を始められます。
詳しく見る様々なコミュニケーションツールとの連携によりチームでの情報共有を促進し、システムの状態に合わせて監視を育てるきっかけを作ります。
詳しく見る複数メトリックの組み合わせや将来の予測値の監視、機械学習を使って過去の傾向から外れた異常を検知するなど、高度なメトリック監視機能を持っています。
詳しく見るクラウドやコンテナなど、多様なインフラ環境を一元管理できます。
詳しく見るプラグインによりさまざまな環境に対応が可能です。プラグインはOSSで公開されており、環境に合わせて独自に拡張することもできます。
詳しく見る