メールマガジン

突然、システムの動作が不安定。一体なにが?

システム管理のつぼ(2018年5月号)

システム設計部 利波 健二

システムの運用をしていて、突然、動作が不安定になったことはありませんか?不安定と一言で言っても「システムが利用できない」「システムの反応が遅い」「たまにエラーになる」など様々です。

特に、しばらく運用した後に起きると、今まで動いていたのに何故?ということになります。こういった場合、問題の特定をしていく必要が出てきますが、利用しているシステム以外が原因ということもあるので、広い視野を持って可能性を探っていく必要があります。

  • システムのログを確認する
  • 問題となっているアプリケーションのログは当然として、サーバのOS(kernel)のログなども確認してください。ハードディスクの障害はアクセスエラーとして扱われるまでリトライするため、システム全体に影響が出ることがあります。また、ファイアウォールやネットワーク監視の仕組みの確認をしてみてください。

  • システムのメモリやストレージの利用状況を確認する
  • これは、システムのリソース利用状況によって、アプリケーションの動作に影響が出ていないかを確認します。メモリの仕様状況が常に100%に近い場合も問題ですが、もっと課題となるのは、徐々にメモリ使用量が増えている場合です。この場合は、アプリケーションのメモリリークの可能性があります。

  • システムに何か変更点はあったか確認する
  • アプリケーションの入れ替えや、脆弱性対策などによるミドルウェアのバージョンアップなどがありますが、影響の出ているシステム以外にも注目してください。他のシステムの変更によって、データベースのアクセスやネットワークトラフィックが上昇したり、仮想環境でのリソース利用の増加による影響を受ける可能性があるためです。

こういったシステムの問題に対しての原因を探る勘所については、経験も必要ですが、まず、やってみることと、事前にその情報が集められる状態にしておくことが大事です。

そのために、何も起きていない今、原因を調べるための情報が取得できているか、確認するところから始めてみましょう。最初のうちは、難しい部分もありますので、サポート内容を確認して利用するのも対策の一つとなります。

デージーネットでは、構築したサーバについては、リモートからアクセスしてサポートする Open Smart Assistance スタンダードサービスを提供しています。システム異常時にはログ等を調査するなどのサポートも行っています。

デージーネットマガジン2018年5月号記事一覧

突然、システムの動作が不安定。一体なにが?の先頭へ