1ヶ月前ほどにBlogに書いたサーバリソースの監視ツール CloudForecastは弊社でも導入前提で試験をしつつ、さまざまなアップデートを行っているのでその紹介です
大きく変わったのはWeb画面の見た目です。
サーバ一覧
各サーバのグラフページ
多くのサーバを監視するにあたり、通常は見ないサーバに関してはグループ名をクリックすることで畳んでしまうことができます。見たくないサーバはこれで桶。また、各サーバのグラフページでは、デフォルトでMonthlyとYearlyのグラフの表示をやめています。通常ブラウザの画面には入りきらないと思いますし、参照することも24時間、1週間のグラフに比べて少ないだろうという判断です。表示速度も高速化される期待もあります。月間年間のグラフを参照したい時はワンクリックで表示できるので不便はないと思います
加えて、日時指定でグラフを表示することができます。PickerにはAny+TIme DatePicker/Timer PickerというJavaScriptライブラリを利用し、障害が起きたり負荷の高まった時間帯だけを切り出することも可能です。ただし、日付の古いデータに関してはRRDToolで数値が丸められていくのでどれだけ意味のあるグラフになるのかは疑問があったりします。
システム情報
もう一つ付け加えた機能として、リソース情報の取得時にシステムの設定情報などを抜き出して保存し、Web画面に表示することができるようになりました。上の例で行けば、MySQLのグラフにMySQLのthreadcacheやmaxconnectionがどのような値に設定されているかを一緒に表示しています。InnoDBではbufferpoolやflushmethodなどを表示するため、チューニングのガイドとしても役に立つかもしれません。
このシステム情報を取得、保存、表示するために、SQLiteに依存するようになりました。RRDToolとYAMLだけのNoSQLシステムから、SQLも利用するようになりました
今後の展開とか
社内でも利用し始めていることもあり、まだまだ改善、変更していくと思われます。今は100台程度のサーバを監視していますが、数百台となった場合や、このWeb画面を参照する開発者が増えていく中でも利用しやすいように工夫していきます。ただし、設定ファイルのフォーマットやrrdtoolの定義に関しては変更を行わないようにします。今までに貯めたリソースデータが無駄にならないことが必須条件だと考えています。この部分では安心してCloudForecastを利用して頂けると良いかと思います。 その上で今後の展開ですが、一覧ページの使い勝手の向上、メモ機能、ドキュメントとかドキュメントとかドキュメントを充実して行きたいところです