Zabbix の初期設定を一通り終えたあと、
次に気になったのが「まず何を監視すればいいのか」という点だった。
Zabbix には最初から多くの監視項目が用意されているが、
検証環境ではすべてを細かく見る必要はないと感じた。
この記事では、
個人検証環境で最初に意識して確認・登録した監視項目を
実体験ベースでまとめておく。
■ 監視項目を考える前に意識したこと
最初に意識したのは、「監視項目を増やしすぎない」こと。
- 何が分かれば十分か
- 異常に気づけるか
- 画面を見たときに状況が把握できるか
この3点を基準に、最低限の項目から確認していくことにした。
まず確認した基本リソース系の監視項目
CPU 使用率
最初に目に入ったのが CPU 使用率。
- サーバに負荷がかかっていないか
- 常時高負荷になっていないか
Zabbix のグラフで見ることで、時間帯ごとの変化も分かりやすかった。
メモリ使用量
次に確認したのがメモリ関連。
- 使用量
- 空きメモリ
- スワップの有無
検証環境ではあるが、
メモリ不足が起きると挙動が分かりやすいため、
早めに確認しておきたかった項目だ。
ディスク使用率
ディスク容量も、
最初に押さえておきたい監視項目のひとつ。
- ルート領域の使用率
- 空き容量の推移
特にログが増える環境では、
ディスク逼迫が原因でサービスに影響が出ることもあるため、
基本として確認しておいた。
サーバの稼働状態を把握する項目
ホストの可用性
Zabbix では、ホストが「有効」かどうかをすぐに確認できる。
- エージェントと通信できているか
- サーバが応答しているか
まずは「生きているかどうか」が分かる状態を作ることを優先した。
プロセスやサービスの状態
検証環境では、
Zabbix 関連サービスが正常に動いているかも確認した。
- Zabbix Server
- Zabbix Agent
- Web 関連サービス
異常時に
どのサービスが止まるのかを把握するためにも、
最低限の確認はしておいてよかった。
テンプレートを使った監視項目の確認
Zabbix では、
テンプレートを適用することで
多くの監視項目が自動的に登録される。
最初は、
- どんなアイテムが含まれているか
- どの項目が実際に使われているか
を確認する程度にとどめ、不要なカスタマイズは行わなかった。
「まずはテンプレートに任せる」という姿勢が、学習用途ではちょうどよいと感じた。
トリガーは確認中心にとどめた
トリガー(アラート条件)については、
最初から細かく作り込むことはしなかった。
- どんな条件でアラートが出るのか
- どの項目と連動しているのか
を確認しながら、
必要になったら調整する、というスタンスで進めた。
最初にやっておいて良かったと感じたこと
今回の検証で良かったと感じたのは、
- 監視項目を絞ったこと
- グラフを中心に確認したこと
- 「理解しながら触る」ことを意識したこと
最初から完璧を目指さず、
全体の流れをつかむことを優先したのは正解だった。
まとめ
Zabbix で最初に登録・確認した監視項目は、
どれもサーバの状態を把握するための基本的なものだった。
- CPU
- メモリ
- ディスク
- 稼働状態
まずはこれらを押さえておくだけでも、監視ツールとしての役割は十分に感じられる。
これから Zabbix を触り始める人は、最初はシンプルな監視項目から始めてみるのがおすすめだ。

コメント