こんにちは、ちゃりおです。
半分ほど、読んで積読していたのですがやっと読み終わりました。
印象的だったところを、紹介します。
入門 監視
第Ⅰ部 監視の原則
1章 監視のアンチパターン
2章 監視のデザインパターン
3章 アラート、オンコール、インシデント管理
4章 統計入門
第Ⅱ部 監視戦略
5章 ビジネスを監視する
6章 フロントエンド監視
7章 アプリケーション監視
8章 サーバ監視
9章 ネットワーク監視
10章 セキュリティ監視
11章 監視アセスメントの実行
付録A 手順書の例: Demo App
付録B 可用性表
付録C 実践 監視 SaaS
アラートに関しては、OSのメトリクスはあまり意味がない
サービスが動いている状態を定義して、アラートを設計する必要があります。
「HTTPのレスポンスコードが200が返ってきて、リクエストのレイテンシが小さい状態」を動いている状態とするなど。
サービスが動いている状態を定義できれば、OSのメトリクスでアラートを飛ばす必要がなくなります。
例えば、サーバのCPUが90%でも「動いている状態」であればサーバがやるべき処理をやっているだけです。
OSのメトリクスが役に立たないわけではなく、負荷の急変化や推移が確認できるので
診断やパフォーマンス分析に有用です。
この本を読むまでは、とりあえず「CPUが90%以上だったらアラートを飛ばす」みたいな設定を、行っていたので動いているかに着目してアラートを設定していきたいです。
最初は監視ツールはSaaSがいい
監視ツールはいろいろありますが、SaaSサービス推しでした。
- 自前で監視システムをつくるよりコストが少ない
- 監視ツールを設計する専門家ではない
- Saasを使うとプロダクトにフォーカスできる
「自前で監視システムをつくるよりコストが少ない」。
SaaSは月額や年額でお金がかかるので、なんとなくコストが高く感じると思います。
しかし、自前で監視システムを用意するほうがはるかにコストは掛かります。
例えば、ZabbixなどOSSの監視ソフトウェアをいれて監視のシステムを構築する場合
Zabbixサーバの構築やZabbixサーバの運用なども必要になります。
Zabbix自体は無料ですが、サーバの維持する手間を考えたらSaaSのほうが安上がりです。
「監視ツールを設計する専門家ではない」。
メールサーバやDNSサーバも自前で運用することも最近はほとんどないと思いますし、
監視サーバも専門家に任せてしまったほうがいいですよね。
「Saasを使うとプロダクトにフォーカスできる」。
監視サーバの運用や設計をSaasにすることでなくし、できた時間をプロダクトに使ったほうが利益につながります。
Netflix、Dropbox、Twitter規模だと独自の監視システムが必要ですが
普通のシステムなら監視SaaSで事足ります。
まとめ
エンジニアならアプリ・インフラかかわらず役に立つ内容だと思います。
監視ってあまり人から教えてもらえないところですし、この本で監視の考え方を学ぶのはおすすめです。
6〜10章にそれぞれどの項目を監視するべきかも書かれています。
全部読む時間がない人は、「1章 監視のアンチパターン」だけ読んで自分の環境と比較するのも面白いかもしれません。