監視初心者が「入門 監視」を読んでみた

こんな人におすすめ

「監視設定しなきゃだけど、そもそも監視ってなにするんだ?」って方におすすめです。

自分はとあるベンチャー企業で働いているのですが、職場の方から「監視設定入れておいてください」と言われ「ちょっ、えっ、、」と困り果てたので、オライリーの「入門 監視」に助けを求めました。

目次

  • 第Ⅰ部 監視の原則
  • 第Ⅱ部 監視戦略
    • 5章 ビジネスを監視する
    • 6章 フロントエンド監視
    • 7章 アプリケーション監視
    • 8章 サーバ監視
    • 9章 ネットワーク監視
    • 10章 セキュリティ監視
    • 11章 監視アセスメントの実行

第Ⅰ部では監視でやってしまいがちなこと、あるべき姿を提示し、第Ⅱ部で各領域で具体的にどういった監視を行えば良いかを示してくれています。
個人的には第Ⅰ部はしっかり読んで、第Ⅱ部は興味あるところを重点的に読むでいいんじゃないかと思います。
(ネットワークとかセキュリティに弱いので9、10章は正直入ってこなかったです、、泣)

個人的な解釈ですが、刺さったものをつらつらと書いていきます。

1章 監視のアンチパターン

ツール依存になるな
万能なツールなど存在しない。自分らの目的を満たすように必要あらばツールをつくる。

監視の仕組みは全員でつくれ
サーバならサーバ、アプリならアプリ、それぞれを構築した人がホットスポットを知っているはず。
一人が監視の仕組みを作らず、作った人全員で仕組みを作る。

動いているとはどういう意味かをちゃんと定義せよ
HTTPだったら200が返ってくることなど、どうあればシステムが動いているのかを定義する。
その上でちゃんと動いているかのチェックを行う。

2章 監視のデザインパターン

ユーザー視点での監視を行う
1章の通り、ユーザーにとって動いているとは何かを定義し、それを検知できる仕組みをつくる。

監視の仕組みは作るのではなく買え
作るコストを考えるとSaaSを利用したほうが安くすむよ?なにより自分ら監視について詳しくないでしょ?
ってことでした。仰る通りです。。

監視の仕組みは改善をつづけよ
GoogleAmazonだっていきなり素晴らしい監視の仕組みが作れたわけではない。
使われなくなった仕組み、新たに作られた仕組みがたくさんあるのだ。

3章 アラート、オンコール、インシデント管理

アラートは即時対応が必要なもののみにせよ
即時対応が必要なものはSMS、PagerDutyなどのページャに、それ以外は社内チャットに送るのがいいよとのこと。ツールはなんであれ、即時対応の要否で分けるのは自分の運用経験からも納得ですね。

人間の判断がいらないものは自動復旧できるようにする
即時対応が必要なもののみアラートすると書いたが、それはその対応に人間の判断が必要な場合に限る。
手順通りにやれば解決できるものは自動復旧できるようにすべき。

5章〜11章

それぞれの領域で具体的な対応が書かれていましたが、自分は5章、6章が印象に残ったのでそこについて。
経営者目線でシステムを監視する
顧客はサービスを使ってる?サービスは成長してる?儲かってる?
経営者はこういったことを気にするが、これを知るための情報を用意するのも監視の役目だそうです。

画面描画が1秒遅れると顧客満足度は16%下がる
らしいです。まぁこれは自分も1人のユーザーとして感じることですが。
フロントの監視は疎かにされがちですが、大切にねとのことです。

まとめ

この本を読んだからといって、よっしゃ監視イケそうだな!とは正直思えませんが、仕組みを作っていく上で考えの土台にはなってくれるかなと。
2章に書いてあったけど、試行錯誤で1歩ずつがんばっていきます。