『入門 監視 ―モダンなモニタリングのためのデザインパターン (日本語)』
を読んだので、
ツールや手法以外で共感したところ、役に立ったところをメモ。
ひと目で分かるは迷信
そのとおりで、何が起きているかはとてもわかりにくい。全体をみて、ひとつひとつ集計して傾向を見て、としないとわからない障害ばかりです。
ひと目でエラーと分かる、というのは神話でしかなく、
「銀の弾丸はない」という真実だけが信じられます。
ツールは一つでなくてもいい
これはちょっと目からウロコ。
必要と感じれば、ツールを増やすことを恐れるな、とのことです。
そして他のチームが成功したツールを導入すればうまくいくわけではないということも肝に命じないといけないと思いました。
監視とはアラートを出すために存在しているわけではないこと。
「監視とは、質問を投げかけるためにある。」「監視は杖ではない。」との言葉の通り、
その先の問題の修正までできないと意味がない。
アラートからその先のアクションができるか、アクションが効果を生んでいるか、
その先の改善まで促せるのか考えて監視の設計をしなければなりません。
次やること。PagerDutyのページからインシデント対応とは?を学ぶ
ちょっとずつ読んでいこうと思います。
https://response.pagerduty.com/
12年以上この分野の仕事をしていても、まだまだ勉強が足りないと思うことばかりです。
コメント