無印吉澤

Site Reliability Engineering(SRE)、ソフトウェア開発、クラウドコンピューティングなどについて、吉澤が調べたり試したことを書いていくブログです。

Monitoring

SRE Lounge のスピンオフで、議論中心の新しい勉強会 "SRE Session" への誘い

SRE Session とは? イベントレポート SRE Session のスタイル 事前アンケート グループ分け テーマごとのサイクル Welcome talk Discussion Sharing 懇親会 感想 時間の長さ グループ分け 議論のまとめ方 参加者の総数 SRE Lounge の Slack ワークスペース…

SRE はサービス品質に影響しない程度の異常をどう扱うべきか?

今回の記事は、最近考えていたことのメモです。 ここ最近いろいろ考えていたのですが行き詰まってきたので、とりあえず課題意識を説明する文章だけ書いてみました。結論はまだありません。 障害と異常の定義 話の前に、障害(failure)および異常(anomaly)…

「入門 監視」を読みました

入門 監視 ―モダンなモニタリングのためのデザインパターン作者: Mike Julian,松浦隼人出版社/メーカー: オライリージャパン発売日: 2019/01/17メディア: 単行本(ソフトカバー)この商品を含むブログを見る あまりにシンプルなタイトルで話題になっていた「…