無印吉澤

Site Reliability Engineering(SRE)、ソフトウェア開発、クラウドコンピューティングなどについて、吉澤が調べたり試したことを書いていくブログです。

SLO

SRE NEXT 2020 の個人的おすすめセッション動画

SRE NEXT 2020 のセッション動画が公開されました! SRE NEXT 2020 の参加者には、2/23(日)に「SRE NEXT 2020 参加者特典のご案内(セッション動画限定公開)」という Subject のメールが届いていると思います。 このメールに書かれている YouTube の URL から…

SRE Lounge のスピンオフで、議論中心の新しい勉強会 "SRE Session" への誘い

SRE Session とは? イベントレポート SRE Session のスタイル 事前アンケート グループ分け テーマごとのサイクル Welcome talk Discussion Sharing 懇親会 感想 時間の長さ グループ分け 議論のまとめ方 参加者の総数 SRE Lounge の Slack ワークスペース…

SRE はサービス品質に影響しない程度の異常をどう扱うべきか?

今回の記事は、最近考えていたことのメモです。 ここ最近いろいろ考えていたのですが行き詰まってきたので、とりあえず課題意識を説明する文章だけ書いてみました。結論はまだありません。 障害と異常の定義 話の前に、障害(failure)および異常(anomaly)…

SRE Advent Calendar 2018 の個人的おすすめ記事(おまけ:Mackerel Drink Up の話)

12月は色々ありました。今回はそのへんを雑多に振り返る記事です。 SRE Advent Calendar 2018 の個人的おすすめ記事 SRE Advent Calendar 2018 は、スタディストのかつひささんが企画したアドベントカレンダーです。1個目のカレンダーがすぐ埋まってしまった…