無印吉澤

Site Reliability Engineering(SRE)、ソフトウェア開発、クラウドコンピューティングなどについて、吉澤が調べたり試したことを書いていくブログです。

Tamachi.sre ってなに?という話と次回(2026/1/16)の参加募集開始のお知らせ

Tamachi.sreってなに?

Connpassページの説明文:

Tamachi.sreは田町らへんでやるSREのオフライン勉強会です。扱うトピックはSite Reliability Engineeringに関連しているトピックであれば特に限定していません。

SREに関心があれば、職場での役割や普段の業務はなんでもOK! ぜひ、お気軽にご参加ください。

Tamachi.sreは、SRE NEXTのコアスタッフ2名(渡部さん横山さん)と元コアスタッフ1名(私、吉澤)が集まって発足した、SREの地域コミュニティです。スタッフ3名とも、勤め先が田町駅近辺にあるSREです。

渡部さん曰く「Shibuya.rbやらGinza.rbみたいなのが好きなのでそんな感じにしたい」とのこと。勉強会の名前もここから来ています。.sre なんて拡張子はないですが、他によい案も思いつかなかったので、元ネタを連想しやすい名前にしました。

私が思うTamachi.sreの特徴は、以下の3点です。

  • 地域コミュニティということで基本オフラインのみ
  • イベント運営を頑張りすぎない(小規模。食事提供なし。有志の二次会は自由)
  • 個々の発表時間は短め(SREの気軽な発表の場を増やすため。スライドを公開するしないも自由)

個人的には、イベント運営を頑張りすぎない分、気軽に開催できるし、スタッフも燃え尽きにくいという点に共感してスタッフ参加することにしました。

ちなみに、田町近辺に勤めていると仕事後に参加しやすいというだけで、参加も発表も特に田町近辺の方に限定していません。他地域からの参加も大歓迎です。

初回(Tamachi.sre#1)の様子

tamachi-sre.connpass.com

Tamachi.sre#1は田町駅前のマネーフォワードさんのオフィスをお借りして、10/2に開催しました。初開催にも関わらず26名もの方にお集まりいただき、質疑応答や、発表後のフリータイムの時間はとても盛り上がっていました。

会場の様子

発表内容はゆるいものから、やたら気合の入ったものまでさまざまでした。SREの発表の機会ってあんまりないので、たまに発表の機会があると妙にスライドが多くなっちゃったりしますよね。

ちなみに、私も15分セッションの枠をもらって、過去にブログ記事を書いたコスト削減の取り組みの技術的な詳細を発表させてもらいました。少人数ということもあり、質疑応答やフリータイムの時間に「なぜ他の手段を取らなかったのか」といった深い質問をしてもらえて、発表者としてもスタッフとしても大満足のイベントでした。

Tamachi.sre#2 の開催予定

こんな感じで、Tamachi.sreではSREのちょっとした発表の場を、継続的に提供していきたいと思っています。

次回のTamachi.sre#2は、少し先になってしまいますが、来年1/16(金)に開催します!会場は、住友不動産東京三田ガーデンタワー(三田駅・田町駅から徒歩5分程度)にあるアンドパッドのイベントスペースです。

以下のConnpassページで、一般参加&発表者の募集を12/1(月) 10時から開始します。

tamachi-sre.connpass.com

前回は、公募セッションが公開直後に埋まってしまったので、今回は公募セッションを多めに用意しました。ぜひ直近で発表したいネタがある!という方は、なるべく募集開始直後にお申し込みください。

皆さんのご参加お待ちしています!

最後に個人的な宣伝:SRE Kaigi 2026 での発表予定

最近、私はSREとしての仕事とFinOps的な仕事を兼任していて、SREのプラクティスをFinOpsに持ち込むようなことに挑戦しています。

来年1/31(土)のSRE Kaigi 2026で、この最近の取り組みについて発表できることになりました。タイトルは『予期せぬコストの急増を障害のように扱う――「コスト版ポストモーテム」の導入とその後の改善』です。↓にある概要を見てちょっとでも面白そうだな、と思ってもらえたら、当日はぜひ会場までお越しください!

2026.srekaigi.net

チケットは売れ行き好調で、懇親会付きチケットはそろそろ売り切れそうとのことです。最新の販売状況はSRE Kaigi公式のXアカウントをご確認ください。

アンドパッド入社後に書いたブログ記事&プレゼン資料まとめ(随時更新)

2023年3月から株式会社アンドパッドに入社し、前職に引き続きSREとして活動しています。アンドパッド入社後は、ANDPAD Tech Blogにブログ記事を書くだけでなく、SREチームの採用や情報発信について考える機会も増えてきました。

このページでは、SRE Lounge/SRE NEXTなどのイベントで初めてお会いした人に向けて、自分のこれまでの活動を紹介します。

(最終更新日:2025年7月22日)

目次

AWS Security Hub の導入

私が入社した時点では、セキュリティポリシーに反するリソースが作られても、それに気づきにくい状態だったため、AWS Security Hubを日常的に活用できるシステムを構築しました。

2023年9月からこのシステムを運用し、すでに1年以上活用しています。この運用で得られたノウハウを、テックブログや技術イベントで発信しました。

システムの構築後はSREチームでSecurity Hubを運用してきましたが、2025年4月にこの運用をセキュリティチームへ移管できました。そのため、現在は私の手から離れています。

システムの詳細

アンドパッドで構築したシステムの詳細を、以下のブログ記事で紹介しました。Security Hubの基本的な用語についても、この記事で解説しています。

tech.andpad.co.jp

また、カヤック・アンドパッド 合同 プロポーザル供養会(2023年12月4日開催)で、Security Hubの活用が難しい理由とその解決方法を解説しました。

システムの運用から得られた教訓など

Findy社のオンラインイベント「クラウドセキュリティを再吟味するために〜実例から学ぶ、考慮すべき観点とその対策事例〜」(2024年12月3日開催)に招待いただき、1年以上Security Hubを運用して得られた教訓を紹介しました。

上記イベントの講演時間は10分と短かったので、時間内に話しきれなかった詳細や、リアルな苦労などを、以下のブログ記事で紹介しました。

tech.andpad.co.jp

アンチウイルスソフト Antivirus for Amazon S3 の導入

私の入社当時に、アンドパッドで利用していたアンチウイルスソフトには、いろいろな問題が発生していました。そこで、いくつかのOSSや商用製品を比較検討した結果、AWS Marketplace経由で入手できるAntivirus for Amazon S3というソフトを導入しました。

Antivirus for Amazon S3 の紹介

この導入を通して、個人的にAntivirus for Amazon S3はとても良いソフトだと思ったのですが、日本語で書かれた情報はほとんどない状態でした。もっと多くの人にこのソフトを知ってもらいたいと思い、以下の紹介記事を書いたところ、予想以上に注目していただきました(はてブで200 usersを超えたのは久しぶりでした)。

tech.andpad.co.jp

セルフサービス化に向けた取り組み

前述のSecurity Hubも、このAntivirus for Amazon S3も、SREチームだけが抱え込むのではなくて、開発チームがセルフサービスで使える範囲をなるべく広くしようとしています。そのための取り組みについて、SRE Lounge #17(2024年7月2日開催)のスポンサーセッションで紹介しました。

インフラコスト削減

アンドパッドでは、2024年6月から、SREとソフトウェア開発者を集めた専門チームによるインフラコストマネジメントプロジェクトを開始しました。私はこのプロジェクトに唯一のSREとして参加しています。

以下の記事で、このプロジェクトの背景や進め方、そして約1年の経験から学んだことを紹介しました。

tech.andpad.co.jp

このプロジェクトを通してFinOpsの必要性を実感しました。今後は、アンドパッドに合った形を模索しつつ、徐々にFinOpsを開発組織へ取り入れていきたいと考えています。

SRE チームからの情報発信の強化

アンドパッド入社後に色々話を聞いていくと、SREチームは少数精鋭でアンドパッドのマルチプロダクト開発を支えていたものの、行うべきタスクに対してエンジニアが足りていない状況が見えてきました。

幸い、私にはSRE LoungeやSRE NEXTにコアスタッフとして参加してきた経験がありました。そこで、最初は私が活動を主導してやり方を示し、そこから他のメンバーの情報発信を少しずつ増やしてきました。

最近はSREチームだけではなく、SREと関連の深いCREチームなどにもサポートの範囲を広げています。

2023年のイベント

入社後に、SREメンバーの採用を強化するために行ったことや、2023年のイベント参加(SRE NEXT 2023、CloudNative Days Tokyo 2023、プロポーザル供養会)について、以下のブログ記事で紹介しました。

tech.andpad.co.jp

2024年のイベント

2025年のイベント

WEB+DB PRESS Vol.132「コンテナ化実践ガイド」はこれからコンテナ化する人必読の記事(のつもりで書きました)

本日12/24発売のWEB+DB PRESS Vol.132に、私が執筆した「コンテナ化実践ガイド」が掲載されました! 今までいろいろ文章を書いてきましたが、実は、書店に並ぶ雑誌に記事を書いたのは初めてです。ドキドキしながら発売日を待ってました。

gihyo.jp

ちなみに、電子版がほしい方はGihyo Digital PublishingのEPUB/PDFセットがおすすめです。

gihyo.jp

想定する読者は?

歴史の長いシステムで、モノリシックなアプリケーションを開発・運用している方に向けて、コンテナ化を進めるためのステップを具体的に解説したガイドです。

ここまで具体的に(悪く言えば泥臭いことを)説明している資料は、少なくとも僕は見たことがないので、これからコンテナ化に着手する人には必ず役立つと思います。「うちのシステムをコンテナに乗せて、本当に動くのか……?」と悩んでいる方に是非読んでほしいです。僕がBacklogのコンテナ化に着手する前に読みたかった記事を目指しました。

また、「絶対コンテナ化しなきゃ駄目!」とは書いていなくて、こういう場合はコンテナ化以外の改善をしたほうがいい、という話もしているのでご安心ください。

逆に、「モダンなアプリケーション開発をしているから、なにも苦労しなくてもコンテナに乗りますよ」という方にとっては、この記事のガイドは過剰かと思います。まあ、最近だと、そういう方は最初からコンテナを使ってますよね……。

どういう記事なの?

以下の全5章で構成されています。1章で、この記事で言う「コンテナ化」とはなにかを丁寧に説明してから、2〜5章でコンテナ化の具体的な進め方や、ありがちな落とし穴を説明しています。

  1. あなたのシステムにコンテナ化は必要か?
  2. コンテナ化の計画を立てる
  3. アプリケーションを改善する
  4. アプリケーションをコンテナで動作させる
  5. 本番環境にリリースする

この記事では、僕がBacklogのコンテナ化を実際に行った際の経験から、コンテナ化プロジェクトを以下の4つのフェーズに分けました。2〜5章は、これらの各フェーズに対応しています。

計画フェーズ、改善フェーズ、コンテナ化フェーズ、リリースフェーズ
コンテナ化プロジェクトを構成する4つのフェーズ

1〜2章を読んでもらえれば、僕が考えるコンテナ化プロジェクトの進め方は理解してもらえると思います。3〜5章はさらに具体的な話になるので、実際にコンテナ化することになったら読む、というのでもOKです。

Backlogのコンテナ化って?

僕はヌーラボという会社で、Backlogというプロジェクト管理ツールのSREを5年以上担当してきました。

Backlogには、そのトラフィックの約9割を処理するモノリシックなWebアプリケーションがあるのですが、以前はこれがEC2インスタンス上で動いていました。このアプリをコンテナ化するプロジェクトを2021年4月〜2022年8月に実施し、現在はAmazon EKS上で動いています。

このプロジェクトは本当に最後の最後まで、未知の問題が発生するんじゃないかとビクビクしながら進めました。コンテナ化を進めていくうちに、既存のアプリケーションの問題がいくつも新たに見つかり、上記のフェーズ分けを当てはめるなら「改善フェーズ」がどんどん伸びていって、これは本当に無事に終わるのかと……。

改善フェーズの終了時期がコンテナ化フェーズの終了時期まで伸びている
コンテナ化フェーズの前に終わると思っていた改善フェーズがどんどん伸びていく様子

しかし、そんなプロジェクトも無事に終わり、いまはBacklogを構成するその他の細かいアプリケーションサーバのコンテナ化を進めています。それらの活動から得られた知見をもとに、今回のWEB+DB PRESSの記事を執筆しました。

WEB+DB PRESSの記事では、このBacklogのコンテナ化自体については詳しく触れていないので、もしご興味のある方はSRE NEXT 2022発表スライド発表動画をご覧ください。

執筆のきっかけとSRE Lounge/SRE NEXTへの感謝

今回のコンテナ化実践ガイドは、今年5月のSRE NEXT 2022の発表をきっかけに、技術評論社の池田さんからお声がけいただいて書くことになりました。SRE Lounge/SRE NEXTのようなSREのための情報共有の場は貴重だと思い、長い間スタッフとして参加してきましたが、今回はその貴重さを改めて強く実感しました。スタッフの皆さんいつもありがとうございます。

ちなみに、池田さんから最初にお声がけいただいたのは6月だったのですが、そのときはまだコンテナ化が終わっていませんでした。コンテナ化が無事に終わってから企画会議でOKをもらって書き始めて、12月の雑誌掲載となりました。

昔、研究者だった頃は、こういう雑誌に記事を書けるくらいの有識者になりたいと思ってたものですが、そんなことをすっかり忘れた今になってお声がけいただいてビックリしました。人生なにがあるかわからないもんですね……。

ちなみに

このブログ記事はヌーラバーブログリレー2022の24日目でした。最終日となる明日はAya Yoshidaさんの担当です。そちらもお楽しみに!

ヌーラボ在籍時に書いたブログ記事&プレゼン資料まとめ

2017年8月〜2023年2月のヌーラボ在籍時に、SRE 関係のブログ記事やプレゼン発表をいろいろ行いました。徐々に SRE メンバーが増えていくフェーズで入社したため、特に SRE の組織に関する話を多く書きました。

それらの記事がヌーラボブログBacklog ブログとこの個人ブログに散らばってしまっていて、自分でも探すのが大変になってしまったのでここにまとめておきます。

目次

入社直後

入社前からWiki に関する記事 をいろいろ書いてきた関係で、入社直後の研修でサル先生の Wiki 入門(旧:サルでもわかる Wiki 入門)を執筆し、このサイトのインフラ構築もしました。

nulab.com

その後は、徐々に SRE 業務に慣れていったのですが、その時期に行った改善についての記事も書いてます。

nulab.com

他には、kintone devCamp 2018Mackerel Drink Up #8 でプレゼンをさせてもらう機会がありました。

2015 〜 2018 年の Backlog SRE チームの変遷

SRE としての働き方が落ち着き、SRE 組織のあり方について考えるようになった頃に、SRE Lounge #5 で発表をさせてもらいました。自分の入社前のことについては、間違った情報を発信してしまわないように、僕の入社前からいたメンバーに何度もヒアリングさせてもらいました。

muziyoshiz.hatenablog.com

また、SRE Lounge #5 では時間の都合で話しきれなかったサービスレベル計測の話題についても、別の記事にまとめました。

nulab.com

ちなみに、この SRE 組織のあり方については、SRE lounge #5 の発表後に少し考え方が変わりました。そのことはまた別の記事にまとめています。

muziyoshiz.hatenablog.com

Backlog Play 化プロジェクト

2018年4月から2019年7月まで、Backlog を Java & Tomcat から Scala & Play Framework に移行する大規模なリプレイスプロジェクトに参加していました。このプロジェクトからは色々な気付きが得られて、多くの改善を行いました。それらを2回のブログ記事に分けて書きました。

backlog.com

backlog.com

Backlog の課題検索機能のリプレイスプロジェクト

Play 化プロジェクト以降は、改善プロジェクトでプロマネをしながら手を動かす、という働き方が増えました。これはその最初のプロジェクトでした。

このプロジェクトでは、いろいろな課題があった Backlog の課題検索機能を、Amazon Elasticsearch Service を使った新しい実装にリプレイスしました。ステートフルな Backlog アプリケーションをステートレスにし、将来的なマイクロサービス化を可能にするためのプロジェクトでした。

backlog.com

NuCon 2020 でも、このリプレイスプロジェクトと、プロジェクト後の継続的な改善について話しました。

nulab.com

技術面では、Amazon Elasticsearch Service の認証・認可まわりにすごく悩まされて、ついカッとなって個人ブログにまとめたりしました。

muziyoshiz.hatenablog.com

Amazon Linux 2 への移行プロジェクト

2020年は主に、Backlog のたくさんあるサーバをすべて Amazon Linux 2 に移行するプロジェクトを進めていました。技術的な新しさは少ないのでどうまとめようか悩んだ結果、プロジェクトの進め方に焦点を当ててブログ記事を書きました。

nulab.com

インシデント対応のセルフサービス化

Backlog開発チーム自身によるオンコール対応を支えるアラート通知システム からのさらなる改善事例として、「インシデント指揮者」としての役割を開発チームに引き継ぐための活動について書きました。SRE 本および SRE ワークブックを参考に、「インシデント対応チェックリスト」というものを考案し、2021年7月から導入しました。

nulab.com

モノリシックアプリケーションのコンテナ化

SRE NEXT 2022での発表

2021年からは、今までの改善活動の集大成として、Backlog のコンテナ化および Amazon EKS への移行に取り組みました。色々な問題に苦しめられたのですが、約1年かけて解決することができたため、その問題解決の経緯をまとめて SRE NEXT 2022 にて発表しました。

長年運用されてきたモノリシックアプリケーションをコンテナ化しようとするとどんな問題に遭遇するか?(SRE NEXT 2022オフィシャルサイト)

ヌーラボのプロジェクト管理ツール“Backlog”のWebアプリケーション部分は、モノリシックアプリケーションとして開発されてきました。Backlog SREは、開発効率の改善などを目的として、このアプリをAmazon EKSに移行するためのコンテナ化を進めています。 10年以上開発されてきたモノリシックアプリケーションをコンテナ化するにあたり、運用を考慮すると、アプリ自体を改修しなければ解決できない問題がいくつも見つかりました。 この講演では、自社アプリのコンテナ化を検討している方に向けた事例情報として、このコンテナ化プロジェクトで私達が遭遇した問題とその解決方法をご紹介します。また、コンテナ化の完了に向けた今後の計画と、コンテナ化の先に見据える理想像についてもお話しします。

プロジェクト完了後の情報発信

SRE NEXT 2022の発表時点ではまだEC2インスタンスからコンテナへと切り替えている最中だったのですが、2022年7月にコンテナへの切り替えおよびEC2インスタンスの削除が無事完了しました。このコンテナ化プロジェクトで得られた知見を、以下のブログ記事で発信しました。

nulab.com