見出し画像

「信頼性」を創るエンジニアの熱気に触れたSRE NEXT初参加ログ

はいどうもー。クドウマサヤ(@masaya_dev)です。先日開催されたSRE NEXT 2025に7/12(土)の1日だけ現地参加してきました。ブログを書くまでがカンファレンス、というわけで刺激が色褪せないうちに思い出を綴っていこうと思います。


きっかけ

個人的にSRE NEXTは今回が初参加でした。年々SREコミュニティも盛り上がりが加速している印象があって、面白そうだなーと。

さらに今年は、弊社SREチームメンバーのあいさかさん(@mist_dev)がパネルディスカッション企画「ロールモデルなき道をゆく、女性SREキャリア談義」に登壇。ということで気づけばチケットをポチっていました。

結果的にスケジュール合わず、あいさかさんの登壇は見られなかったんですが本当にお疲れ様でした!同じ会社で働くメンバーがカンファレンスに登壇し、技術コミュニティへ学びを還元しているというのは、とても誇らしいものです。リスペクト!

セッション感想

多くのセッションを見させてもらったんですが、特に印象に残っているものをピックアップして紹介させてもらいます。

すみずみまで暖かく照らすあなたの太陽でありたい by 戸田 宏司

ヨドバシのオンサイトプライベートクラウド開発・運用のお話。正直これまで認知できてなかったんですが、ヨドバシさん半端じゃない技術力と矜持を持ったテックカンパニーじゃないですかと。

ヨドバシにとってのSREはService Reliability Engagement(一般的にはSite Reliability Engineering)で、お客様へサービスを届けるための土台であるインフラ環境も自前で全て構築・運用していると。

スタートアップにはなかなか真似できない経営判断のかっこよさに、雷に打たれたような気持ちになりました。朝イチのキーノートがこれで、この話を聞けただけでも来た甲斐があったなと。

この登壇きっかけで以下の記事も読んだんですが面白かった。

ARR150億円、エンジニア140名、27チーム、17プロダクトから始めるSLO by 佐藤沢彦

SmartHRさんのSRE立ち上げ話そしてSLO運用のお話。SRE誕生が2024年というのは正直とても驚きました。背景としてビジネスモデルから来る品質特性の優先度の話で、弊社も同じくtoB SaaSを扱っているため、ついつい機能性>>>信頼性となりがちなのはめちゃくちゃわかるーと心の中で100億回頷きました。一方そういった背景はあるにせよ、急激な事業成長に対して信頼性の課題が顕在化していなかったのは、技術力の高さの証でもあると思っていて、本当にすごいなと。

そしてSLO導入したがうまくいかず、大規模障害を転機に大きく組織が成長した話は痺れるものがありました。大規模障害のくだりは想像するだけで胃がキュッとなる。なかなか障害に関する話ってのはpublicにしづらい側面があると思うんですが、こうやって知見をシェアしてもらえるのは感謝ですね。SRE NEXT直後のマネージャー陣とのMTGでも、早速このスライド紹介させてもらいました。

SREの次のキャリアの道しるべ 〜SREがマネジメントレイヤーに挑戦して、気づいたこととTips〜 by 川崎 雄太

SREからEMや執行役員というマネジメントレイヤーに挑戦されたゆーたさん(@yuta_k0911)のキャリア話。SREの知識・経験ってマネジメントにこう活かせるよと具体例を示しながらエンパワーメントする内容で、めちゃくちゃ良かった。この話をきっかけに将来CTOなりましたってなる人がいつか出てくるんじゃないかな、出てきて欲しい。

何よりゆーたさんの語り口に、SREコミュニティやこれからの技術者に学びを還元したいという強い熱をひしひしと感じた。こういう熱を浴びると自身の活力にもなる。オンライン視聴ができるカンファレンスでも、極力オフラインで参加したい理由がこういうところにあるんですよね。すごく良い刺激になりました。

所感とこれから

SREをテーマにしたカンファレンスの参加は人生初でしたが、とても刺激になりました。DevOpsでいうOpsの部分、サービスの運用やそれを支える組織体制・プロセスについて語られているセッションが多く、学びになりました。

懇親会の規模感驚いた

廊下や懇親会、有志の二次会でも、たくさんの方とお話させていただきありがとうございました!懇親会でいただいたFindyさんの開発生産性IPA、ほんと美味しかった夏にピッタリの味。おかげで話も弾みました。

あと個人的に1番良かった気付きとして、色々な方と課題感について話す中で、うちのSREチーム結構すごいんじゃない?と客観的に思えたことでした。弊社は業務委託の方も含め約30人規模の開発組織ですが、SREチームには社員が3名在籍しています。健康データを取り扱うサービスを運用していることもあり、システムの信頼性・セキュリティは重要視している領域です。

SREチームのおかげで、インシデント発生時のオペレーション整備やポストモーテムでの振り返りしかり、ライブラリのEOLや脆弱性への対処、各種メトリクス・ログの可視化など、実はここ2年くらいでかなり進化してます。取り組みをもっとアピールしていきたいなと。

また、X-Tech5の馬場さん(@netmarkjp)にも長年技術顧問を務めていただいて大変お世話になっています。馬場さんは会場でもお会いして「iCAREはオブザーバビリティ結構しっかりできてますよね」と言っていただけたのがすごく嬉しかったです。(バックエンドエンジニアのためのインフラ・クラウド大全出版おめでとうございます!)

システムの「信頼性」という目に見えにくい、けどとても重要な品質。システムの信頼性は、開発・運用に関わる全てのメンバーが協力して創り上げるものです。SREは特定のチームや肩書きを持つメンバーだけが行うものではなく、開発組織全体の文化として根付くべきだと考えています。

しかし、システムの信頼性に関する目標設定、具体的な改善手法の選定、そして限られたリソースの中でステークホルダーを巻き込みながら推進していくためには、専門的な知識や経験が不可欠です。よって一定の開発組織規模になると、こういった意思決定と実践をリードし、組織全体のSRE文化を醸成する専門ロール・チームがあった方が良いと思っています。

そういった考えのもと組織設計を行っていましたが、SREチームはまさに八面六臂の活躍をしてくれていて、本当に頼もしい存在です。今回様々な企業の事例から学ばせてもらったように、我々の取り組みもSREコミュニティへ積極的に還元できたらと思っています。

そんな弊社でもエンジニア採用中です。現状専任のSREポジションはオープンしていないのですが、SRE経験・マインドを持った方はぜひ一緒に働きたいと思っています。お気軽にカジュアル面談ご応募ください!


P.S.
最近キャリアについてインタビューしていただきました!
よかったらこちらもご覧ください。


いいなと思ったら応援しよう!

クドウマサヤ | iCARE CTO Everything's gonna be alright!