CASE 02 / PLATFORM
オンプレ基幹をマルチクラウド運用へ移行
24時間稼働の物流システムを停止時間最小で再設計し、IaC と観測基盤を前提にした運用へ移行しました。
課題
既存基盤が属人的に運用され、ピーク時の障害検知やデプロイ統制に課題がありました。
アプローチ
- システム分割と移行優先度の整理
- Kubernetes と GitOps による標準化
- SLI/SLO 設計とオブザーバビリティ導入
成果
- 平均復旧時間を 58% 改善
- リリース頻度を月次から週次へ移行
- 運用Runbookを標準化し属人化を解消