업그레이드 직후에만 보이는 증상 분리하기
2026년 배포에서는 바이너리·환경 변수·프록시 타임아웃이 함께 바뀌어 에이전트는 살아 있고 Gateway·특정 채널만 끊기는 패턴이 흔합니다. 먼저 헬스·포트·역프록시 경로를 나눠 보고, 싱가포르 샌드박스 한 대에만 동일 버전을 올려 재현합니다. Gateway 노출면 축소 설계는 미리 문서화해 두세요.
연관: K8s·역프록시 Gateway 축소
버전 롤백을 그레이스케일로 쪼개기
일괄 롤백은 트래픽 급변을 만듭니다. 관측 → 읽기 전용 채널 → 쓰기 순으로 나누고 단계마다 지연·오류율·메모리 상한을 기록하세요. 롤백 범위는 이미지 태그와 launchd·Node·전역 npm 경로를 한 묶음으로 고정합니다.
데이터 이전과 무중단 전환
설정·토큰이 섞인 디렉터리는 checksum 기반 증분 동기가 안전합니다. 이전 중엔 트래픽을 구 버전에 두고, 끝난 뒤에만 DNS·가중치를 옮기세요. NPM·Docker·curl마다 바이너리 위치가 달라 경로 드리프트가 나므로 점검표를 같이 둡니다. 연관: NPM·Docker·curl Gateway 점검
일·한·홍·싱·미서부 원격 Mac: 그레이스케일 단위 표
아태는 낮은 지연으로 소량 검증에, 미서부는 글로벌 백본 붙은 검증에 쓰기 좋습니다. 같은 리전 안에서 메모리 단을 이렇게 나눈 예시입니다.
| 그레이스케일 단 | 16GB | 24GB | M4 Pro |
|---|---|---|---|
| 관측·헬스만 | JP/KR/HK/SG | 부하 여유 | 과투자 |
| 채널·Gateway 동시 | 제한적 | 권장 | US-West 병행 |
| 데이터 이전·풀 트래픽 | 리스크 | 가능 | 최적 |
롤백 당일 체크리스트
- 사전: 태그·환경 변수·프록시 타임아웃을 고정.
- 실행: 한 리전에서 트래픽 5~10%만 옮기고 30분 관측.
- 복구: 채널 정상 후 디렉터리 정합성 확인, 나머지 리전 확대.
주·예비 노드와 맞물릴 때
예비 원격 Mac에만 신 버전을 올려 채널을 붙인 뒤, 이상 없을 때 가중치를 옮기는 방식이 가장 보수적입니다. 두 노드 스냅샷 정책을 맞추지 않으면 핸드셰이크 오류가 반복되므로 스냅샷 이름에 버전 태그를 넣으세요.
정리: 장애는 '버전' 하나로 설명되지 않는다
장애는 런타임·프록시·상태 디렉터리·RTT가 겹친 결과인 경우가 많습니다. 그레이스케일은 되돌리기 비용을 줄이는 장치이니, 릴리스 노트와 롤백·이전 절차를 한 페이지로 유지하세요. 리전마다 피크 시간이 다르므로 알람 임계치는 복붙하지 말고 구간별로 나누세요.
FAQ
macOS 원격 Mac에서 롤백·이전이 덜 고통스러운 이유
macOS는 Gatekeeper·SIP·FileVault로 자격 증명을 잘 보호하고, M4 Mac mini는 통합 메모리로 Gateway와 워커를 잠깐 겹쳐도 지터가 덜합니다. 유휴 전력이 낮아 샌드박스 노드를 상시 켜기에도 부담이 적습니다.
검증·롤백 루프를 자주 돌릴 계획이면 메모리 단을 정한 뒤 Mac mini M4로 기준 환경을 고정하는 것이 가장 빠릅니다. 아래에서 사양을 고르면 오늘 정리한 그레이스케일 절차를 그대로 옮길 수 있습니다.