전부 다운인지 먼저 가른다
채널·게이트웨이·스킬이 동시에 끊기면 단일 원인 찾기가 어렵습니다. 프로세스·포트·메모리 압력을 먼저 훑고, launchd가 재시작 루프면 겉으로는 전부 다운처럼 보입니다. UI 세션에만 붙은 에이전트는 재부팅 후 무로그인이면 사라집니다.
원격 노드를 여러 개 쓸 때는 단일 장애인지 리전 전체인지를 구분해야 합니다. 더 읽기: 원격 Mac vs VPS 노드 선택 에서 지연·비용 관점을 함께 잡아 두면 장애 통화 시간이 줄어듭니다.
launchd 체인을 따라 로그를 모은다
ProgramArguments는 절대 경로 위주로 두고, 표준 출력·에러 로그 경로를 plist에 고정하세요. KeepAlive가 켜져 있으면 실패 직후 재기동해 원인 로그가 덮일 수 있으니, 잠시 끄고 launchctl bootout·bootstrap으로 한 줄씩 되돌리며 재현합니다.
RunAtLoad와 수동 kickstart를 동시에 쓰면 중복 인스턴스가 떠 포트 충돌이 날 수 있습니다. lsof -nP -iTCP -sTCP:LISTEN로 리스닝을 먼저 확인하세요.
세션 격리: SSH·GUI·LaunchAgent
로그인 세션과 비로그인 launchd는 키체인·환경이 다릅니다. GUI에서만 되던 설정을 SSH에 그대로 옮기면 깨지기 쉬우니, LaunchAgent 사용자·도메인·재부팅 후 자동 로그인 정책을 문서에 고정하세요.
ClawHub 스킬 감사
스킬 출처·버전·허용 호스트가 바뀌면 게이트웨이는 살아 있어도 작업만 멈춘 것처럼 보입니다. 매니페스트 해시를 저장소에 고정하고 배포 시 diff를 강제하세요.
노드×메모리 단 의사결정
| 구성 | 적합한 패턴 | 리스크 |
|---|---|---|
| 16GB 단일 노드 | 게이트웨이 1개·소수 워커 | 스왑 지터로 세션 타임아웃 |
| 24GB 단일 | 병렬 스킬·중형 로그 | 동시 빌드와 겹치면 OOM |
| M4 Pro 다중 | CPU 병렬·다중 큐 | 메모리 대역은 여전히 상한 |
한 대에 모든 역할을 몰지 말고, 주·예비로 나누면 점검 창을 열어도 나머지 노드가 트래픽을 받습니다. 더 읽기: 주·예비 이중 원격 Mac과 SLO 를 참고해 큐 길이와 헬스 프로브를 맞추세요.
자주 묻는 질문
한 줄 체크리스트
로그 경로 고정 → plist 인자 절대 경로 → 리스닝 중복 제거 → 스킬 해시 고정 → 메모리 단에 맞춰 동시성 상한 재조정 순으로 돌면 총 다운 대부분은 범위가 좁혀집니다.
무인 운영에는 Mac mini와 macOS가 맞는 이유
launchd·키체인·게이트키퍼가 한 플랫폼에 묶여 데몬과 세션 경계를 문서화하기 쉽습니다. M4 Mac mini는 통합 메모리로 겹친 워커도 대역이 안정적이고, 유휴 전력은 약 4W로 상시 노드에 유리합니다.
Gatekeeper·SIP·FileVault와 정기 보안 업데이트로 장기 무인 리스크를 낮출 수 있습니다. 체크리스트를 통과했다면 Mac mini M4를 2026년 기준점으로 두고 메모리 단만 키우는 편이 단순합니다. 아래에서 구성을 확인해 보세요.