3계층 메모리 분해 · 재시작≠기억 손실 · Pi/VPS/M4 매트릭스 · 24개월 TCO · 6단계 Runbook
Hermes Agent가 「똑똑해지는」 것은 신비가 아니라 디스크 위 3계층 메모리의 복리입니다. USER.md 약 1,375자로 사용자를, MEMORY.md 단일 항목 상한 약 2,200자로 워크플로를, SQLite FTS5로 전문 검색을 담당합니다. 태스크 완료 후 누적 5회 이상 도구 호출 시 Skill이 기록됩니다. 본문은 아키텍처 관점에서 7×24 상시 가동이 왜 필요한지 설명하고, 라즈베리 파이 / VPS / Mac Mini M4 리소스 매트릭스로 실측 구간을 대조하며 24개월 TCO와 6단계 Runbook을 제시합니다. 재시작으로 디스크 기록은 지워지지 않지만 Gateway 슬립은 채널과 Skill 다듬기 체인을 끊습니다.
많은 분이 Nous Research Hermes Agent를 「도구가 붙은 채팅」으로만 봅니다. 그러나 공식·커뮤니티가 정리한 영속 계층은 세션 창보다 훨씬 깊습니다. 1계층은 현재 세션 단기 컨텍스트로, 도구 체인 상태와 이번 추론 궤적이 프로세스 메모리에 있으며 재시작 시 끊깁니다. 2계층은 Skill Documents로, 태스크 종료 후 자동 생성되는 markdown 플레이북이 중복 제거·인젝션 검사 후 데이터 디렉터리에 기록됩니다. 커뮤니티 기준 단일 항목 약 2,200자로 체크리스트에 적합합니다. 3계층은 영구 사용자 모델로, USER.md(약 1,375자 예산)에 선호·톤·장기 목표가 주 단위로 심화됩니다.
검색 측면에서 Hermes는 SQLite FTS5로 Skill과 메모리 항목에 전문 인덱스를 구축합니다. Agent가 지시를 내릴 때 로컬 인덱스를 먼저 조회해 컨텍스트에 주입하므로, 매번 전체 라이브러리를 prompt에 넣는 것보다 token을 절약합니다. 이는 디스크 IO와 인덱스 무결성이 연산과 동등하게 중요함을 의미합니다. Skill 생성에는 하드 임계값이 있습니다. 한 번의 복잡 태스크에 누적 최소 5회 도구 호출이 있어야 정제가 트리거됩니다. 짧은 잡담은 Skill 라이브러리를 오염시키지 않지만, 긴 도구 체인 runway가 필요하며 호스트가 중간에 슬립되면 정제 루프가 완료되지 않습니다.
| 메모리 구성요소 | 전형적 규모 / 메커니즘 | 재시작 후 보존 | 7×24의 의미 |
|---|---|---|---|
| 단기 컨텍스트 | 현재 세션·도구 상태 | 아니오, 재연결 필요 | Gateway 프로세스 상주 필수; IM 콜백 타임아웃 = 태스크 체인 단절 |
| USER.md | 약 1,375자 사용자 프로필 | 예, 디스크 기록 | 호스트 교체 시 데이터 디렉터리 이전; 잦은 슬립은 프로필 반복 저하 |
| MEMORY.md / Skill | 단일 항목 약 2,200자 상한 | 예, 디스크 기록 | FTS5 인덱스가 기록과 함께 성장; 백업 전략 필수 |
| SQLite FTS5 | 로컬 전문 검색 인덱스 | 예, DB 파일 | 디스크 지터·VPS IO 제한 시 검색 지연 |
따라서 「재시작 ≠ 기억 상실」은 디스크에 기록된 계층에만 해당합니다. 채널 UX, cron, 진행 중인 5+ 도구 체인은 여전히 중단됩니다. 30일 주관 체험과 실수 서사는 30일 Hermes 사용기를 참고하시고, 본문은 아키텍처와 리소스 장부에 집중합니다.
재시작 시 전부 삭제로 오해: Skill과 USER.md는 데이터 디렉터리에 있습니다. 끊기는 것은 세션 리듬이며, 백업 없이 호스트를 바꾸면 「기억 상실」처럼 느껴질 수 있습니다.
5+ 도구 호출 임계값 간과: 짧은 대화는 Skill을 만들지 않습니다. 긴 태스크 중 호스트 슬립은 정제 루프를 영원히 미완으로 둡니다.
FTS5를 블랙박스로 취급: 인덱스 손상·디스크 full은 「분명 기록했는데 검색 안 됨」을 만듭니다. 데이터 디렉터리 용량과 SQLite 상태를 모니터링해야 합니다.
USER.md 상한 미정리: 1,375자 예산은 유한합니다. 장기 미정리는 프로필 희석과 잘못된 선호 가중을 유발합니다.
채널과 Gateway 분리 배치: Gateway만 내려가도 IM은 끊깁니다. 7×24는 전체 링크의 상주를 의미합니다.
Hermes는 Always-on Agent를 전제로 설계되었습니다. Telegram·Discord·Slack 등 20+ 채널이 Gateway로 webhook을 수신하고, cron이 스케줄에 따라 서브태스크를 깨우며, Honcho 등이 백그라운드에서 사용자 모델을 서서히 갱신합니다. 한 고리라도 오프라인이면 체감은 「조금 느림」이 아니라 콜백 실패, 큐 적체, Skill 기록 지연입니다. 디스크의 Skill 파일은 늘어도 「매주 비서가 바뀌는」 느낌이 납니다.
7×24는 운영 과시가 아니라 3계층 메모리의 시간 축과 맞추는 선택입니다. 단기 계층은 ms급 응답, Skill 계층은 5+ 도구 호출이 끝날 runway, 사용자 모델은 주 단위 누적이 필요합니다. 노트북 슬립, 가정 NAS 간헐 오프라인, VPS 이웃 IO starvation은 계층마다 다른 지점에서 끊깁니다. 복리 곡선은 평평해집니다. 전용 호스트는 프로세스 생존·네트워크 안정·예측 가능 디스크를 SLA로 고정합니다.
기억은 디스크에서 복리되지만, 똑똑하다는 체감은 Gateway가 빠지지 않을 때 옵니다. 이것이 7×24와 「가끔 켜서 돌리기」의 본질적 차이입니다.
동일한 curl -fsSL https://get.hermes-agent.org | bash도 호스트에 따라 메모리 대역폭, 디스크 IO, macOS 네이티브 경로에서 차이가 납니다. 아래는 동일 워크로드(Gateway+Telegram+로컬 Ollama Hermes-3 8B 간헐 추론) 기준 정성 실측 구간입니다. 모델 양자화·채널 수에 따라 수치는 변합니다.
| 호스트 | 유휴 RAM | 피크 RAM | CPU / 전력 | Hermes 적합도 |
|---|---|---|---|---|
| 라즈베리 파이 5 · 8GB | ≈1.5GB 시스템 여유 | Gateway 단독 ≈4GB; 로컬 8B 불가 | ARM 저전력; SD IO 병목 | 순수 API 게이트웨이만; Skill 복리 약함 |
| Linux VPS 4C8G | ≈5GB 가용 | API 모드 ≈6GB; Docker 백엔드 +2GB | 공유 vCPU 지터; IOPS 제한 | SSH 원격 가능; macOS 아님, 일부 Skill 어색 |
| Mac Mini M4 16GB | ≈9GB 가용 | 로컬 8B+채널 ≈14–15GB 한계 | 유휴 ≈12W; 추론 burst 25–35W | macOS 네이티브; 단일 채널+로컬 모델 한계 |
| Mac Mini M4 32GB | ≈22GB 가용 | 8B+듀얼 채널+cron ≈18–20GB | 동일, 메모리 여유 | 프로덕션 권장: Skill+FTS5 성장 여유 |
통합 메모리(UMA)는 M4 로컬 추론 시 CPU↔GPU 복사 부담을 줄입니다. macOS는 공식 설치 스크립트와 Ollama 경로를 최소 마찰로 맞춥니다. Pi는 전기는 절약하지만 8B를 버티지 못하고, VPS는 월세는 낮지만 리전 RTT·IO 제한에서 시간을 잃습니다. Skill 라이브러리와 FTS5가 GB급이 되면 디스크 지연 안정성이 첫 달 임대료 차이보다 중요해집니다.
Agent 운영자의 의사결정 대상은 「애플을 살까」가 아니라 24개월 안에 메모리 복리를 채울 총비용입니다. 하드웨어, 전기, 운영 공수, 세대 교체 불안, 데이터 이전이 포함됩니다. 월 대여는 CapEx를 OpEx로 바꾸며 Skill·채널이 이미 프로덕션이면 의사결정 비용 면에서 자주 유리합니다.
| TCO 차원(24개월) | 구매 M4 16GB | 월 대여 M4 32GB |
|---|---|---|
| 하드웨어 현금흐름 | 초기 기기값+세금; 감가 자체 산정 | 월 고정×24; 전체 교체 없이 RAM 업그레이드 |
| 전기(7×24) | ≈12–35W×24h×730일(자부담) | 서비스 요금에 포함; PUE는 제공자 |
| 운영 공수 | 보증·OS·팬·단절 자체 대응 | 하드웨어 장애 교체; 원격 KVM |
| Hermes 데이터 자산 | USER.md/Skill/FTS5 단일 기기 종속 | 백업→신규 계약 복원; 반납 시 삭제 |
| 세대 교체 리스크 | M 시리즈 유혹·재투자 | 계약 만료 후 스펙 교체, 잔존가치 고민 없음 |
| 기회비용 | 하드웨어 연구가 Skill 시간 분산 | Agent 워크플로·채널 확장에 집중 |
메모리 선정: 순수 API+단일 채널 16GB; 로컬 Hermes-3+다중 채널+cron은 32GB 권장, FTS5 재구축 OOM 방지.
계약·인도: 리스 ID·원격 접속 경로 기록; 팀 MDM·Profile 배포 사전 확인.
시스템 검수: Apple Silicon, 디스크 ≥256GB, macOS 버전이 공식 Hermes 경로 충족; 자동 슬립 해제.
Hermes 설치: 공식 원라이너 후 hermes init; 데이터 디렉터리 경로·백업 정책 확인.
7×24 스모크: IM 채널 연결, 5+ 도구 호출 장태스크; 24h 후 Skill 기록·FTS5 검색 검증.
백업·반납: 데이터 디렉터리 정기 내보내기; 반납 전 USER.md/Skill 이전 및 디스크 삭제.
curl -fsSL https://get.hermes-agent.org | bash hermes init hermes model
안내: 프로덕션 노드는 Hermes 버전을 고정하고 변경 기록을 남기세요. hermes model 전환 후 24h 메모리 곡선을 관찰한 뒤 두 번째 IM 채널을 여세요.
Hermes Agent의 해자는 3계층 메모리의 디스크 복리입니다. 이를 실현하려면 Gateway 7×24, FTS5 건강, 5+ 도구 체인을 끝낼 통합 메모리가 필요합니다. Pi와 VPS도 설치는 가능하지만 로컬 추론·IO 안정성에서 Skill 곡선이 얇아집니다. Mac Mini M4 월 대여는 하드웨어를 예측 가능한 서비스로 바꿔 USER.md 다듬기와 채널 확장에 집중하게 합니다.
전용 Apple Silicon 노드로 Hermes를 돌리기로 했다면 다음은 패키지와 인도 리듬입니다. VpsMesh Mac Mini M4 월 대여는 16/32GB 통합 메모리, 원격 접속, 반납 시 데이터 삭제 절차를 제공합니다. 요금은 Mac Mini M4 대여 가격, 배포·FAQ는 고객 센터, 온라인 선정은 주문 페이지에서 확인하실 수 있습니다.
주의: 한 주말에 호스트 이전·FTS5 전량 재구축·Skill 디렉터리 일괄 삭제를 동시에 하지 마세요. 삼각 변경은 원인 분리가 불가능합니다. 먼저 이전 후 24h Gateway 안정을 검증한 뒤 모델 라우트나 대량 메모리 import를 진행하세요.
아닙니다. 디스크에 기록된 Skill Documents, USER.md, MEMORY.md, SQLite FTS5 인덱스는 유지됩니다. 현재 세션 단기 컨텍스트만 끊깁니다. Gateway와 데이터 디렉터리를 7×24 안정 노드에 두고 정기 백업하세요. 슬립이 잦은 노트북은 채널과 장태스크가 여전히 끊깁니다.
Gateway 유휴 200–400MB; Ollama Hermes-3 8B 로컬 실행 시 피크 8–12GB. 채널+cron+로컬 추론 병행 시 16GB는 한계에 닿기 쉽고 32GB 통합 메모리가 안전합니다. 패키지 비교는 요금 페이지를 참고하세요.