终端先启动 · worktree 多工位 · 监督式循环 · agents.md + MCP · 远端高性能 Mac
你打开电脑,第一个亮起的窗口不再是 IDE,而是三个终端:Claude Code、Codex CLI、Antigravity CLI 各自跑着不同的会话。这不是「猎奇配置」,而是 2026 年越来越多开发者真实的早晨。这篇文章不讲新闻、不做时间线,只回答一件事:开发者一天的工作方式到底变成了什么样,以及当 worktree 并行 agent、/goal 长任务、MCP + agents.md 把笔记本推到风扇拉满之后,为什么远端高性能 Mac 节点会成为新的「主工位」。可与 Mac Mesh × AI Agent 协作、Git Worktree 多分支并行 一同对照阅读。
2026 年典型开发者的早晨,工位顺序已经悄悄反过来了:先开终端,再开 IDE。终端里 claude、codex、antigravity 三个会话同时存在,每个会话钉在一个仓库目录里;浏览器停在 GitHub 的 PR 页和 staging 域名;IDE 反而只是「右副屏那个用来看 diff 与微调 UI 的窗口」。原因不是开发者迷信终端,而是主战场从「写代码」迁移到了「指挥 agent 写代码」——agent 天然住在 shell 里,能直接读仓库、跑命令、写文件、跑测试。IDE 当然没死,它退居成「可视化与回看工具」。
这一变化最直接的体现,是工作动作的拆分发生了位移:以前一天 80% 的时间在写字符、20% 在调试运行;现在差不多 30% 在写自然语言指令、30% 在审 diff、30% 在跑/看测试、10% 在动手补几个真正需要人写的关键位。开发者从打字员变成了 reviewer + tech lead,而 agent 是那个反应飞快的「初级工程师团队」。
终端先于 IDE:启动 Claude Code / Codex / Antigravity CLI,把仓库目录作为 cwd 钉好;IDE 放进副屏作为 diff/review 面板。
会话即工位:每个 agent 会话对应一个目标(refactor / 修 bug / 写测试 / 写迁移),不在同一个会话里混跑两件事,避免上下文污染。
从对齐意图开始:一天的第一句话通常是「读 README / PR 模板 / 这两周改动,告诉我你理解的目标」,而不是「请帮我写一个函数」。
IDE 留给可视化:需要肉眼看长 diff、调 UI、点断点时再切回 Cursor / Antigravity 2.0;写代码的主键盘不再在它身上。
不再「装满插件」:过去靠插件市场补能力,现在能力靠 agents.md + MCP server 接进 agent,IDE 配置反而越来越薄。
2026 年的开发者,不是「在终端里写代码」,而是「在终端里指挥写代码的人」。
单一会话只能跑一件事,是 AI 工作流最先卡住的瓶颈。解法在 git 里早就存在——worktree。同一个仓库可以同时 checkout 多个分支到不同目录,共享一个 .git,互不打架;每个 worktree 给一个 agent 用,refactor、加测试、写迁移脚本、改文档可以同时跑。冲突从「编辑器里互相覆盖」推迟到「合并时由人决定」,整个开发节奏因此从串行变成并行。
| 维度 | 传统 IDE 单工位 | AI agent + worktree 多工位 |
|---|---|---|
| 同时进行的任务 | 1 个 | 3–5 个(refactor / 测试 / 迁移 / 文档 / 实验分支) |
| 主要动作 | 编辑、保存、运行 | 下达意图、看 diff、放行、合并 |
| 冲突发生时机 | 编辑同一文件的瞬间 | 合并时刻,由 git 工具识别 |
| 反馈链路 | 人 → 代码 → 测试 → 人 | 人 → agent → 代码 → 测试 → agent → diff → 人 |
| 本机资源占用 | 低(一个进程) | 高(多个长任务并行编译/测试) |
| 瓶颈位置 | 打字与思考 | 本机算力 + 内存 + 磁盘 IO |
这种工位划分不只是「跑得快」,更重要的是它把工程师的注意力从「逐行编辑」抽到了「策略与边界」上:你不再需要盯着光标,而是定期巡视五个 worktree 的进度,像 tech lead 巡视五个工位。某个 worktree 的 agent 卡住、走偏、过度修改——你 SendMessage 一句话纠正即可,不必自己接手敲键盘。
提示:worktree 也是隔离构建产物(如 iOS DerivedData、Gradle 缓存)的关键,否则多 agent 并行会污染同一份 build cache。落地经验见 Git Worktree 多分支并行。
真正改变工作节奏的,不是「让 agent 写得更多」,而是「让 agent 自己知道什么时候做完」。2026 年新一代的 /goal(Claude Code)与 Codex 的等价能力,给 agent 设了一个「可验证完成条件」——每跑完一轮,都让另一个小模型评估这个条件是否成立;没成立就继续做下一轮,直到达成。开发者不再需要逐 prompt 推进,而是在「布置目标」和「检查交付」之间切换。
一个真实场景:午饭前你在终端里写下「目标:让 npm run test:e2e 全部通过,且 PR diff 不超过 500 行」,回工位时已经是 PR-ready 的 diff,agent 自己跑了 6 轮、修了 3 个 flaky 用例、回滚了一处不必要的接口改动。下面是一个最小化的「监督式循环」六步实操,适用于绝大多数 CLI agent:
写清完成条件:用一句话描述「跑什么命令、看什么输出、达到什么阈值」,例如「pnpm test 全绿且 lint 0 warning」。
圈定边界:明确允许修改的目录与禁止动的文件(如 migrations/、.env、生产 secrets)。
开启循环:下达 /goal "..."(或工具等价命令),让 agent 自己读、改、跑、看输出、再改一轮。
设置 checkpoint:每 N 轮或每 X 分钟,让 agent 输出「目前做了什么、下一步要做什么」摘要到一个 Markdown,方便你随手扫一眼。
人工介入:只在 agent 卡死、走偏、试图触碰禁区时介入;纠偏后让循环继续,不要自己接手敲键盘。
合并前一次性 review:在 PR diff 视图里一次性 review 全部产出,写下 review 评论,让 agent 再跑一轮修复后再合。
git worktree add ../proj-fix-flaky fix/flaky-e2e
cd ../proj-fix-flaky
claude
> /goal "pnpm test:e2e 全部通过;不动 migrations/;diff < 500 行;
每 3 轮把当前进展写入 PROGRESS.md"
# 离开工位,去吃饭 / 开会
# 回来时检查 PROGRESS.md 与 git diff main,决定放行或纠偏
这一节真正的变化,是开发者的注意力分配:以前要全程在场,现在可以把 30–60 分钟的小任务「布置出去」,自己去做更高价值的事——读文档、画架构、跟产品对齐——只在 checkpoint 回来看一眼即可。开发者的时间第一次有了「调度」属性。
新工作流的真正底座,不是某个 IDE 插件市场,而是「一堆 markdown + 一个协议」。CLAUDE.md、agents.md、.cursorrules 这类文件,本质上是「写给 agent 看的项目说明书」——团队约定、构建命令、目录约束、安全红线、常见坑——写一次,所有 agent 共用,胜过反复在对话里强调。MCP(Model Context Protocol)则把外部工具(数据库、浏览器、内网 API、Issue Tracker)统一成 agent 可直接调用的能力,跨工具复用同一份配置。
| 文件 / 协议 | 主要服务对象 | 典型内容 |
|---|---|---|
| CLAUDE.md | Claude Code | 仓库背景、构建命令、测试入口、不要碰的目录 |
| agents.md | 越来越多 CLI agent 通用约定 | 「向新 agent 自我介绍这个仓库」的标准入口 |
| .cursorrules | Cursor / Cursor cockpit | 编辑风格、命名约定、目录边界 |
| skills / commands 目录 | 各 CLI agent(自定义命令) | 把重复流程封装成 /deploy、/release 等 |
| MCP server | 所有支持 MCP 的客户端 | 数据库查询、浏览器自动化、内网 API、Issue 系统 |
把这一层做厚,等于给团队配了一个「公司大脑」:新人入职第一件事不再是看 wiki,而是让 agent 读 agents.md 后自我介绍项目;改命名规范不必发邮件,更新一行 .cursorrules 第二天所有 PR 都会自动收口;接入新数据库不必重写脚本,挂一个 MCP server 即可被所有 agent 调用。团队规范第一次从「人记着」变成了「机器记着」。
注意:不要把密钥、生产连接串塞进 CLAUDE.md / agents.md——这些文件会被 agent 全文读入上下文,等同于公开。secrets 走 MCP server 的运行期注入,或写进 .env 并明确告知 agent「禁止读取」。
这套工作流听起来浪漫,但有一份现实的硬件账单。并行 worktree + /goal 长任务 + 无头浏览器 QA + 本地大模型旁路推理,会同时吃 CPU、GPU/ANE、内存与磁盘 IO;普通笔记本撑不了多久就会风扇拉满、电池告警、磁盘水位见红。这一节给一组可引用的硬件参考,方便你判断自己的工位还能不能撑:
node_modules / DerivedData / Gradle 缓存 10–40 GB,再叠加多个 Docker 镜像与本地模型权重(动辄 4–20 GB/个),1 TB SSD 起步,否则一周内必爆。/goal 通常要跑 30 分钟–几小时;本机一旦合盖、断电、切系统更新,循环就被打断,常驻节点的「不被打断」是软价值,但收益巨大。把账本摊开后,结论很自然:这套新工作流的最大短板不是模型,也不是工具,而是承载它的那台机器。本机笔记本继续做「写意图 + 看 diff + 决策」的轻终端是合适的;真正吃资源的并行 worktree、长任务循环、无头 QA、缓存与构建,更适合放到一台 7×24 在线、内存与磁盘充裕、散热不掉链子的远端高性能 Mac 节点上。比起「用本机硬扛 + 卡顿 + 烤盘」,对追求 iOS CI/CD 与 AI Agent 常驻并行的生产工作流而言,VpsMesh 的 Mac Mini 云端租赁通常是更优解——独占节点、可预测资源、本地 SSH/远程桌面即接即用,免去自购硬件的折旧与维护。具体配置与价格可见 价格页,接入与最佳实践见 帮助中心。
没有。IDE 仍是 UI 设计、断点调试、可视化 diff 与 review 的最佳载体;变化的是它从「写代码的主战场」退居成「审 diff 与可视化」的副屏,主战场迁移到终端中的 AI agent。更详细的协作模式可见 Mac Mesh × AI Agent 协作。
并行 worktree、/goal 长任务、无头浏览器 QA 与本地模型旁路会同时吃 CPU、GPU/ANE、内存与磁盘 IO,笔记本撑不住会卡顿、降频、风扇拉满;远端 M4 Pro/Max 级 Mac 节点拥有更大内存、更高带宽和不掉速的散热,把「开发体力活」接走后,本机只剩 diff 审阅与决策。具体规格与价格见 价格页。
三者本质都是「写给 agent 看的项目说明书」:CLAUDE.md 服务 Claude Code,.cursorrules 服务 Cursor,agents.md 是越来越多 CLI agent 采用的通用约定;可以并存,各自工具按需读取。建议先写一份 agents.md 作为通用入口,再为主用工具补充专属文件。远程节点上的协作示范见 帮助中心。