跳转到内容

从工具使用到心智模型迁移

「我还是在写『帮我找一下 X 在哪』,同事却用一句话描述业务结果,让 Agent 自己规划读哪些文件。同样的工具,差的是提问范式。」

反思与进阶 讨论 AI 时代开发者的能力重心;本章给可练习的迁移路径:怎么问、什么时候放手、什么思考必须留在你脑子里。不重复哲学段落,只落行为与检查表。


维度搜索引擎思维意图式思维
单位关键词、单次查询目标、验收、边界
成功标准找到一段答案工作区出现可验证结果
上下文你手动拼接Agent 用工具收集,你校正
失败时换关键词改目标、缩范围、换模式
grep authentication 在哪?
Read auth.ts 然后告诉我有什么问题

问题:你在做微观调度,模型缺少「做完算什么」。

目标:修复 issue #42 描述的登出后 token 仍有效问题。
验收:pnpm test auth 全绿;不改 public API。
边界:只动 src/auth/ 与 tests/auth/;先 /plan 列出假设与文件清单。

意图式不等于模糊。「尽量优化」仍差;对象、动作、规则、异常、验收五元组齐全才稳,与 反思与进阶 中的任务分解一致。


何时放手自主,何时细粒度干预

Section titled “何时放手自主,何时细粒度干预”
flowchart TD
task["收到任务"] --> risk{"风险高?"}
risk -->|是| plan["Plan Mode / 人批计划"]
risk -->|否| familiar{"你熟悉域?"}
familiar -->|否| explore["只读探索 → 再计划"]
familiar -->|是| delegate["给 Agent 多轮工具循环"]
delegate --> watch{"偏离验收?"}
watch -->|是| intervene["暂停:具体纠正或 /rewind"]
watch -->|否| verify["人跑验证 + /diff"]
  • 重复性机械改动(格式化、批量重命名、补类型)
  • 探索型只读(找调用链、列文件)
  • 已有清晰 CLAUDE.md 与测试门禁的仓库
  • 失败成本低、Git 可回滚

配合:预置 allow、子代理隔离探索,见 Token 经济学

  • 架构分叉(新状态放哪层、是否引入新依赖)
  • 安全、权限、密钥、合规
  • 产品行为歧义(「用户体验更好」未定义)
  • Agent 连续两轮无进展或出现 调试与错误恢复 中的失败信号

干预方式优先:改验收/边界 > 口头否定 > 在长会话里堆补丁。

大改、不熟域、多人协作模块:先 Plan Mode,批准后再执行。这是「放手」与「干预」之间的契约,不是拖延。


下列活动可以借助 AI 收集材料,但判断权应留在人侧:

保留给人可借助 Agent原因
值不值得做调研、对比实现成本涉及产品与机会成本
架构权衡草拟方案、列 pros/cons长期负债由团队承担
事故责任界定整理时间线、日志组织与合规
安全威胁模型列攻击面需组织风险偏好
对用户的承诺起草文案品牌与信任
何时停止投入统计进度沉没成本判断

外包这些会导致:代码能跑,但没人能解释为什么这样设计。PR review 被问住时,就是分工失败的信号。

  • 语法与样板代码
  • 测试用例枚举(人审边界)
  • 文档初稿、changelog 起草
  • 依规范重命名、迁移 codemod

边界原则:Agent 产出必须能被你的验收规则 falsify,见 TDD 与质量


练习通过标准
1每个任务写清验收再开聊提示里必有命令或测试名
2大任务强制 /plan无未经批准的大范围 Edit
3实现与审查会话分离至少一次 reviewer 抓出问题
4纠正写入 CLAUDE.md 或 rules同类错误不重复第三次

每周只问 反思章 的三问:哪错重复、哪条可外置、哪验证仍靠猜。


你想练
跑偏恢复调试与错误恢复
少烧钱Token 经济学
少出事安全边界
可上线TDD 与质量
多人一致团队落地

试着回答:

  1. 给一条你常用的「搜索引擎式」提示,改写成意图式。
  2. 什么情况下你会拒绝让 Agent 连续跑十轮工具?
  3. 架构决策为什么不能默认外包?
  4. Plan Mode 在「放手」谱系里占什么位置?

自检清单:

  • 最近任务写过验收标准
  • 至少一次计划批准后再执行
  • 能说出两条必须人做的判断
  • 把一次纠正写进了 CLAUDE.md 或 rules

下一章:CLI 与配置查阅(查阅章,非跟读)· 再读 常见问题排查。回到 漫游指南 可按需重读各章。