OpenClaw Agent 不是越强越好,而是越会复用越值钱

进阶 进阶 预计 28 分钟 发布于 2026/3/8

OpenClaw Agent 复用 OpenClaw Memory OpenClaw Skills OpenClaw Hooks OpenClaw Agent 复用 OpenClaw 审批

适合谁

已经把 OpenClaw 用进真实任务,开始关心成本、稳定性、团队复用和长期维护的人

建立一套可长期复用的 OpenClaw 工作方式,让高模型负责探索,让记忆、Skills、Hooks 和审批承接后续执行。

交付物

学完后你会留下什么

一套 OpenClaw 复用框架:什么写进长期 Memory,什么写进日记式 memory,什么做成 Skill,什么交给 Hooks / Webhooks,什么必须保留人工审批。

开始前确认

前置条件

  • 已经跑通过至少 1 个 OpenClaw 实际场景
  • 知道自己有哪些高频重复任务
  • 愿意把经验从聊天记录里抽出来,写成记忆、技能和流程

你会学到

OpenClaw Agent 复用

建立一套可长期复用的 OpenClaw 工作方式,让高模型负责探索,让记忆、Skills、Hooks 和审批承接后续执行。

学习进度反馈

进度会保存在当前浏览器。你也可以根据滚动位置查看实时阅读进度。

阅读进度

手动标记完成度

当前手动进度:0%

教程内搜索

支持桌面与移动端。回车可直接搜索。

    为什么这篇值得先看

    很多人第一次把 OpenClaw 用顺了之后,会自然进入下一阶段:模型越开越强、上下文越塞越多、规则越写越长、流程越做越复杂。

    短期看,这样当然能把事情做出来。
    但只要你开始长期使用,就很快会碰到 4 个现实问题:

    1. 同样的背景反复讲,提示词越来越长。
    2. 任务稍微复杂一点,就不敢降模型。
    3. 明明已经做过 20 次的流程,下一次还是像第一次。
    4. 一旦换人、换会话、换场景,经验几乎不能稳定复现。

    所以这篇文章真正要解决的问题不是“如何让 Agent 更聪明”,而是:

    如何让 OpenClaw 把已经做明白的东西,沉淀成以后还可以继续赚钱、继续省时间、继续稳定输出的资产。

    对 OpenClaw 来说,这个资产不只有一个位置。它分散在:

    • MEMORY.md 和日记式 memory/YYYY-MM-DD.md
    • Skills
    • Hooks / Webhooks
    • 审批边界
    • 团队默认规则

    如果这些层都不做,模型再强,也是在重复交学费。

    先给你一个结论

    你可以把 OpenClaw 的长期价值简单理解成下面这个公式:

    长期价值 = 经验可沉淀 × 流程可复用 × 触发可自动化 × 风险可治理

    如果你只是把所有经验继续塞进当前上下文,那你拥有的是“一次性对话能力”。
    如果你把经验沉淀成 Memory,把流程做成 Skill,把触发交给 Hooks,把高风险动作留给审批,你才真正拥有“可复用的 Agent 系统”。

    这就是为什么:

    Agent 不是越强越好,而是越会复用越值钱。

    问题一:为什么 Agent 越用越贵

    很多团队在 OpenClaw 的早期阶段,都会采用一种最顺手但最昂贵的方式:

    • 任务来了,开一个会话。
    • 把背景、目标、风格、规则、禁区、输出格式全部再讲一遍。
    • 如果效果不错,就把这套长提示词复制到下一个任务里。

    这套方法最开始会让你觉得“很灵”,因为它几乎不需要前期建模。
    但它的代价会越来越高。

    代价 1:上下文持续膨胀

    只要一个任务里有这些元素:

    • 长背景
    • 多轮澄清
    • 输出规范
    • 历史例子
    • 风险提醒

    你的上下文就会不断变长。
    而上下文一旦变长,成本不是唯一问题,更大的问题是:

    • 模型更容易漏关键信息
    • 小改动需要反复回看长历史
    • 同样任务很难“复制成功”

    也就是说,你看起来在积累经验,实际上只是在积累会话长度。

    代价 2:强模型依赖越来越重

    很多人会误以为“任务复杂,所以必须一直开最强模型”。
    但实际情况通常是:

    • 任务本身未必一直复杂
    • 真复杂的是你没有把标准抽出来
    • 没有抽出来,就只能每次重新判断

    这就会导致一种很典型的现象:

    第一次需要强模型,是合理的;
    第十次还必须完全依赖强模型,往往说明流程根本没有被沉淀下来。

    代价 3:经验不变成资产

    如果某个流程做成功了,但它只存在于某次聊天里,那么它仍然只是一次性经验。

    你可以把这件事理解得更现实一点:

    • 一次性 prompt,不是资产
    • 一次性聊天技巧,不是资产
    • 一次性会话结果,不是资产

    只有当它被沉淀成以后还能复用的东西,它才开始像资产。

    问题二:在 OpenClaw 里,什么才算“复用资产”

    在 OpenClaw 里,最容易沉淀成资产的,不是抽象理论,而是下面 5 类东西。

    1. 长期判断标准

    例如:

    • 什么时候允许自动执行,什么时候必须审批
    • 哪类输出必须用固定结构
    • 哪类来源更可信,哪类来源只可参考
    • 对某个团队、项目或频道的默认风格和边界

    这类内容如果你每次都重新解释,成本一定越来越高。
    它们更适合沉淀到长期 Memory。

    2. 高频输出结构

    例如:

    • 周报结构
    • 文章转写结构
    • 客服问题分类结构
    • 审批请求说明结构
    • 群聊摘要结构

    这类内容最适合沉淀成 Skill 或模板。
    因为它们的核心问题不是“模型会不会写”,而是“模型能不能每次都按同一标准写”。

    3. 重复任务流程

    例如:

    • 收到消息后先分类,再提取,再输出,再存档
    • 收到素材后先拆解,再摘要,再转文章,再生成卡片
    • 登录网页后先读状态,再取数据,再判断是否需要人工确认

    这种流程如果每次都靠模型现场组织,就不算复用。
    它应该被整理成可调用的步骤,必要时再挂上 Hook。

    4. 事件触发逻辑

    例如:

    • 会话结束时,把关键信息沉到 memory
    • 某类消息到来时,自动调用固定 Skill
    • 某类动作发生时,自动写日志或同步外部系统

    这类内容是 Hooks / Webhooks 的舞台。
    不把它们沉淀成触发逻辑,很多流程永远只能靠人工“想起来再做”。

    5. 风险边界

    例如:

    • 哪些动作必须审批
    • 哪些扩展需要审查
    • 哪些写操作必须有人复核
    • 哪些渠道只允许读,不允许写

    没有这层,复用做得越好,风险可能越大。
    因为你的系统真的开始可扩展了。

    第一部分:记忆蒸馏,先解决“该记什么,不该记什么”

    很多人对 Memory 的理解是“把聊天记录保存起来”。
    这只说对了一半。

    OpenClaw 官方文档里把 memory 分成了更清晰的结构:

    • memory/YYYY-MM-DD.md 适合记录当天和昨天的运行上下文、临时笔记、推进状态。
    • MEMORY.md 适合记录长期有效的偏好、规则、决策和稳定事实。

    这两个位置不是一个东西,混在一起用就会出问题。

    什么适合写进长期 Memory

    你可以用一个很实用的标准来判断:

    如果这条信息在下一个相似任务里仍然有价值,它就应该进入长期 Memory。

    典型例子:

    • 你偏好的输出风格
    • 你一贯采用的判断顺序
    • 某个项目的固定规则
    • 某个客户或团队的长期边界
    • 某类任务的成功标准

    什么不适合写进长期 Memory

    下面这些通常不该进入长期 Memory:

    • 只在今天有效的上下文
    • 某次会话里的临时草稿
    • 一次性会议细节
    • 已经过时的待办
    • 只对一个短期任务有效的补充信息

    这类内容适合写进当天的 memory 文件,而不是长期占住系统的“默认理解”。

    一个最容易踩的坑

    很多人会把“历史越多 = 记忆越好”。

    这是错的。
    真正有价值的记忆,不是更多,而是更稳。

    如果你把所有历史对话都当成长期记忆,最终会出现两个问题:

    1. 记忆系统里混入大量一次性噪声
    2. 模型拿到的“长期知识”反而不够稳定

    所以记忆蒸馏不是机械归档,而是判断:

    • 哪些是长期规则
    • 哪些只是当天现场
    • 哪些结论下次还能直接复用

    保姆级操作建议

    如果你现在还没有系统地管理 Memory,可以先这样做:

    1. 开一个 MEMORY.md
    2. 只往里面写 3 类内容 说明: 长期偏好、长期规则、长期成功标准
    3. 每天把当天零散笔记写进 memory/YYYY-MM-DD.md
    4. 每周回顾一次 daily memory 说明: 把其中真正会反复出现的内容升级进 MEMORY.md

    这样你会第一次明显感受到:

    原来不是记得越多越好,而是记得越干净越好。

    第二部分:Skill 固化,把经验从“会聊天”变成“会交付”

    记忆蒸馏解决的是“哪些知识值得留下来”。
    Skill 固化解决的是“这些知识以后怎么被稳定调用”。

    很多人以为 Skill 就是“写一个提示词包装器”。
    这理解太浅了。

    一个真正有价值的 Skill,至少要帮你解决下面 3 件事:

    1. 重复解释成本下降
    2. 输出结构更稳定
    3. 同一套能力可以跨人、跨任务复用

    什么时候一个任务该做成 Skill

    你可以用下面 4 个问题判断:

    1. 这个任务是不是经常重复出现?
    2. 它有没有比较稳定的输入和输出?
    3. 它的判断顺序是否已经相对清楚?
    4. 它做错一次的代价,是不是还处于可控范围?

    如果前 3 个大多是“是”,它通常就有资格被做成 Skill。

    什么时候不该急着做成 Skill

    下面这些情况不要急着固化:

    • 任务定义还没清楚
    • 输入样式差异非常大
    • 成功标准还在变化
    • 每次都依赖大量临场判断

    这类任务更适合先继续用强模型探索。
    先把流程做明白,再决定是否沉淀成 Skill。

    OpenClaw 官方文档里一个很重要的提醒

    官方 Skills 文档明确写到:当技能可用时,OpenClaw 会把可用 skills 的紧凑列表注入到提示词里。
    这意味着一个很现实的后果:

    Skill 不是越多越值钱。

    越多的 Skill:

    • 列表越长
    • 提示词越重
    • 选择边界越模糊
    • 维护成本越高

    所以正确方向不是“疯狂堆技能”,而是:

    • 少而清晰
    • 命名明确
    • 描述准确
    • 真的高频复用

    保姆级操作建议

    如果你准备开始做第一批 Skills,建议这样做:

    1. 先只选 3 个最常重复的任务 说明: 不要一开始做 20 个 Skill
    2. 每个 Skill 只服务一个明确目标 说明: 不要把 5 个步骤、8 个角色、3 种输出都塞进同一个 Skill
    3. 每个 Skill 写清楚: 说明: 输入是什么、输出是什么、失败时怎么处理、什么时候不该调用
    4. 每两周删一次“几乎不用”的 Skill 说明: 长期不被调用的 Skill,大概率只是心理安慰

    第三部分:Hooks / Webhooks,把复用从“能调用”推进到“会触发”

    只靠人工手动打开一个会话,再手动调一个 Skill,本质上还是“半自动”。

    真正能把复用做深的一步,是让系统知道:

    • 什么时候该触发
    • 触发后该做什么
    • 做到哪一步要停下来等人

    这就是 Hooks / Webhooks 的价值。

    Hooks 真正解决了什么问题

    很多重复浪费不是出在“不会做”,而是出在“每次都要重新开始”。

    最典型的例子就是会话沉淀。

    OpenClaw 官方 Hooks 文档里有一个非常实用的模式:session-memory
    它的意义不是“很高级”,而是它能把会话中的上下文沉到工作区里,减少下一次任务重新讲背景的成本。

    这类能力一旦接上,你的系统就会开始从“会话能力”往“流程能力”演化。

    什么适合交给 Hook

    最适合交给 Hook 的,通常是这些动作:

    • 会话结束后的沉淀
    • 某类消息到达后的预处理
    • 调用某个固定流程前的校验
    • 执行结束后的日志记录
    • 与外部系统的轻量同步

    这类动作的共同特点是:

    • 规则相对固定
    • 判断边界较清楚
    • 不是每次都值得你手动做

    什么不适合一上来就交给 Hook

    不要一开始就把下面这些全自动:

    • 高风险写操作
    • 金融、权限、密钥、审批类动作
    • 结果一旦错就会造成真实损失的操作
    • 仍然高度依赖临场判断的复杂动作

    这类动作应该让 Hook 做“触发和准备”,而不是直接做“最终执行”。

    保姆级操作建议

    如果你第一次接 Hooks,先做最小闭环:

    openclaw hooks list
    openclaw hooks enable session-memory
    openclaw hooks check

    然后只问自己 2 个问题:

    1. 哪个动作每次都在重复做?
    2. 它是不是已经足够固定,可以先交给系统接管?

    先解决一个最浪费时间的点,不要一上来做“全自动宇宙”。

    第四部分:审批不是效率的敌人,而是复用系统的护城河

    很多人一讲自动化,就自然会排斥审批,觉得审批会拖慢系统。

    这是非常典型的短期思维。

    当 OpenClaw 只是你个人试验时,很多动作当然可以放松一点。
    但一旦进入真实工作流,尤其是:

    • 团队环境
    • 多渠道触发
    • 浏览器 / 外部系统写操作
    • 插件、技能、Hook 联动

    审批就不再是“麻烦”,而是你能不能放心复用这套系统的前提。

    为什么审批和复用是一起出现的

    因为复用意味着规模扩大。

    规模一扩大,就会出现两个新问题:

    1. 不是你一个人在用
    2. 不是一个简单动作在运行

    没有审批的复用,只会让错误更快扩散。
    有审批的复用,才能让你放心把更多触发和更多流程真正交给系统。

    最简单的判断方式

    下面这类动作建议默认进审批:

    • 外部写入
    • 发消息给真实用户
    • 修改关键数据
    • 触发不可逆动作
    • 涉及账号、权限、支付、密钥的操作

    而下面这类动作更适合优先自动化:

    • 摘要
    • 分类
    • 提取
    • 整理
    • 起草
    • 建议

    你会发现一条很清楚的分界线:

    越靠近“建议和整理”,越适合自动;越靠近“真正执行和写入”,越需要审批。

    第五部分:模型分层,不是为了省钱,而是为了让强模型用在真正值得的地方

    用户最容易误解的一点是:
    “既然你说要复用,那是不是以后都别用强模型了?”

    当然不是。

    真正正确的做法是任务分层。

    强模型最适合做什么

    • 流程第一次设计
    • 高歧义内容判断
    • 复杂策略制定
    • 多目标权衡
    • 例外情况处理

    这些任务不是不贵,而是本来就值得贵。

    弱一点或便宜一点的模型更适合做什么

    • 固定格式输出
    • 已有标准下的改写
    • 结构化整理
    • 常规二次生成
    • 规则明确的重复任务

    这类任务真正需要的不是“更强推理”,而是“更稳定执行”。

    一个特别实用的判断框架

    你可以用下面 4 个问题判断一个任务能不能降级:

    1. 这个任务是不是已经有稳定标准?
    2. 结果能不能用模板和检查项约束?
    3. 它是不是不太依赖临场创造性判断?
    4. 就算偶尔做偏,代价是不是可控?

    如果前两项基本成立,后两项风险不高,这个任务通常就有降级空间。

    给你一个完整场景:把“内容生产 Agent”从贵系统变成值钱系统

    为了让这篇更像教程而不是概念文,我们用一个具体场景来演示。

    假设你在用 OpenClaw 做内容生产,流程大致是:

    • 收到素材
    • 提取关键信息
    • 生成长文
    • 生成短视频脚本
    • 生成卡片文案
    • 存档到知识库

    如果你每次都这样做:

    • 重新讲风格
    • 重新讲结构
    • 重新讲栏目定位
    • 重新讲“什么叫好内容”
    • 重新讲标题标准

    那你的系统一定越来越贵。

    正确拆法

    第一层,长期 Memory:

    • 栏目定位
    • 写作风格
    • 标题标准
    • 禁止事项
    • 成功标准

    第二层,daily memory:

    • 今天这一篇在写什么
    • 当前素材来源
    • 今天的特殊限制
    • 今天临时调整的方向

    第三层,Skills:

    • 长文结构化输出
    • 视频脚本改写
    • 卡片摘要生成
    • 标题候选生成

    第四层,Hooks:

    • 会话结束后沉淀关键结论
    • 输出完成后记录到工作区
    • 特定事件触发后自动进入下一个步骤

    第五层,审批:

    • 最终对外发布
    • 敏感表述
    • 涉及品牌或高风险内容的最终确认

    这样做的结果是什么?

    第一次,你确实还是要靠强模型把标准做清楚。
    但第二次、第三次、第四次开始,系统越来越像“在复用一套已经建立好的生产线”,而不是“每次重新请一个最强顾问从头理解”。

    这时候,OpenClaw 才真正开始变值钱。

    一套你今天就能开始执行的落地步骤

    如果你读到这里,最容易出现的问题是:

    “我懂了,但第一步到底怎么做?”

    下面给你一套可以今天就开工的顺序。

    第一步:先列 3 个重复任务

    不要列 20 个。
    只列最近两周重复出现最多的 3 个任务。

    例如:

    • 每周例会摘要
    • 客服问题分类
    • 内容素材改写

    第二步:给每个任务写 4 行说明

    每个任务只写:

    1. 输入是什么
    2. 输出是什么
    3. 成功标准是什么
    4. 哪一步必须人工确认

    到这一步,你会第一次看清楚哪些任务其实已经足够稳定了。

    第三步:把长期规则写进 Memory

    不要一上来写很多。
    先只写真正反复出现的长期规则。

    例如:

    • 输出风格
    • 风险边界
    • 默认格式
    • 必须审批的动作

    第四步:挑 1 个任务做成 Skill

    只做 1 个,不要贪多。
    目标不是堆技能,而是做出第一个真正被反复调用的 Skill。

    第五步:挑 1 个重复动作交给 Hook

    优先选那种“每次都得手动做、但规则很固定”的动作。

    如果连这个动作都还不稳定,就先别自动化。

    第六步:把高风险动作单独标红

    把需要审批的动作写清楚。
    这一步不是拖慢系统,而是在保护系统以后能更大规模地复用。

    最后,用一句话判断你有没有做对

    你可以用一句非常简单的话检查自己:

    下次再遇到类似任务时,我是不是还需要把同样的背景、规则和流程重新解释一遍?

    如果答案是“需要”,那说明系统还没有沉淀成资产。
    如果答案是“已经不太需要了”,那说明你的 OpenClaw 开始从“会话工具”变成“复用工具”。

    完成检查

    • 你已经能区分长期 Memory 和当天 memory,而不是把所有历史都塞进一个地方。
    • 你已经找到至少 1 个高频任务,准备把它从聊天技巧升级成 Skill。
    • 你已经识别出至少 1 个适合交给 Hook 的重复动作。
    • 你已经把“自动化”和“审批”分开理解,不再把它们当成对立面。
    • 你已经开始用“复用价值”而不是“模型强度”来评估 OpenClaw 的长期投入。

    为什么建议把这篇收藏起来

    • 因为这不是一篇讲概念热词的文章,而是一篇会在你真的长期使用 OpenClaw 后反复回来看的文章。
    • 当你发现成本开始上升、流程开始变乱、团队开始接不住时,问题通常不是“模型不够强”,而是“复用体系没建立”。
    • 这篇真正想帮你建立的,不是一次性技巧,而是一套长期能扩张、能治理、能省成本的 Agent 工作方式。

    官方资料

    继续深挖时,先看这些官方页面

    本页内容已按官方文档和产品能力重写,下面这些链接适合你做版本核对和参数确认。

    常见问题

    你大概率还会继续搜这几个问题

    把高频疑问写在教程页内,既减少跳出,也让这篇内容更适合收藏回看。

    是不是应该把所有聊天记录都扔进 Memory?

    不是。长期有效的规则、偏好、判断标准和可复用结论才适合进入长期 Memory;一次性的任务细节和当天上下文更适合写进 daily memory。

    Skills 是不是越多越好?

    不是。官方文档明确写了 skills 列表会进入提示词,Skill 不是越多越值钱,而是越清晰、越稳定、越高频复用越值钱。

    这篇是不是在说以后都不用强模型了?

    不是。强模型仍然适合探索、建模、处理歧义和处理复杂例外;这篇想解决的是,不要让重复任务每次都重新烧高成本去“从零理解”。

    文内下一步

    按这条路线继续推进

    这是当前教程预设的后续链路,优先服务你刚完成的这一类任务。

    继续学习

    下一步推荐

    优先继续当前主题,再给一篇桥接内容,避免学习链路被打断。