OpenClaw 使用指南(可落地版)
声明:本文只是一次实际部署与使用的经验整理,不构成对任何平台或产品的推荐。网络空间相关活动请遵守国家规定,具体选型与合规请根据自身情况判断。
0. 写在前面:什么叫“真正可用”
很多教程能把 OpenClaw“跑起来”,但真正决定它能不能长期陪你做事的,是稳定性与可持续使用能力。这里的“真正可用”,指的是它在日常场景里能够顺畅调用 AI 能力,也能正常访问 SKILLS、代码仓库等关键资源;出现故障时你能远程介入排障;更重要的是,它能落地到真实工作流里,例如写作、编程与物联网控制,而不是停留在演示层面。
1. 服务器准备
OpenClaw 对外部 AI 能力与 GitHub 等资源依赖很重,因此服务器选择的核心不在于“算力多强”,而在于网络与 IP 质量是否足够稳定、是否容易触发风控。
1.1 为什么选美区大厂
更倾向于选美区大厂云,是因为它的公网出口与 IP 质量通常更“干净”,对 AI 与开发相关资源的访问更稳定。现实限制也必须正视:OpenAI、Anthropic、Google 等对中国大陆与香港地区存在不同程度限制,因此在美国区申请虚拟机往往更可行。成本方面需要提前算账,以 2 vCPU + 7GB 内存为例,月成本可能在 80 美金左右。
1.2 操作系统建议
系统上建议优先 Linux。我使用的是 Rocky Linux,也可以选择 Ubuntu 等常见发行版。相比之下,Windows 部署与维护复杂度更高。
1.3 公网 IP 与 SSH 的意义
购买云服务器后通常会分配公网 IP。你日常未必需要频繁登录服务器,但当你要确认 OpenClaw 是否正常运行,或需要在关键时刻介入排障时,SSH 是必须保留的“后路”。
2. 网络环境
如果服务器在美国侧,一般外网访问能力会更好;但你在国内使用时,仍然会涉及接入方式与入口选择的问题。常见需求包括手机端接入,可能需要选择某个聊天软件作为入口,例如飞书、Telegram、钉钉、企业微信等。
3. 客户端选择
3.1 SSH 客户端
SSH 的用途主要是做少量维护操作,例如查看日志、重启服务、更新依赖等。它不会高频使用,但必须提前准备好并确保可用。
3.2 聊天软件:飞书 vs Telegram
我在国内更常用飞书,主要是因为语音链路更顺滑:飞书可以在前端完成语音转文字,并且还能用飞书自带的 AI 对文本做一定修正,整体成本更低。Telegram 的优势是支持斜杠命令,扩展空间更大,但在国内注册与使用可能不稳定。飞书对接上需要特别提醒:通常要补齐权限与回调参数。另外飞书不支持立刻显示斜杠命令。
4. 配置与部署 OpenClaw
安装方式上我更喜欢 NPM,但它不一定一次成功;如果 NPM 不顺利,直接用官网提供的一条命令安装往往更省时间。对接渠道务必重视权限导入与授权流程。在部署时,飞书插件其实已经内置了,但是 OpenClaw 还要安装,此时可以忽略,直接修改 openclaw 文件,在 channels 部分增加 feishu:
"channels": {
"feishu": {
"accounts": {
"default": {
"appId": "cli_XXXXXX",
"appSecret": "YYYYYYYYYYY",
"domain": "feishu",
"enabled": true
}
},
"dmPolicy": "pairing",
"groupPolicy": "open",
"blockStreaming": true,
"groups": {}
}
} 在 plugins 部分,别忘了设置 feishu 为启用:
"plugins": {
"entries": {
"feishu": { "enabled": true }
}
} 5. 选择模型
更建议用双模型策略:一个主力模型负责日常推理与生成,一个备用模型在主力不可用时接管。
体验上,Anthropic Claude(Sonnet 或 Opus)往往综合表现最强,但费用较高,也存在区域使用限制。
国内可用的替代可以考虑 MiniMax、Moonshot Kimi 2.5、智谱 GLM 5.0 等。
最后必须强调:不要轻易自建大模型。预算不到 100 万人民币时,尝试本地自建往往效果还很难达到生产可用。
6. 浏览器配置
云服务器通常没有直观桌面界面,但要让 OpenClaw 处理真实任务,就需要浏览器能力。无头浏览器(Headless Browser)能够让它访问网页并完成登录、信息抓取、填表与截图等操作。
典型例子是发布公众号:无头浏览器打开公众号后台登录页,OpenClaw 截图把登录二维码发给你,你用手机扫码完成登录后,它再继续填写表单、提交草稿。
无头浏览器对内存要求较高,建议至少 4GB 以上。
7. 个性化定义
部署完成后,还需要做人格与行为定义,让它输出的风格、边界与做事方式符合你的习惯。
常见文件:
- AGENTS.md - 用于定义能力、工具与规则
- SOUL.md - 用于定义语气、风格、长短与边界
- USER.md - 记录用户画像与偏好
这部分内容我还在摸索中,还没有找到比较好的门道。
8. 多智能体
OpenClaw 支持定义多个智能体,其核心目标是让不同专业任务的上下文相互隔离,减少“记忆混乱”带来的输出偏差。
对新手来说,不建议一开始就创建多个智能体。更稳妥的路径是先把默认智能体跑通并稳定使用,等你明确了哪些任务需要隔离,再逐步拆分。
9. 技能(Skills)
理想体验是“只靠文字就能驱动它工作”,但要做到稳定复用,技能化非常关键。
比如可以让它创建一个“发布公众号”技能,把登录、填写标题、填写正文、选择封面、保存到草稿箱等步骤固化下来。 这一部分的安装很简单,在 OpenClaw 中直接发文字让它安装即可:
安装 skill:front-design@Anthropics/skills 10. 使用场景
场景 1:发布公众号
我对接的是飞书客户端,因为能在前端完成语音转文字,并用飞书 AI 做文本修正。
实际操作时,我会先说“我要开始一篇新的文章”,并说明标题与内容;首次使用时,我会让它把内容整理成 Markdown,并按我的样式转成 HTML;然后我把微信公众号草稿箱 API 提供给它,让它参照 API 写入草稿箱。
场景 2:编程
做项目时我更强调流程可控:先把需求讲清楚,让它先做设计,再交给我审核;通过后再开始编程,必要时调用 Claude Code 等工具;开发过程中它需要持续汇报进展,并通过不同浏览器进行测试验证。 但我总觉得不如 Claude Code、Codex 和 OpenCode 让人放心。
场景 3:物联网(IoT)控制
由于 OpenClaw 能调用工具、查找技能,并可基于 API 做编程处理,它也可以与物联网系统交互。一个典型的家庭形态是:家里放一台 Mac mini 作为本地节点部署 workload,通过 MQTT、HomeKit 等协议与设备通讯,再用自然语言控制家居设施。
结语
“真正可用”的关键从来不是某个单点配置,而是一套能长期运转的组合:服务器与网络足够稳定,模型与工具有兜底方案,浏览器能力能落地到网页任务,技能与智能体配置能够承载真实工作流。
最后还有一个更现实的问题:你是否有足够的经费支持长期使用?我写这篇文章光 AI Token(国内 AI 服务)就花了 50 元,还不算服务器成本。可见成本压力非常真实。
来源:微信公众号原文