02 · marketing-psychology · 2026-04-30
AI 客服 SaaS 营销方案 + 可运行官网首页
marketing-psychology skill · 双交付
任务与环境
原始 Prompt
只分析 gorgias.com 这一个网站,输出中文营销文档(产品定位、30 天获客计划、内容选题、私聊话术、官网文案、FAQ),以及一份单文件中文 index.html(首屏、痛点、解决方案、功能、场景、FAQ、预约 demo 区,无外部资源)。
查看完整 Prompt 原文 →期望产物
一份营销执行文档 Markdown + 一份单文件 index.html(全内联 CSS/JS,中文)
执行结果
全部数据来自 OpenRouter activity CSV 逐请求核算。
| Agent | 请求数 | 总花费 | Prompt | 命中率 | 去首轮命中率 | 输出截断 | 错误 | 模型统一 |
|---|---|---|---|---|---|---|---|---|
|
OpenClacky
本项目
|
20 | $1.72 | 628,278 | 91.0% | 92.2% | 1 | 0 | ✅ 统一 |
|
Claude Code
闭源订阅
|
8 | $1.20 | 310,106 | 64.5% | 63.6% | 0 | 0 | ⚠️ 混用 |
|
OpenClaw
开源同类
|
34 | $7.47 | 3,759,466 | 86.1% | 88.2% | 8 | 0 | ✅ 统一 |
|
Hermes
开源多 agent
|
22 | $4.65 | 1,258,934 | 52.9% | 53.9% | 0 | 0 | ✅ 统一 |
Claude Code: haiku×2 + sonnet×1 + opus×5(非 opus 请求占 37.5%,花费占比 <5%)
四家执行全程录屏
过程录像 · Evidence任务执行期间的完整屏幕录像,四家同一 prompt、同一时间窗口。
录像由 2026-05 实测生成。若需验证原始时长/时序,可与 OpenRouter 日志中的 created_at 字段对齐。
实际产物
四家产物全部公开。点击即可预览 HTML、查看 Markdown 或下载源文件。
OpenClacky
3 filesClaude Code
2 filesOpenClaw
2 filesHermes
3 files执行路径与观察
- OpenClacky 20 个请求,单 session;session JSON 因 rotate 机制被清理,保留 system log 记录:12:35 playbook 落盘,16:09 plan 落盘。命中率 91.0%,去首轮 92.2%——本任务四家最高。
- Claude Code 8 个请求最少,$1.20 最省,但 3/8 请求混用 haiku/sonnet(架构特性:自动调用轻量模型做辅助)。命中率 64.5% 偏低的原因:请求数少导致首轮在整体里的占比较大。
- OpenClaw 34 个请求 / $7.47,是 OpenClacky 的 4.3 倍;其中 8 次触发
finish_reason=length(占 23.5%)——输出达 max_tokens 后续写,带来了大量冗余上下文提交。 - Hermes 22 个请求 / $4.65;命中率 52.9%,去首轮 53.9%——几乎无变化,再次印证其 cache 问题是架构层面的。
小结
本任务 OpenClacky 命中率(91.0%)反超 Claude Code(64.5%)——请求数较多时 OpenClacky 的 cache 工程优势更能体现。
Claude Code $1.20 的低花费需辩证看待:8 个请求中 3 次用了 haiku/sonnet,并非严格意义上的“同模型对齐”。
OpenClaw 的高花费主要来自 8 次输出截断引发的重试与冗余提交——这是 harness 在长输出场景下的系统性问题,在 PPT 任务中再次出现。