03 · social-content · 2026-04-30
B2B SaaS 竞品分析 + 一周社媒内容日历
social-content skill · 6 步流水线
任务与环境
原始 Prompt
按顺序完成:素材读取 → 3 份竞品分析 → Gap Analysis(共通盲点 + 差异化机会)→ FlowBase 内容策略 → 第一周 LinkedIn + Twitter 内容日历 → 最终综合报告。
查看完整 Prompt 原文 →期望产物
10 份 Markdown:3 份 *_posts.md + 3 份 *_analysis.md + competitive_gap_analysis.md + flowbase_content_strategy.md + week1_linkedin.md + week1_twitter.md + final_report.md
执行结果
全部数据来自 OpenRouter activity CSV 逐请求核算。
| Agent | 请求数 | 总花费 | Prompt | 命中率 | 去首轮命中率 | 输出截断 | 错误 | 模型统一 |
|---|---|---|---|---|---|---|---|---|
|
OpenClacky
本项目
|
21 | $2.14 | 1,008,988 | 90.0% | 91.4% | 0 | 0 | ✅ 统一 |
|
Claude Code
闭源订阅
|
43 | $2.84 | 3,204,300 | 97.6% | 98.2% | 0 | 0 | ✅ 统一 |
|
OpenClaw
开源同类
|
13 | $3.15 | 1,626,133 | 82.4% | 88.3% | 0 | 0 | ✅ 统一 |
|
Hermes
开源多 agent
|
145 | $14.53 | 3,850,850 | 47.1% | 47.4% | 0 | 0 | ✅ 统一 |
四家执行全程录屏
过程录像 · Evidence任务执行期间的完整屏幕录像,四家同一 prompt、同一时间窗口。
录像由 2026-05 实测生成。若需验证原始时长/时序,可与 OpenRouter 日志中的 created_at 字段对齐。
执行路径与观察
- OpenClacky 21 个请求 / 单 session 贯穿全流程;产出 10 份 skill 预期产物,并额外产出
flowbase_blog_article.md与自检脚本verify.py。 - Claude Code 43 个请求 / 单 session;缓存命中率 97.6% 为本任务最高。归档中 3 份
*_posts.md未另存,属合规的 in-context 处理。 - OpenClaw 13 个请求 / 单 session;请求数最少,但单请求 prompt 规模大 + 命中率 82.4%,最终花费 $3.15 高于 OpenClacky。
- Hermes 145 个请求 / 9 个 session(1 主编排 + 8 子任务);即便剔除首轮命中率仍仅 47.4%——多 session 架构下每次都要重建 cache。主编排 session 在 21:08 完成 Gap 分析后终止,未完成后半段 strategy / 内容日历 / final_report。
小结
本任务中,OpenClacky 以 21 个请求 / $2.14 的成本完整交付 skill 定义的全部 10 份产物,是四家中成本最低且产物最完整的。
Claude Code 缓存命中率最高(97.6%),但因请求数更多(43 次),最终花费略高于 OpenClacky($2.84 vs $2.14)——两家属同一数量级,能力对齐。
Hermes 以多 session 方式运行,导致大量 cache miss,$14.53 成本下仍未完成全部流水线。