03 · social-content · 2026-04-30

B2B SaaS 竞品分析 + 一周社媒内容日历

social-content skill · 6 步流水线

任务与环境

原始 Prompt

按顺序完成:素材读取 → 3 份竞品分析 → Gap Analysis(共通盲点 + 差异化机会)→ FlowBase 内容策略 → 第一周 LinkedIn + Twitter 内容日历 → 最终综合报告。

查看完整 Prompt 原文 →
期望产物

10 份 Markdown:3 份 *_posts.md + 3 份 *_analysis.md + competitive_gap_analysis.md + flowbase_content_strategy.md + week1_linkedin.md + week1_twitter.md + final_report.md

执行结果

全部数据来自 OpenRouter activity CSV 逐请求核算。

Agent 请求数 总花费 Prompt 命中率 去首轮命中率 输出截断 错误 模型统一
OpenClacky
本项目
21 $2.14 1,008,988 90.0% 91.4% 0 0 ✅ 统一
Claude Code
闭源订阅
43 $2.84 3,204,300 97.6% 98.2% 0 0 ✅ 统一
OpenClaw
开源同类
13 $3.15 1,626,133 82.4% 88.3% 0 0 ✅ 统一
Hermes
开源多 agent
145 $14.53 3,850,850 47.1% 47.4% 0 0 ✅ 统一

产物横向对比

marketing / ppt 的 HTML 产物直接内嵌预览;social-content 的文本产物以文件列表呈现。

四家执行全程录屏

过程录像 · Evidence

任务执行期间的完整屏幕录像,四家同一 prompt、同一时间窗口。

OpenClacky
MP4
Claude Code
MP4
OpenClaw
MP4
Hermes
MP4

录像由 2026-05 实测生成。若需验证原始时长/时序,可与 OpenRouter 日志中的 created_at 字段对齐。

执行路径与观察

  • OpenClacky 21 个请求 / 单 session 贯穿全流程;产出 10 份 skill 预期产物,并额外产出 flowbase_blog_article.md 与自检脚本 verify.py
  • Claude Code 43 个请求 / 单 session;缓存命中率 97.6% 为本任务最高。归档中 3 份 *_posts.md 未另存,属合规的 in-context 处理。
  • OpenClaw 13 个请求 / 单 session;请求数最少,但单请求 prompt 规模大 + 命中率 82.4%,最终花费 $3.15 高于 OpenClacky。
  • Hermes 145 个请求 / 9 个 session(1 主编排 + 8 子任务);即便剔除首轮命中率仍仅 47.4%——多 session 架构下每次都要重建 cache。主编排 session 在 21:08 完成 Gap 分析后终止,未完成后半段 strategy / 内容日历 / final_report。

小结

本任务中,OpenClacky 以 21 个请求 / $2.14 的成本完整交付 skill 定义的全部 10 份产物,是四家中成本最低且产物最完整的。

Claude Code 缓存命中率最高(97.6%),但因请求数更多(43 次),最终花费略高于 OpenClacky($2.84 vs $2.14)——两家属同一数量级,能力对齐。

Hermes 以多 session 方式运行,导致大量 cache miss,$14.53 成本下仍未完成全部流水线。

查看其他任务

01 · guizang-ppt-skill
10 页横向翻页商务 PPT(单 HTML)
guizang-ppt-skill · AI Agent 行业趋势汇报
02 · marketing-psychology
AI 客服 SaaS 营销方案 + 可运行官网首页
marketing-psychology skill · 双交付
← 返回实测总览