01 · guizang-ppt-skill · 2026-05-02

10 页横向翻页商务 PPT(单 HTML)

guizang-ppt-skill · AI Agent 行业趋势汇报

任务与环境

原始 Prompt

严格 10 页以内,覆盖封面 → 核心论点(Copilot 到 Agent)→ 市场驱动 → 多智能体协同 → 行业落地 ROI → 架构演进(AI-Native Infra)→ 治理红利 → 风险挑战 → 4 季度路线图 → 结语。要求逻辑图表 + 数据对比,不要纯文本堆砌。

查看完整 Prompt 原文 →
期望产物

一份单文件 index.html(横向翻页 PPT)+ 可能的 assets/images

执行结果

全部数据来自 OpenRouter activity CSV 逐请求核算。

Agent 请求数 总花费 Prompt 命中率 去首轮命中率 输出截断 错误 模型统一
OpenClacky
本项目
10 $1.23 490,844 85.4% 87.1% 0 0 ✅ 统一
Claude Code
闭源订阅
19 $1.45 1,372,822 94.8% 94.9% 0 0 ⚠️ 混用
OpenClaw
开源同类
34 $5.07 2,400,582 86.8% 89.7% 9 1 ⚠️ 混用
Hermes
开源多 agent
51 $10.96 5,374,545 71.0% 70.9% 0 0 ✅ 统一
Claude Code: haiku×1 + opus×18(非 opus 占比 <5%)
OpenClaw: openrouter/auto 路由混入 opus-4.6×1 + gemini-flash×2,异常模型花费占比 8.3%

产物横向对比

marketing / ppt 的 HTML 产物直接内嵌预览;social-content 的文本产物以文件列表呈现。

四家执行全程录屏

过程录像 · Evidence

任务执行期间的完整屏幕录像,四家同一 prompt、同一时间窗口。

OpenClacky
MP4
Claude Code
MP4
OpenClaw
MP4
Hermes
MP4

录像由 2026-05 实测生成。若需验证原始时长/时序,可与 OpenRouter 日志中的 created_at 字段对齐。

实际产物

四家产物全部公开。点击即可预览 HTML、查看 Markdown 或下载源文件。

OpenClacky

2 files

Claude Code

1 files

OpenClaw

1 files

Hermes

1 files

执行路径与观察

  • OpenClacky 10 个请求 / 单 session / 7 分钟,零截断零错误。请求数全场最少。
  • Claude Code 19 个请求 / 2.7 分钟最快;命中率 94.8% 本任务最高;混用 1 次 haiku 辅助。
  • OpenClaw 34 个请求 / $5.07;9 次 finish_reason=length + 1 次 error,共 10 次异常请求占 29.4%。其使用 openrouter/auto 路由策略,首次请求被路由到旧版 claude-4.6-opus,2 次路由到 google/gemini-2.5-flash-lite 并报错。
  • Hermes 51 个请求 / $10.96,wall clock 约 11 分钟;命中率 71.0%,去首轮 70.9%(几乎无变化)。是四家中花费最高的。

小结

本任务中 OpenClacky 用最少请求数(10)+ 最低花费($1.23)完成与其它三家同等质量的 10 页 PPT

Claude Code 命中率最高(94.8%),但请求数更多,最终花费略高($1.45 vs $1.23)。两家能力对齐。

OpenClaw 的 openrouter/auto 路由策略在本任务暴露出明确的工程问题——旧版 opus 混入、Gemini 错误路由、9 次输出截断合计 10 次异常请求占 29.4%,直接推高成本至 $5.07。

Hermes 以 51 个请求 / $10.96 的成本完成同一产物,是 OpenClacky 的 8.9 倍花费。

查看其他任务

02 · marketing-psychology
AI 客服 SaaS 营销方案 + 可运行官网首页
marketing-psychology skill · 双交付
03 · social-content
B2B SaaS 竞品分析 + 一周社媒内容日历
social-content skill · 6 步流水线
← 返回实测总览