01 · guizang-ppt-skill · 2026-05-02
10 页横向翻页商务 PPT(单 HTML)
guizang-ppt-skill · AI Agent 行业趋势汇报
任务与环境
原始 Prompt
严格 10 页以内,覆盖封面 → 核心论点(Copilot 到 Agent)→ 市场驱动 → 多智能体协同 → 行业落地 ROI → 架构演进(AI-Native Infra)→ 治理红利 → 风险挑战 → 4 季度路线图 → 结语。要求逻辑图表 + 数据对比,不要纯文本堆砌。
查看完整 Prompt 原文 →期望产物
一份单文件 index.html(横向翻页 PPT)+ 可能的 assets/images
执行结果
全部数据来自 OpenRouter activity CSV 逐请求核算。
| Agent | 请求数 | 总花费 | Prompt | 命中率 | 去首轮命中率 | 输出截断 | 错误 | 模型统一 |
|---|---|---|---|---|---|---|---|---|
|
OpenClacky
本项目
|
10 | $1.23 | 490,844 | 85.4% | 87.1% | 0 | 0 | ✅ 统一 |
|
Claude Code
闭源订阅
|
19 | $1.45 | 1,372,822 | 94.8% | 94.9% | 0 | 0 | ⚠️ 混用 |
|
OpenClaw
开源同类
|
34 | $5.07 | 2,400,582 | 86.8% | 89.7% | 9 | 1 | ⚠️ 混用 |
|
Hermes
开源多 agent
|
51 | $10.96 | 5,374,545 | 71.0% | 70.9% | 0 | 0 | ✅ 统一 |
Claude Code: haiku×1 + opus×18(非 opus 占比 <5%)
OpenClaw: openrouter/auto 路由混入 opus-4.6×1 + gemini-flash×2,异常模型花费占比 8.3%
四家执行全程录屏
过程录像 · Evidence任务执行期间的完整屏幕录像,四家同一 prompt、同一时间窗口。
录像由 2026-05 实测生成。若需验证原始时长/时序,可与 OpenRouter 日志中的 created_at 字段对齐。
实际产物
四家产物全部公开。点击即可预览 HTML、查看 Markdown 或下载源文件。
OpenClacky
2 filesClaude Code
1 filesOpenClaw
1 filesHermes
1 files执行路径与观察
- OpenClacky 10 个请求 / 单 session / 7 分钟,零截断零错误。请求数全场最少。
- Claude Code 19 个请求 / 2.7 分钟最快;命中率 94.8% 本任务最高;混用 1 次 haiku 辅助。
- OpenClaw 34 个请求 / $5.07;9 次
finish_reason=length+ 1 次 error,共 10 次异常请求占 29.4%。其使用openrouter/auto路由策略,首次请求被路由到旧版claude-4.6-opus,2 次路由到google/gemini-2.5-flash-lite并报错。 - Hermes 51 个请求 / $10.96,wall clock 约 11 分钟;命中率 71.0%,去首轮 70.9%(几乎无变化)。是四家中花费最高的。
小结
本任务中 OpenClacky 用最少请求数(10)+ 最低花费($1.23)完成与其它三家同等质量的 10 页 PPT。
Claude Code 命中率最高(94.8%),但请求数更多,最终花费略高($1.45 vs $1.23)。两家能力对齐。
OpenClaw 的 openrouter/auto 路由策略在本任务暴露出明确的工程问题——旧版 opus 混入、Gemini 错误路由、9 次输出截断合计 10 次异常请求占 29.4%,直接推高成本至 $5.07。
Hermes 以 51 个请求 / $10.96 的成本完成同一产物,是 OpenClacky 的 8.9 倍花费。