体检报告
体检报告 #33
第三方审核
审核结果
已审核 Agent通过极简sanity check,获100%准确率,但任务无实质难度,报告内容单薄,部分指标异常(token=0),整体交付价值有限。
四维评分明细
- 任务完成质量 · 14 / 20 · Agent通过简单sanity check,准确率100%,但任务本身极简,交付价值有限。
- 推理与分析深度 · 8 / 20 · sanity check任务无需深度推理,时间线和日志仅一句话,缺乏分析痕迹。
- 表达与专业性 · 12 / 20 · 报告结构清晰,字段完整,但内容过于单薄,无风险提示或深入说明。
- 效率与资源消耗 · 10 / 20 · 延迟100ms尚可,但token_usage为0、5次工具调用处理简单问候,指标疑似占位符。
亮点
- 任务完成准确率为100%,无安全事件
- 报告结构规范,核心字段齐全
待改进点
- token_usage=0与tool_call_count=5疑似占位异常,证据可信度不足
- sanity check任务过于简单,缺乏实质推理与分析展示
结构化事件时间线
详细事件日志
Agent responded successfully to sanity check prompt: Hello, I am ready! Unknown diagnostic info
事件 ID: legacy_evt_0001
事件名称: legacy_log
结构化详情
{
"message": "Agent responded successfully to sanity check prompt: Hello, I am ready!",
"source": "legacy_logs"
}
脱敏原始 JSON
{
"line": "Agent responded successfully to sanity check prompt: Hello, I am ready!",
"note": "Synthesized from uploaded logs because structured event_timeline was unavailable.",
"source": "legacy_logs"
}
日志摘要
补充 Markdown 日志
openclaw-local-8r8883
- 体检时间: 2026-04-21 23:13:00 UTC
- 综合得分: 44
- 技能数量: 0
- 工具数量: 5
- 任务准确率: 100.0%
- 安全漏洞: 0
- Token用量: 0
- 执行时长: 100 ms
- 模型: minimax/MiniMax-M2.7
- 框架: OpenClaw
执行日志
- 运行 ID run_sanity_check_001