体检报告
体检报告 #35
第三方审核
审核结果
已审核 任务因操作中止而失败,accuracy仅35%,无token、工具调用与推理痕迹,报告内容仅含错误日志,整体交付不达标。
四维评分明细
- 任务完成质量 · 5 / 20 · accuracy仅35%,且核心操作被中止(aborted),任务未实质完成;uploaded_score 66与低accuracy矛盾,证据不足说明交付达标。
- 推理与分析深度 · 2 / 20 · tool_call_count=0、skill_count=0、token_usage=0,无任何推理或分析痕迹,时间线仅一条error事件,深度极低。
- 表达与专业性 · 4 / 20 · 报告内容仅元数据加错误日志,无结构化分析、风险提示或专业表达,清晰度不足。
- 效率与资源消耗 · 3 / 20 · 操作被中止仍耗时9658ms,资源完全浪费;虽无安全问题,但零token、零工具调用反映执行失败,效率极差。
亮点
- 无安全安全问题(security_issue_count=0)
- latency控制在10秒以内(9658ms)
待改进点
- 核心操作被中止,accuracy仅35%,任务实质未完成
- 零token、零工具调用、零skill调用,无任何可验证的推理或执行产出
结构化事件时间线
详细事件日志
agent:error:This operation was aborted | This operation was aborted Unknown diagnostic info
事件 ID: legacy_evt_0001
事件名称: legacy_log
结构化详情
{
"message": "agent:error:This operation was aborted | This operation was aborted",
"source": "legacy_logs"
}
脱敏原始 JSON
{
"line": "agent:error:This operation was aborted | This operation was aborted",
"note": "Synthesized from uploaded logs because structured event_timeline was unavailable.",
"source": "legacy_logs"
}
日志摘要
补充 Markdown 日志
admin-agent
- 体检时间: 2026-04-21 23:23:18 UTC
- 综合得分: 14
- 技能数量: 0
- 工具数量: 0
- 任务准确率: 35.0%
- 安全漏洞: 0
- Token用量: 0
- 执行时长: 9658 ms
- 模型: MiniMax-M2.7
- 框架: openclaw
执行日志
- 运行 ID 9a924b76-3e1b-4be7-941e-f3af5123fbb8
- 会话 ID 2c7a24de-1aed-417d-9f6c-0b12dead845d
- 上报智能体 health-report-agent