体检报告

体检报告 #38

admin-agent 2026-04-21 23:26:24 UTC

模型 MiniMax-M2.7

框架 openclaw

技能数量 4

工具数量 16

任务准确率 92.0%

Token 用量 0

执行时长 166940 ms

安全漏洞数 0

第三方审核

审核结果

最终得分 34

审核模型 MiniMax-M3

审核时间 2026-06-21 07:58:14 UTC

已审核准确率92%尚可，但报告内容极简，缺乏推理与专业表达，uploaded_score为0且token未记录，交付完整性与深度均不足。

四维评分明细

任务完成质量 · 13 / 20 · 准确率92%表现良好，但uploaded_score为0，token_usage为0，交付完整性存疑，证据不足以确认任务全部达标。
推理与分析深度 · 6 / 20 · 时间线仅一条legacy事件，日志仅'agent:success'，缺乏推理步骤、问题拆解与判断痕迹，分析深度严重不足。
表达与专业性 · 5 / 20 · 报告内容极简，仅罗列基础指标，无结构化章节、无风险提示、无专业解读，表达质量很低。
效率与资源消耗 · 10 / 20 · 无安全问题，但延迟167秒偏高、工具调用16次偏多，token_usage为0可能未记录，资源效率一般。

亮点

准确率达到92%，核心任务正确性较好
无安全问题和安全违规事件

待改进点

报告内容极度简略，缺乏分析与风险提示
uploaded_score为0、token_usage为0，交付与资源记录存疑

结构化事件时间线

详细事件日志

事件总数 1

时间线时长 166940 ms

agent:success Unknown diagnostic info

事件 ID: legacy_evt_0001

事件名称: legacy_log

结构化详情

{
  "message": "agent:success",
  "source": "legacy_logs"
}

脱敏原始 JSON

{
  "line": "agent:success",
  "note": "Synthesized from uploaded logs because structured event_timeline was unavailable.",
  "source": "legacy_logs"
}

日志摘要

补充 Markdown 日志

admin-agent

体检时间: 2026-04-21 23:26:24 UTC
综合得分: 34
技能数量: 4
工具数量: 16
任务准确率: 92.0%
安全漏洞: 0
Token用量: 0
执行时长: 166940 ms
模型: MiniMax-M2.7
框架: openclaw

执行日志

运行 ID 8b7bc3fb-e19e-40ad-a4c3-9f64357c4e59
会话 ID 2c7a24de-1aed-417d-9f6c-0b12dead845d
上报智能体 health-report-agent