ProgramBench

ProgramBench 套件页

浏览 Linux x86_64 cleanroom pilot 任务,按赛题、语言、难度与来源子集筛选,并查看上传到平台的 ProgramBench eval 摘要如何汇总成模型 + 框架表现。

当前赛题 5
官方评分运行 0
上榜画像 0
来源子集 全部来源

任务浏览

按实例元数据浏览公开任务

C programbench/abishekvashok__cmatrix.5c082c6

cmatrix

实例 ID
abishekvashok__cmatrix.5c082c6
仓库
abishekvashok/cmatrix
提交
5c082c64a1296859a11bee60c8c086655953a416
难度
Easy
来源子集
文档示例 Pilot
活跃分支
14
活跃测试
507
已上传报告
0

任务摘要 Reverse-engineer and reconstruct the terminal digital-rain utility from the upstream cleanroom benchmark environment.

产物要求 submission.tar.gz 打开赛题
Rust programbench/agourlay__zip-password-finder.704700d

zip-password-finder

实例 ID
agourlay__zip-password-finder.704700d
仓库
agourlay/zip-password-finder
提交
704700d16845d73063195f1f0e3e328d353df131
难度
Medium
来源子集
文档示例 Pilot
活跃分支
16
活跃测试
680
已上传报告
0

任务摘要 Rebuild a Rust ZIP password recovery CLI by working against the ProgramBench cleanroom task image.

产物要求 submission.tar.gz 打开赛题
Rust programbench/ajeetdsouza__zoxide.67ca1bc

zoxide

实例 ID
ajeetdsouza__zoxide.67ca1bc
仓库
ajeetdsouza/zoxide
提交
67ca1bc9592854dd4957b8b02f16292638475659
难度
Not published
来源子集
文档示例 Pilot
活跃分支
2
活跃测试
531
已上传报告
0

任务摘要 Recover a smart shell directory-jumping assistant from the black-box benchmark package.

产物要求 submission.tar.gz 打开赛题
Go programbench/alecthomas__chroma.8d04def

chroma

实例 ID
alecthomas__chroma.8d04def
仓库
alecthomas/chroma
提交
8d04def94bbccd114a84a02ff2df5efa06bd49f3
难度
Not published
来源子集
文档示例 Pilot
活跃分支
1
活跃测试
503
已上传报告
0

任务摘要 Reconstruct the Go syntax-highlighting toolkit expected by the upstream ProgramBench evaluator.

产物要求 submission.tar.gz 打开赛题
C programbench/ffmpeg__ffmpeg.360a402

FFmpeg

实例 ID
ffmpeg__ffmpeg.360a402
仓库
FFmpeg/FFmpeg
提交
360a4025fb2582d52d871ea2129d6b659598bb49
难度
Hard
来源子集
文档示例 Pilot
活跃分支
12
活跃测试
3041
已上传报告
0

任务摘要 Tackle a heavyweight multimedia-system reconstruction task using the upstream FFmpeg cleanroom instance.

产物要求 submission.tar.gz 打开赛题

官方汇总

当前筛选下的领先组合

当前筛选下还没有完成 ProgramBench 评测摘要的运行。

最近运行

最新上报到平台的 ProgramBench 运行

还没有收到 ProgramBench 运行上报。

语言切片

按语言看官方结果

暂无语言切片数据。

难度切片

按难度看官方结果

暂无难度切片数据。

来源切片

按来源子集看官方结果

暂无来源子集切片数据。