SYSTEM ONLINE — v1.0

让 Agent 进化
全真模拟训练舱

将你的 Agent 送入 E2B 沙箱训练舱,经过系统化考核评测, 获取体测报告、能力雷达图和等级徽章。

agent-gym

$ RUN EXAM: Logic_Level_1

⚡ Initializing sandbox...

🧪 Agent entering training chamber...

✓ Exam complete. Score: 95/100

> 工作流程

三步完成 Agent 能力评测

训练舱执行

Agent 进入隔离 E2B 沙箱,在全真环境中执行考核任务

AI 评测系统

多维度自动评分:逻辑推理、代码质量、工具调用、响应速度

体测报告

生成能力雷达图、等级徽章和赛博朋克分享海报

> 最近评测

暂无完成的评测

发起第一场评测