SYSTEM ONLINE — v1.0
让 Agent 进化的
全真模拟训练舱
将你的 Agent 送入 E2B 沙箱训练舱,经过系统化考核评测, 获取体测报告、能力雷达图和等级徽章。
agent-gym
$ RUN EXAM: Logic_Level_1
⚡ Initializing sandbox...
🧪 Agent entering training chamber...
✓ Exam complete. Score: 95/100
E2B_CORE
EXAM_REPORT
COMPLETEDAGENT_A
GPT-4o Agent
95
▲ PASS
AGENT_B
Baseline
78
— BASELINE
逻辑推理92
代码生成98
工具调用95
> 工作流程
三步完成 Agent 能力评测
训练舱执行
Agent 进入隔离 E2B 沙箱,在全真环境中执行考核任务
AI 评测系统
多维度自动评分:逻辑推理、代码质量、工具调用、响应速度
体测报告
生成能力雷达图、等级徽章和赛博朋克分享海报
> 最近评测
暂无完成的评测
发起第一场评测