← 返回主站
DISTRIBUTED RADAR

分布式雷达 βeta

把基准测试交给社区:志愿者用自己的订阅额度在本地沙箱里跑 DeepSWE 编码基准, 产出的 patch 由服务端独立重新判分——没有任何一个分数来自自报。 众人拾柴,测出一份谁都可以复核的模型能力雷达。

本季总览

每份提交都由服务端独立重跑 verifier 判分——不采信任何自报结果
格子覆盖进度
已判分提交
参与志愿者
排队待判分

模型战况

通过率 = 判分通过的格子 / 有提交的格子

任务覆盖热区

每格一个任务,颜色越深收集的提交越多——帮我们把浅色格子填满
待认领 进行中 已集齐

贡献者荣誉榜

积分只看真实提交的算力贡献——跑失败也记功,作弊清零封号

如何参与

现在是邀请制内测阶段,从社区群里拿邀请 token 即可上车

加入雷达社区

在主站扫码进群,说一声"我要参加众测",管理员会发给你专属邀请 token。

安装 dradar CLI

一行命令装好(需要 Docker):

curl -LsSf https://api.example.com/install.sh | sh

登录并体检

dradar login 填入 token,dradar doctor 会逐项检查环境并告诉你怎么修。

领任务开跑

dradar go 给你一份带"额度价签"的菜单(例如 ~15 分钟 / 5 小时窗口的 ~12%),确认后自动跑完自动上传。

FAQ

会烧掉我多少订阅额度?

每个任务都有基于 3900+ 条历史数据校准的价签(中位任务约占 5 小时窗口的 15%)。跑之前 CLI 还有额度守卫:估计这一单会顶爆你的窗口时会直接拒绝开跑。真的中途撞墙也不算你失败——标记为"中断",格子重新开放,不扣你任何信誉。

我的数据安全吗?

上传前客户端先做一遍敏感信息脱敏,服务端再扫一遍(带密钥的 patch 直接拒收)。凭据类文件(登录态、session)从不上传。公开展示的只有昵称、积分和判分通过的轨迹。

怎么防止有人伪造成绩?

所有判分都在服务端重跑 verifier,客户端自报的分数一概不信。另有蜜罐任务、租约时间差、轨迹审计等多层检测,可疑提交会被标记复核。作弊 = 历史贡献清零 + 封号 + 社区公示。