开源项目
开源项目与研究平台。
OpenR
⭐ 1,836大语言模型高级推理开源框架,支持过程奖励模型、树搜索与强化学习。
大模型推理强化学习
SMARTS
⭐ 1,112🏆 最佳系统论文, CoRL 2020
可扩展多智能体自动驾驶仿真训练平台,支撑 NeurIPS 2022 自动驾驶挑战赛。
自动驾驶仿真多智能体
MALib
⭐ 550JMLR 2023
基于种群的多智能体强化学习并行框架,支持自我博弈、联赛训练和 PSRO。
多智能体框架种群训练
MAT (Multi-Agent Transformer)
⭐ 489NeurIPS 2022
将多智能体强化学习转化为序列建模问题,在协作基准上达到 SOTA。已在多 AGV 柔性仓储系统中落地部署。
Transformer多智能体产业落地
ZSC-Eval
⭐ 55NeurIPS 2024
多智能体零样本协调评测工具包与基准。
评测零样本多智能体
GEAR
⭐ 19ICML 2023
面向大规模强化学习的 GPU 中心化经验回放系统,吞吐量较 DeepMind Reverb 提升 6 倍。
系统GPU强化学习
Voice Memo Sync
⭐ 6智能同步、转录和整理 Apple 语音备忘录。OpenClaw 技能。
AI语音效率工具