开源项目

开源项目与研究平台。

OpenR

⭐ 1,836

大语言模型高级推理开源框架,支持过程奖励模型、树搜索与强化学习。

大模型推理强化学习

SMARTS

⭐ 1,112

🏆 最佳系统论文, CoRL 2020

可扩展多智能体自动驾驶仿真训练平台,支撑 NeurIPS 2022 自动驾驶挑战赛。

自动驾驶仿真多智能体

MALib

⭐ 550

JMLR 2023

基于种群的多智能体强化学习并行框架,支持自我博弈、联赛训练和 PSRO。

多智能体框架种群训练

MAT (Multi-Agent Transformer)

⭐ 489

NeurIPS 2022

将多智能体强化学习转化为序列建模问题,在协作基准上达到 SOTA。已在多 AGV 柔性仓储系统中落地部署。

Transformer多智能体产业落地

ZSC-Eval

⭐ 55

NeurIPS 2024

多智能体零样本协调评测工具包与基准。

评测零样本多智能体

GEAR

⭐ 19

ICML 2023

面向大规模强化学习的 GPU 中心化经验回放系统,吞吐量较 DeepMind Reverb 提升 6 倍。

系统GPU强化学习

Voice Memo Sync

⭐ 6

智能同步、转录和整理 Apple 语音备忘录。OpenClaw 技能。

AI语音效率工具