Ying Wen

温颖 Ying Wen

长聘教轨副教授 · 上海交通大学人工智能学院

全时导师 · 上海创智学院

温颖,上海交通大学人工智能学院长聘教轨副教授,上海创智学院全时导师。研究方向主要包括强化学习、多智能体系统与大模型,重点关注相关理论、算法、大规模系统及面向真实场景的智能决策与协作。曾获 CoRL 2020 最佳系统论文奖和 AAMAS 2021 Blue Sky Track 最佳论文奖。

2015年本科毕业于北京邮电大学,2016年获伦敦大学学院(UCL)研究型硕士学位,2020年获伦敦大学学院计算机科学博士学位,导师为汪军教授。

动态

2026受邀在 Openmind Winter School(图灵奖得主Rich Sutton组织)作主题报告。

代表性论文

查看全部 →

Learning to Reason in Structured In-context Environments with Reinforcement Learning

Peng Yu, Zeyuan Zhao, Shao Zhang, Luoyi Fu, Xinbing Wang, Ying Wen

ICLR [arXiv]

Language Games as the Pathway to Artificial Superhuman Intelligence

Ying Wen, Ziyu Wan, Shao Zhang

arXiv Preprint [arXiv]

Leveraging Dual Process Theory in Language Agent Framework for Real-time Simultaneous Human-AI Collaboration

Shao Zhang, Xihuai Wang, Wenhao Zhang, Chaoran Li, Junru Song, Tingyu Li, Lin Qiu, Xuezhi Cao, Xunliang Cai, Wen Yao, Weinan Zhang, Xinbing Wang, Ying Wen

ACL [arXiv]

Rema: Learning to Meta-Think for LLMs with Multi-Agent Reinforcement Learning

Ziyu Wan, Yunxiang Li, Xiaoyu Wen, Yan Song, Hanjing Wang, Linyi Yang, Mark Schmidt, Jun Wang, Weinan Zhang, Shuyue Hu, Ying Wen

NeurIPS [arXiv]

Reinforcing Language Agents via Policy Optimization with Action Decomposition

Muning Wen, Ziyu Wan, Weinan Zhang, Jun Wang, Ying Wen

NeurIPS [arXiv]

AlphaZero-like Tree-Search can Guide Large Language Model Decoding and Training

Ziyu Wan, Xidong Feng, Muning Wen, Stephen Marcus McAleer, Ying Wen, Weinan Zhang, Jun Wang

工作经历与教育背景

工作经历

长聘教轨副教授 — 上海交通大学人工智能学院,2024.11至今

全时导师 — 上海创智学院,2025.09至今

长聘教轨副教授 — 上海交通大学约翰·霍普克罗夫特计算机科学中心,2024.01–2024.10

长聘教轨助理教授 — 上海交通大学约翰·霍普克罗夫特计算机科学中心,2020.09–2023.12

教育背景

博士 计算机科学 — 伦敦大学学院(UCL),2016–2020(导师:汪军)

研究型硕士 Web Science & Big Data Analytics — 伦敦大学学院(UCL),2015–2016

学士 电子商务及法律 — 北京邮电大学(BUPT),2011–2015