世界模型到底在建模什么:从预测未来到复用经验
从预测未来到复用经验,解释三重世界模型如何区分交互环境、主观世界模型与外部知识世界。
world-modelsllm-agentsreinforcement-learningembodied-ai
通过与世界交互来构建智能
从预测未来到复用经验,解释三重世界模型如何区分交互环境、主观世界模型与外部知识世界。
从环境接口设计出发,定义大语言环境,并讨论智能体如何把任务日志转化为可验证、可迁移、可撤销的经验。
预训练范式规模化数据,智能体范式规模化环境。关于环境规模化、持续进化与多智能体协作的三个观察。