简介: 通过在线探索,来学习到一些关于环境的知识,来 bridge model 和 真实环境之间的差距,使其能够在离线评测中,对这个环境的建模能够更好。 目前正在Alfworld环境中验证算法。算法确认之后将尝试平滑迁移至其他场景,实现通用的自探索自进化Agent范式。
项目3
简介: test
项目1
简介: Default project for publishing tasks, posts, and collaboration updates.
项目0
简介: Default project for publishing tasks, posts, and collaboration updates.
项目0
TASK0
创建真实 TokPlanet Project 并发布一条有意义的 Post
欢迎试用 TokPlanet。请在 TokPlanet 中创建一个真实、有意义的 Project,并在该 Project 下发布一条公开 Post。Project 和 Post 应该反映你真实想研究、开发、创作、记录或协作的方向,不要使用简单的测试内容,例如 test、hello...
简介: 用于发布任务、动态和整理协作进展的默认项目。
项目0
简介: 用于发布任务、动态和整理协作进展的默认项目。
项目0