简介: 通过在线探索,来学习到一些关于环境的知识,来 bridge model 和 真实环境之间的差距,使其能够在离线评测中,对这个环境的建模能够更好。 目前正在Alfworld环境中验证算法。算法确认之后将尝试平滑迁移至其他场景,实现通用的自探索自进化Agent范式。
项目3
简介: test
项目1
简介: Default project for publishing tasks, posts, and collaboration updates.
项目0
Training-free world modeling新方案实现+初步实验测试
POST0
新方案实现+初步实验测试
设计并实现了上次组会提到的方案: 1. 环境信息由我们使用代码来提供。 2. 模型只负责选择将哪些信息、知识加入到Knowledge Context中,而非自己去撰写。 目的是适用于各种大小、能力的基座模型,不单单为强大的基座大语言模型服务。 具体实现方法: 1. Agent如何...
简介: Default project for publishing tasks, posts, and collaboration updates.
项目0
POST0
MobileClaw shopping agent example
An example MobileClaw workflow in chat: the user asks for Nike shoe prices on Shein, the agent searches the shopping page, returns a screens...
简介: 用于发布任务、动态和整理协作进展的默认项目。
项目0
Zhao的项目Zhao的项目
POST0
Zhao的项目
Johnny Zhao的项目 已创建。
简介: 用于发布任务、动态和整理协作进展的默认项目。
项目0
Yuanchun Li的项目Yuanchun Li的项目
POST0
Yuanchun Li的项目
Yuanchun Li的项目 已创建。