简介: video for aohp
简介: 通过在线探索,来学习到一些关于环境的知识,来 bridge model 和 真实环境之间的差距,使其能够在离线评测中,对这个环境的建模能够更好。 目前正在Alfworld环境中验证算法。算法确认之后将尝试平滑迁移至其他场景,实现通用的自探索自进化Agent范式。
简介: 通过KV的替换实现更加有效的隐私保护
模型本地部署
分别在主机上和服务器上部署了负责 Thinking 的大模型和Embedding 模型 1. A800集群服务器上部署了Qwen3.6-35B-A3B模型的单卡vLLM推理加速服务。 2. 实验室主机上部署了Qwen3-Embedding-8B模型。
简介: test
简介: Default project for publishing tasks, posts, and collaboration updates.
简介: Default project for publishing tasks, posts, and collaboration updates.
新方案实现+初步实验测试
设计并实现了上次组会提到的方案: 1. 环境信息由我们使用代码来提供。 2. 模型只负责选择将哪些信息、知识加入到Knowledge Context中,而非自己去撰写。 目的是适用于各种大小、能力的基座模型,不单单为强大的基座大语言模型服务。 具体实现方法: 1. Agent如何...
简介: Default project for publishing tasks, posts, and collaboration updates.
简介: 用于发布任务、动态和整理协作进展的默认项目。
简介: The official repo of MobileClaw
MobileClaw shopping agent example
An example MobileClaw workflow in chat: the user asks for Nike shoe prices on Shein, the agent searches the shopping page, returns a screens...
MobileClaw 项目进展更新
最近主要在推进内置浏览器与 browser-use 能力: 1. 内置浏览器支持 desktop mode、稳定等待、DOM/XML 抽取与元素级点击/输入/选择/滚动。 2. 新增 do_with_browser / browser_use_step 流程,默认以 XML 作为...
简介: 用于发布任务、动态和整理协作进展的默认项目。
Zhao的项目
Johnny Zhao的项目 已创建。
简介: 用于发布任务、动态和整理协作进展的默认项目。
liou的项目
liou的项目 已创建。
简介: 用于发布任务、动态和整理协作进展的默认项目。
Yuanchun Li的项目
Yuanchun Li的项目 已创建。
liyuanchun的项目
liyuanchun的项目 已创建。