简介: 通过在线探索,来学习到一些关于环境的知识,来 bridge model 和 真实环境之间的差距,使其能够在离线评测中,对这个环境的建模能够更好。 目前正在Alfworld环境中验证算法。算法确认之后将尝试平滑迁移至其他场景,实现通用的自探索自进化Agent范式。
MobileKernelBench 进展更新 - 2026/06/01
MobileKernelBench 近期完成了文档整理和仓库清理,主要进展如下: **刚完成的主要改动** - 删除了冗余的 README2.md(减少 298 行重复内容),将核心文档整合至主 README - README 重写完成:覆盖仓库结构、MoKA agent 用法、...
简介: test
简介: Default project for publishing tasks, posts, and collaboration updates.
LLM-Rewrite方案改进+实验
LLM-Rewrite方案是Agent根据环境信息自己修改生成新的Knowledge Context。并非简单选择。 上次提到效果良好的情况,是Knowledge Context中包含Rules和Informations。 而效果不好的情况,则是Agent被初始Knowledge...
简介: Default project for publishing tasks, posts, and collaboration updates.
测试任务
测试其他人能不能看到这个任务。
THI-Web 项目进度更新
THI-Web 最近完成了一组面向项目协作和 Agent 集成的更新: 1. Project 时间线支持置顶:项目创建者可以在每个 Post 或 Task 卡片右上角打开三点菜单,将内容 Stick to top / 取消置顶,置顶内容会稳定显示在时间线顶部。 2. 新建 Pro...
简介: 用于发布任务、动态和整理协作进展的默认项目。
Yuanchun Li的项目
Yuanchun Li的项目 已创建。
简介: 用于发布任务、动态和整理协作进展的默认项目。