【首发开源 】安卓 AI agent(vlm+cli)最强形态

本帖使用社区开源推广,符合推广要求。我申明并遵循社区要求的以下内容:

  • 我的帖子已经打上 开源推广 标签:
  • 我的开源项目完整开源,无未开源部分:
  • 我的开源项目已链接认可 LINUX DO 社区:
  • 我帖子内的项目介绍,AI生成、润色内容部分已截图发出:
  • 以上选择我承诺是永久有效的,接受社区和佬友监督:

以下为项目介绍正文内容,AI生成、润色内容已使用截图方式发出


先来一小段碎碎念

Ok,已经很晚了,没想到会这么晚才发这个帖子。
熟悉我的佬友(?估计没有哈哈哈,虽然我三级了但是不是很活跃)估计会发现我最近不是很活跃发帖子,那我去干嘛了呢?没错我被一个学长拉去公司实习了。
我们最早做的是 豆包手机 那种形态的手机助手,由于我们团队一直分为两大部分,我们这边基本都是学生,我们不负责盈利的业务。然后我们有些 feature 也不太可能备案,一直就没发布投入使用。最近,终于是准备把我们做的这部分全部开源了~

一句话说清楚我们做的是什么:

豆包手机+OpenClaw

我们的核心能力是使用 VLM 完成 Android 自动化任务,最近我受到了 Minis 这个项目的启发,给 Android agent 添加了终端能力(termux+Ubuntu),这里一并感谢社区的开发者。
所以就出现了 兼具 VLM 工具和 cli 工具的手机 AI agent!
Agent基本工具:

  • VLM task
  • 定时任务/闹钟
  • Memory(Mem0)
  • Cli(Ubuntu)
    • browser use
    • file system
    • skills
    • ……
  • MCP / Mcp Server(这意味着你可以把手机给龙虾玩!)

直接上图:

我们相信这套 CLI+VLM 的 Agent 系统必定会大有作为,拓展性也会非常强,可玩性很高。所以我们决定开源,大家一起来建设这个大有可为的 Android world!

我们的 TODO:
直接集成 termux app 到软件内;
更丰富的 agent 工具!

求求 star!

开源前期 bug 多多(因为我们直接从商业版连续删几万行代码才搞出开源版的:pleading_face:),希望佬友多多包涵以及不要忘记了 PR 活动!

55 个赞

前排支持哇

1 个赞

前排支持

1 个赞

前排支持

1 个赞

豆包手机之前被各大厂围攻,可惜

2 个赞

支持一下佬!

1 个赞

前排支持 :laughing:

1 个赞

前排支持

1 个赞

我们用的无障碍权限,不太可能会被制裁

1 个赞

时间仓促,我正在测试 cicd 流程,估计马上可以发包了……

有点儿疑惑,为什么自动化Agent设计的都是Agent控制时屏幕四周一圈光晕,看到的几个项目都是这样 :joy:

强呀, 大佬

支持 :+1:

支持支持

厉害了,佬!

协同进化了()
主要是这样有ageny接管的视觉效果

强啊,支持

没看懂,是APP提供mcp服务给龙虾使用?

持续关注!

是的。也可以给这个软件再接入mcp工具

太牛了佬,真真仰望

1 个赞