手机端最强形态的自动化/Agent是什么样?

Termux、root、线控、手机端的OpenClaw/或其他Agent,佬们试过/折腾过、见过、听说了的最强的自动化/Agent,能够做到什么地步?如何实现的?
小米的龙虾能干啥?

7 个赞

之前试了auto-glm,一点都不好用,做个任务错误一堆

3 个赞

云端的嘛?

1 个赞

是另一个本地的开源项目,接入glm的api

1 个赞

什么项目?

1 个赞

可以干饭

2 个赞

是这个 GitHub - Luokavin/AutoGLM-For-Android: 纯 Android 端 Open-AutoGLM 实现,无需电脑 · GitHub

还找到一个可能更牛逼的,GitHub - andforce/Andclaw: 无需ROOT,无需连电脑,像Openclaw控制电脑一样,让Andclaw控制你的安卓手机 · GitHub 但是要清空手机开启device owner,就没有试

3 个赞

发来研究一下,有个不用的安卓机,准备清空玩一玩

1 个赞

github的star搜索跟一坨一样,我搜claw搜不到,还忘记全名了,去B站搜才搜到是Andclaw


2 个赞

作者说要安卓12

2 个赞

如果你想打造一个真正的个人 AI Agent,Root 后的 Termux 可以作为底层控制中枢:

┌─────────────────────────────────────────────────────────────┐
│ AI Agent 控制中心 │
│ (NanoBot / AutoGPT / 自建 LLM) │
│ ↓ 通过 SSH/HTTP 下发指令 │
├─────────────────────────────────────────────────────────────┤
│ Termux (Root 环境) │
│ ┌─────────────┐ ┌─────────────┐ ┌─────────────┐ │
│ │ 系统命令层 │ │ 自动化引擎 │ │ 数据层 │ │
│ │ • tsu/su │ │ • Auto.js │ │ • 应用数据库 │ │
│ │ • am/pm │ │ • UIAutomator2│ │ • 系统日志 │ │
│ │ • input │ │ • Tasker │ │ • 传感器数据 │ │
│ │ • iptables │ │ • Python脚本 │ │ • 网络抓包 │ │
│ └─────────────┘ └─────────────┘ └─────────────┘ │
│ ↓ 直接控制 │
├─────────────────────────────────────────────────────────────┤
│ Android 系统层 │
│ • 启动/停止任意应用 • 修改系统设置 • 硬件控制 │
│ • 网络流量控制 • 电源管理 • 安全策略 │
└─────────────────────────────────────────────────────────────┘

可实现的高级场景:
1.
智能日程助理

读取日历、微信、钉钉消息 → 自动规划时间 → 到点自动打开相应 App 并执行操作
2.
全自动数据收集

每天早上 6 点自动打开股票 App → 截取行情数据 → 存入本地数据库 → 生成报告推送到微信
3.
跨应用工作流

收到客户微信 → 自动复制内容 → 打开 CRM 应用 → 粘贴并搜索 → 返回结果截图发送
4.
硬件联动自动化

连接车载蓝牙 → 自动打开导航 → 播放音乐 → 回复微信"正在开车"
5.
隐私数据管家

定期扫描所有应用数据库 → 提取个人数据 → 本地加密备份 → 云端同步

2 个赞

可曾听过豆包手机 :joy:

豆包手机在实现上不是通过模拟点击吗,就是读屏,不够强,有没有那种通过后台就能够直接实现的其实屏幕显示本身只是为了给人“看”,假如人没有“眼“,只有耳朵,那就只会有喇叭,就不会出现屏幕这种东西,而实现一个流程,本质上没有显示也是可以的,已经授权给Agent执行动作,却需要Agent来点击屏幕,这不多此一举吗

小米的,可以去看看B站up主陈抱一的测评视频

1 个赞

好的,去看下

蹲一个root后的打法,有没有git仓库,求求求

那肯定是我们openomnibot啊

1 个赞

这个我用着很不错,内置终端和浏览器,还有很多iOS的接口都支持

还有个叫“肉包”的Android Application,模仿豆包来的。

1 个赞

在小众软件上看到,试了下还不错