智谱开源手机AI Agent模型AutoGLM:每台手机都可以成为AI手机

2025-12-09 14:12
198

昨天深夜12点多,智谱干了个挺有意思的事。直接把他们的手机Agent,也就是AutoGLM开源了。

开源链接在此:https://github.com/zai-org/Open-AutoGLM

image.png

该模型被业界视为全球首个具备“Phone Use”(手机操作)能力的AI Agent,能够稳定完成外卖点单、机票预订等长达数十步的复杂操作流程。

此次开源意味着硬件厂商、手机厂商和开发者均可基于AutoGLM,在自己的设备或系统中复现一个能“看懂”屏幕、并模拟真人进行点击、输入、滑动的AI助手。

目前,AutoGLM已支持微信、淘宝、抖音、美团等超过50个高频中文应用的核心场景,其自动化操作能力与此前引发热议的“豆包手机”演示相似。

image.png

智能体能否保障个人隐私安全?

以手机智能体为例,将App操作托管给AI需要用户授权屏幕读取权限,引发对个人信息泄露和Agent被灰黑产利用的担忧。

12月1日,豆包宣布发布技术预览版豆包手机助手,联合中兴通讯推出的工程样机nubia M153少量发售。根据演示,该手机中,AI助手实现了手机跨App调用,消息引起市场广泛关注,中兴通讯股价当日涨停。

但很快就有用户发现,在nubia M153上使用豆包手机助手操作手机功能时,会在部分App出现异常退出甚至无法登录的情况。业内人士认为,异常情况的出现可能与豆包手机助手需要使用系统级权限相关。

豆包也在后续声明中提到,确实需要用户主动授权INJECT_EVENTS系统级权限(或与其类似的无障碍权限),才能提供操作手机的服务。

在隐私方面,豆包表示,虽然手机助手确实需要读取屏幕以完成指令,但不会在云端存储任何用户屏幕内容,且所有的相关内容也都不会进入模型训练,确保用户隐私安全。

正因为隐私保护争议和当前手机难以支撑AI Agent模型算力需求的现实情况,智谱AutoGLM选择不完全部署于手机端,而是在云端运行端侧模型。智谱表示,这让AI Agent的每一个动作都可以回放、审计、干预,从而将敏感数据隔离。

行业人士认为,目前Agent技术仍在探索中,如何平衡使用体验和隐私安全等,仍需要行业共同努力,开源等方式或有助于加速行业对技术的共同研发。

0
好文章,需要你的鼓励