智谱开源手机AI Agent模型AutoGLM：每台手机都可以成为AI手机

2025-12-09 14:12

198

昨天深夜12点多，智谱干了个挺有意思的事。直接把他们的手机Agent，也就是AutoGLM开源了。

开源链接在此：https://github.com/zai-org/Open-AutoGLM

该模型被业界视为全球首个具备“Phone Use”（手机操作）能力的AI Agent，能够稳定完成外卖点单、机票预订等长达数十步的复杂操作流程。

此次开源意味着硬件厂商、手机厂商和开发者均可基于AutoGLM，在自己的设备或系统中复现一个能“看懂”屏幕、并模拟真人进行点击、输入、滑动的AI助手。

目前，AutoGLM已支持微信、淘宝、抖音、美团等超过50个高频中文应用的核心场景，其自动化操作能力与此前引发热议的“豆包手机”演示相似。

以手机智能体为例，将App操作托管给AI需要用户授权屏幕读取权限，引发对个人信息泄露和Agent被灰黑产利用的担忧。

12月1日，豆包宣布发布技术预览版豆包手机助手，联合中兴通讯推出的工程样机nubia M153少量发售。根据演示，该手机中，AI助手实现了手机跨App调用，消息引起市场广泛关注，中兴通讯股价当日涨停。

但很快就有用户发现，在nubia M153上使用豆包手机助手操作手机功能时，会在部分App出现异常退出甚至无法登录的情况。业内人士认为，异常情况的出现可能与豆包手机助手需要使用系统级权限相关。

豆包也在后续声明中提到，确实需要用户主动授权INJECT_EVENTS系统级权限（或与其类似的无障碍权限），才能提供操作手机的服务。

在隐私方面，豆包表示，虽然手机助手确实需要读取屏幕以完成指令，但不会在云端存储任何用户屏幕内容，且所有的相关内容也都不会进入模型训练，确保用户隐私安全。

正因为隐私保护争议和当前手机难以支撑AI Agent模型算力需求的现实情况，智谱AutoGLM选择不完全部署于手机端，而是在云端运行端侧模型。智谱表示，这让AI Agent的每一个动作都可以回放、审计、干预，从而将敏感数据隔离。

行业人士认为，目前Agent技术仍在探索中，如何平衡使用体验和隐私安全等，仍需要行业共同努力，开源等方式或有助于加速行业对技术的共同研发。

好文章，需要你的鼓励