智谱开源GLM-ASR-Nano-2512模型推动端侧AI普及!

2025-12-11 16:30
阅读112

今日,智谱正式发布并开源GLM-ASR系列语音识别模型,并同步上线了基于该模型打造的桌面端智谱AI输入法“小凹”,面向所有用户开放。

image.png

智谱表示,希望通过这款输入法让用户实现“动动嘴,活就干了”,从传统的语音转文字,延伸至直接用语音完成各类操作。

GLM-ASR-2512作为智谱新一代语音识别模型,支持将语音实时转化为文字。

在多场景、多语种、多口音的真实环境下测试,该模型保持行业领先水平,字符错误率(CER)仅为0.0717。

基于此,智谱还开源了端侧模型GLM-ASR-Nano-2512,参数量仅1.5B,但在开源语音识别领域表现达到SOTA,并在部分测试中超越若干闭源模型。

该模型能够在本地运行,实现高精度识别的同时,兼顾隐私保护和低延迟交互。

智谱AI输入法基于GLM-ASR系列模型开发,用户在PC端即可通过语音实现自然、流畅的交互。除了精准的语音转文字功能,输入法还整合了翻译、改写、情绪转换等大模型能力,让语音不仅是输入手段,更能直接作为指令控制文本生成和编辑。

用户可在同一界面完成听写、改写、翻译及智能润色,整个过程无需在不同应用间切换,实现“理解-执行-替换”的一体化操作。

此外,智谱AI输入法支持千人千面的人设切换功能,可根据不同场景自动调整文字风格。例如,在工作场景中,碎碎念的口语能转化为条理清晰的汇报;在生活场景中,则可呈现温柔俏皮的聊天风格。

自12月10日起,所有用户都可以下载使用这款输入法,智谱还免费赠送2000积分,相当于28天的体验时长。

0
好文章,需要你的鼓励