阶跃星辰语音模型 Step-Audio-R1.1 荣登全球第一
2026-01-15 11:42
57
阶跃星辰公司宣布,其开源的原生语音推理模型Step-Audio-R1.1在全球知名的人工智能模型评测榜单上获得了第一名的佳绩。这一榜单由Artificial Analysis Speech Reasoning发布,专注于评估语音模型在音频处理和逻辑推理方面的能力,涵盖了准确率、响应时间等多个维度。

Step-Audio-R1.1以96.4%的准确率超越了诸如Grok、Gemini、GPT-Realtime等一线闭源模型,刷新了历史最好成绩。在性能和速度的综合评估中,Step-Audio-R1.1展现了强大的实力,成为业界关注的焦点。
这款模型具有深度语音推理能力和实时响应功能,能够在没有额外延迟的情况下,端到端理解语音内容,具备“像人类一样听到对话即思考”的特点。其最新版本不仅提升了实时对话能力,还增强了复杂语音推理能力,完整的实时语音API计划于明年2月上线。目前,用户可以通过开放的聊天模式体验到R1.1的核心功能,支持边想边说的流式推理。
在发布会上,阶跃星辰展示了模型在实际应用中的能力,例如分析猫咪的争斗声音和理解韩语歌词。这些案例展示了Step-Audio-R1.1的分析能力和语音理解水平,进一步证明了其在复杂语音环境中的出色表现。
目前,Step-Audio-R1.1的权重已上传至HuggingFace,开发者和研究人员可以免费下载和使用。同时,用户也可以前往阶跃星辰开放平台体验中心进行试用。对于关注AI技术和语音模型的人士而言,这无疑是一个值得期待的机会。
0
好文章,需要你的鼓励
