9月1日,阶跃星辰正式发布最强开源端到端语音大模型 Step-Audio 2 mini,该模型在多个国际基准测试集上取得 SOTA成绩。在技术层面,Step-Audio 2 mini 采用了真正的端到端多模态架构,并将语音理解、音频推理与生成统一建模,不仅时延更低、输出更快,还能更加精准地理解副语言信息、非人声信号等语音要素,显著提升了语音人机交互的效率和智能上限。目前,Step-Audio 2 mini 已经可在 GitHub、Hugging Face 等平台下载并体验。
阶跃星辰发布最强开源端到端语音大模型,推动终端设备加速迈进人机交互语音时代
2025-09-04 09:30 来源:星元科技