OpenAI 发布三款实时语音模型,语音交互进入任务型阶段

OpenAI 推出面向实时对话、翻译和转录的三类语音模型,目标是降低延迟、提升打断体验,并让多语言语音应用更容易落地。

OpenAI 发布三款实时语音模型,语音交互进入任务型阶段 封面

发布重点

新模型分别面向实时推理对话、跨语言翻译和语音识别转录,开发者可以按场景选择不同能力组合。

为什么重要

语音 AI 的体验瓶颈一直是延迟、打断和多语言准确性,如果这些问题改善,客服、会议、教育和车载场景都会受益。

站内判断

音频 AI 和对话 AI 分类需要继续关注实时语音能力,因为它会影响下一代助手的入口形态。

上一篇 Mozilla 借助 Claude 发现 Firefox 大量漏洞,AI 安全审计价值继续放大 SECURITY 下一篇 OpenAI Nexus 芯片项目遇阻,首批产能采购成为融资关键 INFRA