当前位置:首页 > 每日科技 > 正文

ChatGPT高级语音模式,正式上线!支持超50种语言,演示视频中用普通话说“对不起”,斯嘉丽的声线没有了

  每经编辑 张锦河    每经实习编辑 宋欣悦    

  9月25日,OpenAI正式宣布,ChatGPT的高级语音模式(Advanced Voice Mode)将于本周内正式面向ChatGPT Plus个人用户及小型企业团队(Teams)用户推出,该功能将率先在美国市场上线。

  此外,OpenAI表示,下周将向OpenAI企业版和教育版用户开放这一功能。但值得注意的是,全新的语音功能适用于OpenAI的GPT-4o模型,不适用于最近发布的预览模型o1。

  此次更新意味着,从本周起,ChatGPT的Plus版个人用户和小型企业团队用户可以通过“语音”而非传统文本输入与聊天机器人进行互动

  高级语音模式的两大亮点尤为引人注目:一是支持用户为语音助手设定“自定义指令”,实现个性化操作;二是具备“记忆”功能,能记住用户偏好的交互方式,这与今年早些时候为ChatGPT的文本版本推出的功能类似。

  在官方发布的视频中,OpenAI的技术项目经理夏洛特·科尔(Charlotte Cole)和OpenAI研究工程师迈克(Mike)表示,用户不仅能自定义对话语速,还能让模型以用户的名字或偏好的称呼进行交流,使沟通更加亲切自然。

  此外,用户还能在系统内预设个人姓名与住址信息。当发起新一轮对话时,如询问“这个周末天气真好,户外有什么有趣的活动可以推荐吗?”高级语音助手将调用用户之前输入的住址信息,主动推荐周边的游玩地点,甚至贴心地规划出行路线。

  为满足不同用户的喜好,高级语音模式新增了五种各具特色的声线:Arbor、Maple、Sol、Spruce和Vale,与原有四种声音Breeze、Juniper、Cove和Ember,共同构成了九大声线选择。这些声线的名称均以自然元素为灵感,旨在提供多样化的语气和特征。

  值得注意的是OpenAI撤除了被指模仿女演员斯嘉丽·约翰逊(Scarlett Johansson)的Sky声线。此前,斯嘉丽指控OpenAI的ChatGPT非法使用其声音,同时要求将语音下架。

  此外,OpenAI表示,他们还对部分外语的对话能力进行了优化,不仅提升了对话速度和流畅度,还对口音进行了细致调整,力求更贴近自然交流。

  OpenAI的模型设计师德鲁(Drew)也分享了他的使用体验,他表示,在日常使用中,用户可以将高级语音助手置于一旁,它会在静默中等待,不会打扰到用户。而当用户有任何疑问或需要时,随时可以向它发起对话,它将迅速捕捉对话的语调变化,灵活扮演各种角色,如同与真人朋友通话般自然流畅。

  ChatGPT高级语音模式现已支持50多种语言,拓展了用户的沟通范围。尤为有趣的是,在官方发布的演示视频中,用户要求语音助手表达,由于让奶奶久等了,向奶奶致歉。高级语音助手先用英语流畅地总结了一遍,并在用户表示“奶奶只会说普通话”后,又用标准的普通话表达了一遍“对不起,我迟到了”,仿佛是OpenAI因为一再推迟发布高级语音模式,在向用户们致歉。

  需要注意的是,该高级语音模式目前还没有向欧盟、英国、瑞士、冰岛、挪威和列支敦士登等地区开放使用。OpenAI尚未公布这些地区的开放时间。

  OpenAI首席执行官山姆·奥尔特曼(Sam Altman)在社交平台上难掩兴奋之情,表示“希望你们觉得等待是值得的”,还加上了委屈和比心的表情。

  尚在假期的OpenAI总裁格雷格·布罗克曼(Greg Brockman)也热情参与了宣传,他表示:“高级语音功能的推出,让你能够轻松与ChatGPT展开流畅无阻的对话。那一刻,你或许会意识到,以往在电脑上费力打字交流的方式是多么不自然。”

ChatGPT高级语音模式,正式上线!支持超50种语言,演示视频中用普通话说“对不起”,斯嘉丽的声线没有了  第1张

  每日经济新闻综合公开消息