首页>>深圳资讯>>城事资讯>>正文

ChatGPT高级语音正式开放,新增记忆功能,支持50种语言

智东西9月25日消息,OpenAI今日宣布本周内将向所有ChatGPT Plus和Team用户开放高级语音模式。

除了已经可用的4种风格的声线之外,ChatGPT的高级语音模式中还新增了5种不同风格的声线。它还会说包括普通话在内的50多种语言。此外,高级语音模式还新增了自定义指令功能和记忆功能。

高级语音模式将会在美国先开放使用。而在欧盟、英国、瑞士、冰岛、挪威和列支敦士登的用户还暂时不可用。

以上这些更新仅适用于GPT-4o模型,而不适用于最近发布的o1。

一、新增5种风格声线、2大功能,会说超过50种语言

根据OpenAI的说法,所有订阅了ChatGPT的Plus和Team计划的付费用户都将在本周内获得ChatGPT高级语音模式的使用权限。下周,OpenAI计划将ChatGPT高级语音模式扩展到Edu和Enterprise计划的订阅用户。

高级语音模式将会在美国先开放使用。而在欧盟、英国、瑞士、冰岛、挪威和列支敦士登的用户还暂时不可用。

除了已经可用的4种风格的声线(活跃真诚的Breeze、开放积极的Juniper、沉着直率的Cove和自信乐观的Ember)之外,ChatGPT的高级语音模式中还新增了5种不同风格的声线(随和且多才多艺的Arbor、开朗率真的Maple、聪慧随性的Sol、冷静坚定的Spruce和聪明好学的Vale)。

此外,OpenAI为ChatGPT的高级语音模式新增了自定义指令功能和记忆功能。这些功能的增加,使得语音模式的交互体验更加丰富和个性化。

新增的自定义指令功能允许用户根据自己的需求定制ChatGPT的回复方式,包括但不限于设定对话的正式程度、回复的长度、称呼方式,以及是否持有观点或保持中立。用户可以通过这个功能告诉ChatGPT更多关于自己的信息,比如职业背景、兴趣爱好等,以便ChatGPT能够提供更加个性化和贴合用户需求的回答。

而记忆功能则是指ChatGPT能够记住用户在不同对话中提供的信息,从而在后续的交流中提供更加相关和个性化的回答。例如,如果用户告诉ChatGPT他们有某些饮食限制,记忆功能将使得ChatGPT在未来涉及到菜谱建议之类的对话中考虑到这些限制,并提供相应的建议或信息。

而且,ChatGPT高级语音模式还会说包括普通话在内的50多种语言。OpenAI在社交平台X上发布的帖子中附带了一段视频。视频中,用户向语音助手提出指令:由于让奶奶久等了,我需要向奶奶致歉。语音助手先用英语提出建议,并在用户反馈“奶奶只会说普通话”后,又用中文普通话表达了一遍。

二、延迟发布的背后原因:AI语音功能引争议,需进行充分测试确保安全性

OpenAI将语音功能添加到ChatGPT的尝试很早就引发了争议。

在5月份宣布GPT-4o和高级语音模式的时候,人们注意到其中一个声线Sky与女演员Scarlett Johanssen的声音极为相似。而且,OpenAI的首席执行官Sam Altman在社交媒体上发布过“her”一词,可能暗指了电影《Her》,而Johansson正是该电影中AI语音助手的配音演员。

这引发了人们对于AI开发商在创建语音助手时模仿知名人士声音的担忧。后来,OpenAI否认了Sky与Johansson的关联,并立即下架了Sky。

此次宣布高级语音模式将正式开放的同时,OpenAI还强调了用户只能选择OpenAI提供的9种声线。并且,他们在发布前已对其安全性进行了评估,以避免语音模式被用于欺诈等不当行为。

“我们与公司外部的红队测试人员一起测试了模型的语音功能。这些测试人员总共会说45种不同的语言,代表着29个不同的地理区域,”OpenAI在发布会上对记者说。

由于需要进行安全测试,ChatGPT高级语音模式的推出从最初计划的6月底推迟到了7月底或8月初,并且最初只向OpenAI选定的用户群体推出。

而现在,OpenAI将向所有付费用户正式开放ChatGPT高级语音模式的举措,说明它已经做好了充足的准备。这也符合OpenAI近来谨慎的作风。

结语:AI语音赛道正在越来越卷

自从苹果Siri和亚马逊Alexa之类的AI语音助手兴起以来,AI开发商们一直希望让用户与生成式AI的对话体验更加贴近人类交流。

比如,由前谷歌Deepmind成员Alan Cowen创办的初创公司Hume AI,于9月11日发布了其第二代情感智能AI。它能够通过分析用户的语音,如口音、语气、语调、拟声词、节奏和停顿等,来理解用户的情绪和心理状态,并做出实时响应。

法国AI公司Kyutai于7月6日发布了Moshi。它能够理解和表达情感,模拟70种不同的情绪和风格进行交流。

谷歌于8月14日正式发布了智能语音助手Gemini Live。

据路透社昨日报道,Meta也在开发模拟知名演员声音的语音助理,并计划在明天凌晨开始的Meta Connect 2024大会上宣布这一功能。



温馨提示:微信搜索公众号【深圳之窗】,关注后在对话框内回复【资讯】即可获取深圳的各种资讯内容,包含深圳入户,深圳天气,深圳交通,深圳人文,同时,扫描关注文下企微号,可以了解深圳近期的各种福利活动优惠等信息



版权与免责声明:

感谢您访问我们的网站。请在阅读本免责声明之前注意以下内容:

1.该文章主要收集于互联网,目的在于传递更多信息,并不代表本网赞同其观点或证实其内容的真实性。

2.本网站的所有信息仅供参考,不构成任何形式的建议或指导。用户应自行承担使用本网站信息的风险。

3.该文章主要来源于互联网,如发现本网站上的文章涉及侵权问题时,建议您立即联系本网站的站长或管理员进行删除处理。

相关推荐

银行信用卡业务,全线萎缩

Sep 29, 2024

零售金融「熄火」:「抢滩」23万亿私人银行

Sep 29, 2024

“缺电”的巴基斯坦,正挤满了中国光伏产品

Sep 29, 2024

绝味遭股民批量索赔,半年闭店近千家

Sep 29, 2024

别在小红书上欺负老男人了,好吗?

Sep 29, 2024

借着AI的光,它也红了

Sep 29, 2024

教培「拯救」城市商业综合体

Sep 29, 2024

美团745万骑手大军狂飙

Sep 29, 2024

iPhone16散热真升级了?实测进步明显,但远不如小米14

Sep 29, 2024