blog details

2024年8月1日

17

267

GPT-4o语音功能终于如期而至,科幻版Her走进现实

在7月底,GPT-4o语音模式终于开启了灰度测试,一部分ChatGPT Plus用户已经抢先体验了这一革新功能。ChatGPT开发团队表示,高级语音模式提供了更加自然、实时的对话体验,用户可以随意打断互动,甚至AI还能感知和回应用户的情绪。预计在今年秋季,所有ChatGPT Plus用户将能够使用这一高级功能。此外,更为强大的视频和屏幕共享功能也即将推出。用户将可以开启摄像头,与ChatGPT「面对面」交流,大幅提升了AI企业解决方案的实用性。

根据早期测试反馈,ChatGPT高级语音模式表现尤为出色,几乎没有回答延迟。用户可以让AI模仿各种声音,甚至是不同口音,精准复刻效果令人印象深刻。这为教育行业AI解决方案和税务AI咨询等应用场景提供了高级技术支持。

语音模式的优秀表现与功能测试

OpenAI团队对GPT-4o语音功能进行了几个月的严格安全性和质量测试,以确保用户隐私保护到位。团队在训练模型时仅使用了4种「预设声音」,并建立系统阻止除这4种声音之外的其他声音输出。此外,内容过滤系统也得到了强化,以阻止生成暴力和版权内容。OpenAI计划在8月初发布一份详细报告,介绍GPT-4o的能力、局限性和安全评估。这一报告将有助于AI系统开发和企业AI开发等领域的进一步研究和应用。

赶在7月结束前,GPT-4o语音模式终于开启了灰度测试,一小部分ChatGPT Plus用户已经拿到了尝鲜入场券。

“新智元”

高标准的安全性与隐私保护

GPT-4o语音功能的推出不仅提升了个人用户体验,也为企业带来了广阔的应用前景。在杭州AI定制开发和浙江AI解决方案这些区域市场中,GPT-4o将帮助更多企业优化其AI应用,提升用户满意度。

GPT-4o语音功能的上线标志着从生产力提升到生活方式变革的又一次跃迁。无论是个人用户还是企业用户,都将受益于这一AI定制化开发的新技术。

如有侵权,请联系删除。

Related Articles