OpenAI发布GPT-4o：可免费开放使用，语音对话媲美真人

ptmanager 2024-5-15 18:05

OpenAI发布了最新升级的大型语言模型GPT-4o。GPT-4o的“o”代表“omni”，意为“全能”。它可以实时对音频、视觉和文本进行推理，能处理超过50种不同的语言，并且速度和质量大大提升。

GPT-4o的最大亮点是其语音对话能力。此前GPT-3.5语音对话的平均延迟为2.8秒、GPT-4为5.4秒，而GPT-4o可以在232毫秒内对音频输入做出反应，甚至还能随意打断，与人类在对话中的反应时间相近。

此外，GPT-4o还可以接受文本、音频和图像三者组合作为输入，并生成文本、音频和图像的任意组合输出，人机交互更加自然、全面了。

OpenAI表示，GPT-4o将会在未来几周内陆续开放。其中，免费用户可以使用GPT-4o的基本功能，但会限制数量。

GPT-4o主要特点：

* 实时对音频、视觉和文本进行推理

* 能处理超过50种不同的语言

* 语音对话媲美真人

* 可接受文本、音频和图像三者组合作为输入

* 并生成文本、音频和图像的任意组合输出

GPT-4o的发布标志着人工智能技术又取得了重大突破。它将为我们带来更加自然、高效的人机交互体验。未来，GPT-4o还将会有更多令人期待的应用。让我们拭目以待！

GPT-4o , OpenAI , 语音对话

本文转载目的在于传递更多信息，并不代表本网赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题，请在30日内与本网联系，我们将在第一时间删除内容！ [声明] 本站文章版权归原作者所有，内容为作者个人观点，本站只提供参考并不构成任何投资及应用建议。

苹果iOS 17.5正式版发布：彩虹光辉墙纸、欧盟侧载正式上线 华为下半年全面转向HarmonyOS，Mate 70系列将首发！

最新评论