5月14日凌晨,美国人工智能研究公司OpenAI在线上举办了“春季更新”活动,整体来看,活动主要分为两大部分:推出新旗舰模型“GPT-4o”,以及在ChatGPT中免费提供更多功能。OpenAI最新旗舰大模型GPT-4o,不仅免费可用,能力更是横跨听、看、说,丝滑流畅毫无延迟,就像在打一个视频电话。
现场,OpenAI的首席技术官Mira Murati宣布推出桌面版ChatGPT,并推出名为GPT-4o的全新旗舰人工智能模型。GPT-4o中的“o”代表的是“omni”,有包罗万象、全知全能的意思——象征着这款模型的全面性和多元性。从OpenAI的现场演示视频中,我们在情感上已经很难再将GPT-4o当作是一个机器。它反应敏捷、能说会道、善于分析,还能察言观色,甚至是表达自我。
Mira Murati指出,过去的GPT-4可以处理由图像和文本混合而成的信息,并能完成诸如从图像中提取文字或描述图像内容等任务。而GPT-4o的核心变化就是在GPT-4的基础上,新增了语音处理能力。并且,GPT-4o还可接受文本、音频和图像的任意组合作为输入,并生成文本、音频和图像的任意组合输出。更让人惊喜的是,GPT-4o的响应速度非常快。它可以在短短 232 毫秒内响应音频输入,平均为 320 毫秒,这与对话中的人类响应时间相似。与GPT-4 Turbo相比,它在非英语文本上的处理能力有了大幅度提升,同时,API的运行成本也降低了50%。与现有模型相比,GPT-4o 在视觉和音频理解方面尤其出色,在情感识别和表达上,新版ChatGPT有了更强的能力。它不仅能准确理解用户的情感,而且能根据用户的情感状态进行适当的回应,这将使得聊天体验更加丰富和真实。如果说过去的GPT还是一个助手,那么拥有了“眼睛”和“嘴巴”后的GPT已经在向朋友靠近了。
除了推出新模型,在产品上OpenAI也做出了诸多更新。一个是最先进的新模型GPT-4o不再由付费用户独享。发布会上,Mira Murati 宣布 ChatGPT-4o 将免费向所有用户开放,而付费和企业用户,可以抢先获得体验。另外,OpenAI还推出了新版的GPT桌面应用,让用户可以直接在电脑桌面上使用ChatGPT,并且Mac Plus用户将优先体验到这一功能。