OpenAI 又要放大招了-IT商业科技网

　　5月11日消息，今天凌晨，OpenAI宣布将于美国时间13日上午10点(北京时间14日凌晨1点)在官网直播，演示ChatGPT、GPT-4的更新内容。

　　据外媒The Information今日报道，OpenAI正在构建具备音频和视觉理解能力的AI语音助手，其中一些功能已经开始向客户展示，可能在下周的发布活动中预览。

　　知情人士消息透露，OpenAI可能会在今年内完成GPT-5的开发并公开发布。此外，OpenAI还计划推出一种新的定价模式，客户通过预付费预定Token，最高可以享受50%的折扣。

　　此前有多家外媒和博主曝料，称OpenAI将在近日发布AI搜索引擎。其CEO阿尔特曼对此回应道：“不是GPT-5.也不是搜索引擎，但我们一直在努力开发一些我们认为会得到喜欢的新东西。”

▲阿尔特曼回应新品演示(图源：X)

　　值得注意的是，其竞争对手谷歌的I/O开发者大会时间定在美国时间14日上午10点(北京时间15日凌晨1点)，预计可能发布Gemini大模型的重要更新。OpenAI此次发布时间没有定在之前外媒曝料的5月9日，而是“恰好”卡在I/O大会的前一天，火药味可谓浓厚。

　　要知道，这已经不是OpenAI第一次“卡点”狙击谷歌新品。今年2月，谷歌放出Gemini 1.5 Pro大招，结果没过几个小时，OpenAI就掏出文生视频“王炸”模型Sora，狠狠抢了Gemini 1.5 Pro的风头。

　　直播发布地址：http://openai.com

　　01.

　　AI语音助手仍存在“幻觉”问题

　　或将集成至ChatGPT免费版

　　据The Information报道，阿尔特曼的终极目标是开发出类似电影《她》(Her)中，可高度响应的虚拟助手，提升苹果Siri等现有语音助手的可用程度。

▲电影《她》剧照

　　OpenAI认为，具有视觉和音频功能的AI语音助手具有像智能手机一样的变革性潜力，理论上其可以做到一系列现在的AI助手无法做到的事，例如充当论文、数学问题指导老师，或是翻译交通标识、帮助解决汽车故障等。

　　但类似的技术目前所需硬件门槛太高，无法在个人设备上运行，用户可以在短期内使用基于云的版本来获取这些功能，例如自动化客户服务Agent。

　　OpenAI目前已经推出具备音频转录、文本转语音等功能的软件，不过这些功能是基于独立的对话AI模型实现，而新的语音助手则将这些功能整合在一起。据知情人士透露，该AI语音助手的音频功能能够帮助客服人员更好地理解对方的语气。

　　目前尚不清楚OpenAI何时向付费客户提供这些新功能，但据试用过该语音助手的人士透露，OpenAI最终的计划是将这些功能都纳入ChatGPT免费版本，目标是比目前其最先进模型GPT-4 Turbo的运行成本更低。该人士还谈道，AI语音助手在有些类型的问题上回答优于GPT-4 Turbo，但仍然存在幻觉问题。

　　对此，OpenAI发言人没有回应置评请求。

　　02.

　　与谷歌竞争iPhone合作位

　　GPT-5或于年底前发布

　　OpenAI推出AI语音助手主要目标是与谷歌竞争。

　　谷歌的AI模型Gemini能实时响应语音命令，并识别图像、视频等。不过这些功能目前仍需要研究人员附以图像和文字说明，且并不能理解许多传统的语音指令，也不能像Siri和谷歌助手等传统语音助手那样与用户对话。

▲谷歌展示Gemini多模态功能(图源：谷歌)

　　另一方面，提高模型的视觉、音频能力也有助于OpenAI与苹果达成合作。

　　最近几个月，苹果与OpenAI就下一代iPhone操作系统如何整合OpenAI的模型进行了讨论。然而，与此同时，苹果也与谷歌进行着类似的谈判。

　　这场竞争的最新消息是，据彭博社今早报道，苹果已接近与OpenAI达成协议，将在下一代iPhone操作系统iOS 18中使用ChatGPT;与谷歌尚未达成协议，但谈判仍在进行中。

　　除了可能在下周推出的AI语音助手外，OpenAI还一直致力于构建一款AI搜索引擎，旨在与谷歌竞争。此外，其也在开发一种被称作“计算机使用Agent”的自动化软件，用来辅助软件开发和其他计算机任务。

　　阿尔特曼还在与iPhone开发者乔尼·艾维(Jony Ive)合作开发一款独立的AI硬件。然而，最先进的AI模型体积庞大，需要在云端运行，并需要互联网连接才能工作。要使具有视觉和听觉功能的复杂AI模型变得足够小巧，以便在设备上运行，可能需要几个月甚至几年的时间。

　　不过，大家最关心的可能还是GPT-5.据The Information报道，一位接近OpenAI领导人的人士称，其可能在今年年底完成GPT-5并公开发布。

　　OpenAI的新产品和AI模型开发工作进展得如火如荼，与此同时，其此前宣布的一些项目却变得不再那么受关注。尽管OpenAI曾向开发者承诺，会在今年第一季度推出GPT Store开发者激励计划，但目前仍没有实现。

　　03.

　　计划推出预付费定价模式

　　最高提供50%折扣

　　在定价方面，据知情人士透露，OpenAI计划推出一种新的定价模式，如果客户通过预付费预定Token，最高可以享受50%的折扣。

　　这样的优惠形式在云计算领域比较常见，微软Azure、谷歌云、亚马逊云服务(AWS)等都提供提前预定服务器容量折扣的方式来降低成本。

　　目前，按需定价提供API(应用程序接口)是OpenAI大模型的主要付费形式，通过每生成100万Tokens，向开发者收取几美分至一百多美分不等的费用，其中大客户可以享受批量折扣。

　　此前OpenAI已经提供了一种降低开发者成本的方式，其在4月推出Batch API，如果开发者批量上传模型查询，并接受等待最长24小时的时间，就可以获取更低的价格。

　　Together AI和Anyscale等AI服务器经销商曾表示，在他们的软件上运行开源模型要比使用OpenAI的模型便宜6倍。通过更灵活的定价，OpenAI与其他模型开发商的竞争将更具优势。据透露，其今年的营收可能达到数十亿美元。

　　04.

　　结语：OpenAI谷歌相争

　　苹果微软得利？

　　OpenAI与谷歌之间的竞争愈发激烈，二者之间的“商战”火药味也愈发浓厚。OpenAI又一次将新品发布时间定在了谷歌重大发布时间附近，似乎执着于抢夺谷歌风头这件事。

　　这一边，苹果同时与OpenAI、谷歌商谈模型集成至iPhone事宜，再次加剧了两家公司之间的竞争。虽然OpenAI被曝已与苹果达成合作，但谷歌那边的谈判也仍在继续。

　　而另一边，微软作为OpenAI最大的财务支持者，可以优先使用其先进技术来改进自己的语音助手。而微软也并非“孤注一掷”，除了积极自研模型外，还投资了OpenAI有力竞对Mistral AI，后者成为第二家在微软Azure云平台上提供商业AI模型的公司。

　　下周的OpenAI新品发布和谷歌I/O大会，或许会将这场“商战”推向新高度。究竟谁的“大招”会更厉害，我们拭目以待。

${dede:global.cfg_webname/}$

当前位置：首页 > 科技 > 科技快讯 > 正文

OpenAI 又要放大招了

2024年信任互联大会顺利召开推动商用密码高质量发展正当时

2024-05-11

用友大易入选甲子光年《2024年AI Agent行业报告》

2024-05-11

百战直播2023营收增长超100% 生态规模增长超60%

2024-05-11

福建加速鸿蒙化步伐：超百款应用引领数字化新潮流

2024-05-11

2024大型企业数智化峰会·大湾区峰会成功举办！

2024-05-11

OPPO也开卷大电池迭代新机最高5800mAh 方向对了！

2024-05-11

华为多款新机官宣：5月15日正式发布

2024-05-11

当前位置： 首页 > 科技 > 科技快讯 > 正文

OpenAI 又要放大招了

2024年信任互联大会顺利召开 推动商用密码高质量发展正当时

2024-05-11

用友大易入选甲子光年《2024年AI Agent行业报告》

2024-05-11

百战直播2023营收增长超100% 生态规模增长超60%

2024-05-11

福建加速鸿蒙化步伐：超百款应用引领数字化新潮流

2024-05-11

2024大型企业数智化峰会·大湾区峰会成功举办！

2024-05-11

OPPO也开卷大电池 迭代新机最高5800mAh 方向对了！

2024-05-11

华为多款新机官宣：5月15日 正式发布

2024-05-11

当前位置：首页 > 科技 > 科技快讯 > 正文

2024年信任互联大会顺利召开推动商用密码高质量发展正当时

OPPO也开卷大电池迭代新机最高5800mAh 方向对了！

华为多款新机官宣：5月15日正式发布