ChatGPT母公司OpenAI将于美国时间周一举办新品发布会,以抢在竞争对手Google一系列产品发布之前,至于要发表什么新品,CEO阿特曼则语带保留,并在社交平台X上明确否认市场上猜测的GPT-5或AI搜索引擎。
奥特曼希望最终开发出一种类似电影《她》中的 AI 助手,并以这种技术支持苹果 Siri 等现有语音助手。
《彭博资讯》日前引述知情人士报导指出,苹果跟OpenAI接近达成协议,将在iOS 18中使用后者的技术,强化Siri的功能,双方预计会在6月敲定协议,将ChatGPT技术引入下一代操作系统iOS 18.
去年年初,苹果高管Craig Federighi和负责AI业务的副总裁John Giannandrea去年花数周时间测试ChatGPT后认为,相较于生成式人AI,Siri已经过时了。 在测试过ChatGPT后,苹果就进行十多年来规模最大的重组,将资源集中于AI方向,并在今年初取消苹果汽车项目后,大部分工程师都转入AI团队,苹果用于迭代Siri的研发经费据悉高达每天数百万美元。
苹果高层认为,ChatGPT等聊天机器人背后的大语言模型可增强Siri的能力。
苹果CEO库克曾承诺,今年将发布一项重大AI产品,苹果自去年初起一直在测试自有代号为Ajax的 LLM,一些苹果员工还在尝试一款名为「苹果 GPT」的基础聊天机器人,但知情人士透露,苹果技术仍不如 Google 和其他竞争对手的技术,这使得合作看起来是更好的选择。
根据苹果内部人士爆料,苹果升级Siri的目的不是让它跟ChatGPT竞争诗歌创作等内容生成的部分,而是让Siri专注于处理原有的任务,包括设定闹钟、建立日历备忘提醒、新增购物清单中的物品,以及总结短信内容。
若全球共22亿台苹果iOS设备都加入ChatGPT,OpenAI运算能力恐无法应付,这也意味着OpenAI被迫继续买入数十万个英伟达GPU去支持22亿人使用ChatGPT,英伟达业绩也有望持续冲高。
OpenAI 已经有了可转录音频和将文本转换成语音的软件,但这些功能是通过单独的 AI 聊天机器人实现,新产品则将这些功能整合在一起,且能更加理解图像和音频,响应速度也更快。 OpenAI 认为,具视觉和听觉功能的助手有可能像智能手机一样带来变革,可以观察用户所处的环境信息提供建议,可能使用的例子如担任家教、翻译标志、修理汽车等等。
媒体分析指出,OpenAI新模型的运作依赖云端,需要网络连接才能工作,要使具有视觉和听觉功能的复杂 AI 对话小巧到能在手机等个人设备上运作,恐需时数月甚至好几年。 目前虽不知何时会向付费用户提供这些功能,但根据《The Information》引述匿名消息人士报导,OpenAI已经向一些客户展示一种新的多模态 AI 模型,既能与人对话,又能辨识物体,这可能是 OpenAI 打算在周一展示的一部分内容。
一位知情人士,新软件的音频功能可帮助客服人员更好地理解来电者的语音语调。
与此同时,Google 则将在周二下午一点召开的 I/O 大会上公布模型新进展,据传将发布一个名为「Pixie」、由 Gemini 加持的个人数字助理。
市场猜测,Google 也将发布Gemini 的新版本以及推出图像和视频大模型,根据Reddit网友爆料,Google 存货中有3个模型已经在测试但还未向公众发布,这些模型有望在周二亮相。 这三个模型分别是图像生成模型Imagen 3.以及两个可以让图像进行优化、补强功能的模型Juno和Miro,Miro据说还有影片生成功能。