Google DeepMind首席执行官Demis Hassabis传出坦承,追上OpenAI的文字转影像AI生成工具「Sora」有相当的难度。
Business Insider 9日引述The Information报道,Hassabis最近告诉一名同事,Google想跟Sora打成平手恐怕有难度。
Google也有自己的文字转影像AI生成模型「Lumiere」,1月曾透过一份研究报告公布。 Lumiere可根据文字提示生成5秒钟的影片。
不过,Google 在上述研究报告指出,打造能侦测「偏差及恶意用法」的安全工具至关重要,因为Lumiere 有「遭到误用、生成假造或伤害性内容的风险」。
Google母公司Alphabet Inc.甫于2月22日因一系列争议撤下AI模型「Gemini」的影像生成工具。 用户发现了一些历史错误及可疑回应,举例来说,一名用户要求Gemini提供1943年德国士兵的影像,但生成的图却出现不同族裔的士兵,穿着德国当时的军服。
Sora再过几月释出、传以YouTube影片非法训练
华尔街日报3月13日报导,OpenAI科技长Mira Murati受访时表示,Sora今年稍晚肯定可对外释出,大概再花几个月就能准备就绪。 Murati并透露,OpenAI利用公开及授权的数据训练Sora,其中经过授权的数据来源包括Shutterstock。
不过,Murati当时坦承,她不确定Sora是否曾以YouTube影片进行训练。
纽约时报4月初爆料,未具名消息人士透露,OpenAI曾使用YouTube影片来协助改善语言识别工具「Whisper」。 据报导,OpenAI将超过100万小时的YouTube视频转录为文字,将之喂给AI模型「GPT-4」。
纽时并指出,Google也利用YouTube转录影片来训练自家AI模型。 这么做可能侵害内容创作者的著作权。