Meta周五公布新视频AI模型Movie Gen,可生成最长16秒的逼真电影,并配有音效和背景音乐,有意挑战OpenAI的Sora。
Movie Gen 并非首个能从简单文本提示生成视频和音频的多模态 AI 模型,但 Meta 宣称表现优于竞争对手系统。 Meta 表示,该模型在人工测试中表现出色。
该模型可根据简单文本提示生成全新电影,或修改现有图片和视频,替换或修改对象和背景。 尽管好莱坞电影传统上以24FPS拍摄,但Meta的16FPS也接近专业电影质量。
Movie Gen亮点之一是其生成最长 45 秒音频的能力,包括音效和背景音乐,并与生成影片中的动作同步。
然而,Meta也表示,Movie Gen的基础模型目前仅用于研究,尚未公布产品发布的时间表,并需进一步安全测试。