继一年多前发布ChatGPT在全球引发AI(人工智能)狂飙之后,全球AI领军企业OpenAI又向业界扔下了一枚新“*炸”——AI文生视频模型Sora,这距离谷歌发布多模态模型Gemini1.5仅过去了几个小时。
继一年多前发布ChatGPT在全球引发AI(人工智能)狂飙之后,全球AI领军企业OpenAI又向业界扔下了一枚新“*炸”——AI文生视频模型Sora,这距离谷歌发布多模态模型Gemini1.5仅过去了几个小时。
在Gemini1.5的演示中,机器可以“读懂”人类的各种举动:当测试员拿出一张纸,Gemini1.5立刻回答“你拿出了一张纸”;而Sora可根据简短的文字提示生成一段长达一分钟的高清视频,其中包含细腻复杂的场景、生动的角色表情以及复杂的镜头运动。上海人工智能研究院**分析师方帅表示:“两个较新发布的AI模型表明,机器在理解人类语言和文字上更近了一步。”
OpenAI在关于Sora的详细技术报告中表示,Sora对自然语言的理解能力很强。OpenAI将其视为能够理解和模拟现实世界的模型的基础,相信其能力是实现AGI(通用人工智能)的重要里程碑。
AI“文生视频”如何改变未来?正如业界专家所说,Sora的影响往小了说是文生视频技术突破了一个数量级,可直接应用于短视频、广告等行业;往大了说,它提供了理解、重建和模拟这个世界的可能性。