解码Sora：“世界模型”看出更多端倪

来源: 发布时间: 2024-02-26 310 次浏览

继一年多前发布ChatGPT在全球引发AI（人工智能）狂飙之后，全球AI领军企业OpenAI又向业界扔下了一枚新“*炸”——AI文生视频模型Sora，这距离谷歌发布多模态模型Gemini1.5仅过去了几个小时。

在Gemini1.5的演示中，机器可以“读懂”人类的各种举动：当测试员拿出一张纸，Gemini1.5立刻回答“你拿出了一张纸”；而Sora可根据简短的文字提示生成一段长达一分钟的高清视频，其中包含细腻复杂的场景、生动的角色表情以及复杂的镜头运动。上海人工智能研究院**分析师方帅表示：“两个较新发布的AI模型表明，机器在理解人类语言和文字上更近了一步。”

OpenAI在关于Sora的详细技术报告中表示，Sora对自然语言的理解能力很强。OpenAI将其视为能够理解和模拟现实世界的模型的基础，相信其能力是实现AGI（通用人工智能）的重要里程碑。

AI“文生视频”如何改变未来？正如业界专家所说，Sora的影响往小了说是文生视频技术突破了一个数量级，可直接应用于短视频、广告等行业；往大了说，它提供了理解、重建和模拟这个世界的可能性。

上一篇：人工智能时代，我们该......

下一篇：同心共聚力，携手征新......