多模态大模型是必经之路通用人工智能进程加快-科极网

近期，OpenAI发布视频生成模型Sora，引发人们对文生视频AI大模型的关注。

Sora在视频生成方面的进展进一步打开了AI应用想象空间。AI视频是被看好的AI应用落地的重要场景之一，文生视频并不是一个新概念，国内市场早已存在不少公开的AI视频模型。有券商预测，国内大模型厂商将加快步伐，加大对文成视频大模型的投入力度。

“因为路径比较清晰了，国内乃至全世界跟进都很正常。”天工智能联席CEO兼昆仑万维2050全球研究院院长颜水成表示，“原来预测年底才会有长视频生成，现在提前了10个月。多模态是终局，有可能视频生成会融合在多模态统一大模型里面。”

据了解，Sora的核心技术是DiT的扩散变压器模型，OpenAI把这一技术用到了视频生成的扩散模型。“Sora的发布再一次证明了变压器技术作为一项人工智能的基础技术，在多模态大模型包括视频技术中也同样重要。”上海人工智能专家委员会委员、达闼机器人公司创始人兼CEO黄晓庆说。

IDC中国研究总监卢言霞认为，要全面打开生成式AI的想象力，就要依托多模态大模型，国内很多公司早就已经在投入多模态大模型的研发，这是AI的必经之路。今天，Sora让文生视频迈出新的一步，将刺激其他科技巨头加快在该领域的技术攻关力度以及产品发布速度。

在许多业内人士看来，Sora大幅缩短了通用人工智能的实现时间，但文生视频本身只是AGI发展道路上的一小步。

“中国人工智能产业的专家们，应该非常振奋，我们和国外的差距其实并没有那么大，我们能很快赶上。”黄晓庆说，Sora给产业界带来一个重要启示，那就是人工智能AGI时代已经来临，我们都要拥抱这个时代，它的应用场景非常丰富，我们可以发挥无穷无尽的想象力。

商汤科技智能产业研究院院长田丰认为，国外依靠ScallingLaw缩放定律不断投入AI算力、海量数据来取得更好的模型效果的方式并不完全适用于中国AI科研。在按照“摩尔定律”加速推进国产芯片的基础上，我们需要摸索出适合自己的AGI科技创新路径，比如开发更具性价比的AI芯片、更节能的智能计算中心、AI模型加速技术，加快多模态模型架构创新和数据合成、多媒体数据标注技术创新，在百科知识基础上，大幅强化逻辑推理、基础科研、工农业垂类模型，通过产业价值反哺AI发展。

颜水成认为，中文数据是中国发展人工智能的重要优势。未来国内要加快AI人才和算力资源的集中度，这样才能更有利于AGI的创新。

声明：本网转发此文章，旨在为读者提供更多信息资讯，所涉内容不构成投资、消费建议。文章事实如有疑问，请与有关方核实，文章观点非本网观点，仅供读者参考。