新华网：多模态大模型是必经之路通用人工智能进程加快

新华网：多模态大模型是必经之路通用人工智能进程加快近期，OpenAI发布视频生成模型Sora，引发人们对文生视频AI大模型的关注。Sora在视频生成方面的进展进一步打开了AI应用想象空间。AI视频是被看好的AI应用落地的重要场景之一，文生视频并不是一个新概念，国内市场早已存在不少公开的AI视频模型。有券商预测，国内大模型厂商将加快步伐，加大对文成视频大模型的投入力度。IDC中国研究总监卢言霞认为，要全面打开生成式AI的想象力，就要依托多模态大模型，国内很多公司早就已经在投入多模态大模型的研发，这是AI的必经之路。今天，Sora让文生视频迈出新的一步，将刺激其他科技巨头加快在该领域的技术攻关力度以及产品发布速度。在许多业内人士看来，Sora大幅缩短了通用人工智能（AGI）的实现时间，但文生视频本身只是AGI发展道路上的一小步。

在Telegram中查看

相关推荐

云从科技：从容大模型支持通过文本和音频生成图像和视频

云从科技：从容大模型支持通过文本和音频生成图像和视频OpenAI的视频生成模型Sora引发关注，云从科技相关负责人表示，云从科技在视觉方面积累较为深厚，目前，从容大模型已实现利用diffusion、GAN等生成式技术围绕人物图像、人物视频数据进行建模，通过文本和音频实现对图像和视频内容进行生成、控制、编辑。应用上，云从科技与天津港、华为等共同开发港口大模型PortGPT，核心是AI智能体天天，通过AI生成交互画面，协同数据分析，提高港口运转效率及安全性。此外，还在文生图像、视频等跨模态领域积极布局，包括发布数字人能力平台，生成AI视频；与中国电信合作AI营销海报生成等。（科创板日报）

国产文生视频大模型 “筑梦” 亮相：在生成能力、时长、质量上与 Sora 还存在差距

国产文生视频大模型“筑梦”亮相：在视频生成能力、时长、质量上与Sora还存在差距在日前举行的中国首部AI动画片《千秋诗颂》启播暨中央广播电视总台人工智能工作室揭牌仪式上，上海人工智能实验室研发的文生视频大模型“书生・筑梦”亮相。这个AI模型已经开源，授权用户单位免费商用。它的参数量超过30亿，可根据输入的提示词生成有故事性、含多镜头的分钟级视频，具有转场流畅、故事连贯、画质高清等特点。上海人工智能实验室领军科学家林达华说，“由于数据、算力等资源限制，‘筑梦’在视频生成能力、时长、质量上与Sora还存在差距。”（解放日报）

中信证券：OpenAI 推出视频生成模型 Sora，AI 产业围绕多模态不断加码

中信证券：OpenAI推出视频生成模型Sora，AI产业围绕多模态不断加码中信证券研报指出，近一周内，OpenAI和谷歌分别推出了他们的最新AI模型，围绕视频多模态这个核心关键点双方不断加码。Gemini1.5Pro基于大语言模型处理视频模态，上下文长度超过百万，Sora在技术上采用了DiffusionTransformer的路线，OpenAI表示Sora在训练过程中表现出了与其他模型不同的涌现能力，有望成为真正的“世界模型”。从投资角度来看，Sora背后的涌现能力为自动驾驶、设计等需要现实世界建模的行业提供了明确方向。Gemini在短期内的部分商业场景表现可能会更为出色，尤其是需要结合图片与文字的多模态应用场景。除去应用端的投资机会，硬件端的需求也必然会随着多模态的技术进步而不断提高，我们仍然持续看好AI算力，尤其是后续商业端成熟而带来的更多AI推理侧算力的机会。

腾讯混元文生图模型开源采用Sora同架构

腾讯混元文生图模型开源采用Sora同架构5月14日，腾讯宣布旗下混元文生图模型升级并开源，参数量15亿，目前已在平台及上发布，包含模型权重、推理代码、模型算法等完整模型，企业与个人开发者可免费商用。该模型支持文生图功能且可作为视频等多模态视觉生成的基础。随着腾讯混元文生图大模型入局，采用DiT架构的大模型玩家再增一名。OpenAI的视频生成模型Sora也采用DiT架构。腾讯方面介绍，混元文生图大模型是业内首个中文原生的DiT架构文生图模型，综合指标在文生图算法中排名第三。——

中信证券：文生视频 Sora 等模型发布有望继续推动算力与网络需求升级

中信证券：文生视频Sora等模型发布有望继续推动算力与网络需求升级中信证券研报表示，2024年2月16日凌晨，OpenAI发布文生视频多模态模型Sora，其生成视频demo表现效果十分惊艳，引发广泛关注。中信证券认为若Sora成为视频创作领域的超级应用，将带来巨大的网络设备升级需求。同时谷歌最新多模态大模型Gemini1.5以及英伟达本地聊天机器人ChatwithRTX也在近期陆续发布。AI发展趋势已经愈发明确，AI产业成熟的商业模式与“收入—资本开支”的良性循环亦在逐步形成。这有望缓解市场对于光模块等算力设备投资持续性的担忧，从而打开龙头厂商估值空间。

生数科技发布视频大模型可生成 16 秒

生数科技发布视频大模型可生成16秒视频Sora发布两个月后，国内多模态模型公司生数科技首次公布文生视频模型进展。4月27日，清华大学人工智能研究院副院长、生数科技首席科学家朱军在2024年2024年中关村论坛上发布首个文生视频模型Vidu。生数科技称，该模型全面对标Sora，能够生成最长为16秒的视频，分辨率1080P。不过生数科技还未开放Vidu的试用，目前已经开放合作伙伴计划，可以填写在线表单申请加入。

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人