视频生成模型大幅降价,百度为何如此激进?

作者:知识 来源:综合 浏览: 【 】 发布时间:2025-08-24 00:47:59 评论数:

图片来源:界面新闻

界面新闻记者 | 肖芳

界面新闻编辑 | 文姝琪

百度旗下的视频生成视频生成模型蒸汽机完成了一次大幅度升级,这距离该模型上线仅仅有50天。模型

在模型能力上,大幅蒸汽机模型最大的降价进变化是实现了多人有声音视频一体化生成,模型生成的百度视频不需要再进行后期配音,人物的为何声音和表情、动作以及嘴型实现同步,此激即使在复杂场景下也能够保持稳定。视频生成同时,模型生成视频的大幅画面清晰度和流畅度也有了明显提升,运镜方式更为丰富。降价进

更重要的百度是,百度大幅降低了蒸汽机模型的为何使用价格。根据百度商业体系商业研发总经理刘林在发布会现场的此激介绍,蒸汽机模型Turbo版生成一段5秒720p的视频生成一体化有声视频,需要的价格是1.4元。而据界面新闻了解,行业中视频生成模型生成一段5秒720p的无声视频普遍的价格大概为2元。这意味着,百度把视频生成模型的价格降到了行业价格70%的水平。

相比于百度旗下的文心系列大模型,百度蒸汽机模型的更新迭代速度更快,在价格降幅上也要高于行业平均水平,呈现出更为激进的态势。在接受界面新闻等媒体采访时,百度副总裁、移动生态商业体系负责人陈一凡透露,蒸汽机模型1.0版本就是需求驱动的,到2.0版本是在需求驱动的基础上叠加了技术的优化,才达到了当前的情况。

和文心系列大模型不同,百度蒸汽机模型并不是由负责基础技术的TPG研发,而是由MEG(移动生态事业群)旗下的移动生态商业体系研发,主要服务于广告主和代理商制作视频营销素材的需求。

陈一凡向界面新闻透露,蒸汽机模型1.0版本在研发上更注重算法、策略,而2.0版本更加注重大模型工程方面的优化,所以能够在短短50天内把技术能力提升并且把成本降下来。“百度商业体系早在2016年就开始使用对GPU做搜、广、推,对GPU的架构是非常熟悉的,团队非常熟悉如何通过调整训练集、算子等方式降低训练成本。”

由于蒸汽机模型从立项开始就拥有明确的服务对象,其在上线一个月的时间内也收集到了诸多客户反馈。陈一凡表示,广告客户反馈的需求一方面集中在模型能力上,大多数广告客户对生成视频的运镜、画质、一致性、音画一体化都有更高的要求,此次模型升级着重改进了这些方面的能力;另一个方面是价格,虽然蒸汽机模型在上线后并未向广告客户收费,但很多客户对比市场价后认为价格偏高,研发团队对训练成本进行了优化。

图片来源:百度绘想

在发布会现场,好莱坞视效指导姚骐演示了其团队使用蒸汽机模型制作的短片《归途》,该短片通过大模型生成了40多个镜头、120段素材片段,包括20个10秒一体化有声片段和100个5秒有声片段,仅用一周时间制作而成。按照蒸汽机模型的最新模型定价计算,其花费的成本为330.6元。

陈一凡对界面新闻表示,如果客户使用常规手段拍摄一个宣传片,成本大概需要20万左右,最后做出来的片子还不一定能最终使用,但现在他们可以先花费几百元把自己想要的内容用AIGC的方式制作出来,这对营销成本的降低是十分显著的。

目前,视频生成模型在营销素材生成等领域的商业价值正在被逐步验证。快手在8月21日发布的财报显示,其视频生成模型可灵AI在今年第二季度的营收达到了2.5亿元,营收能力较几个月前已提升了数倍。根据快手方面预测,可灵AI今年全年的营收比今年年初定下的目标翻一倍。返回搜狐,查看更多