ind推出技能,让A更传神力提示I视频生成
谷歌DeepMind与布朗大学合作开发的“力提示”(force prompting)技能,为视频生成范畴带来打破。该技能无需3D模型或物理引擎,仅经过指定力的方向和强度,即可生
...
谷歌DeepMind与布朗大学合作开发的力提示“力提示”(force prompting)技能,为视频生成范畴带来打破 。推出该技能无需3D模型或物理引擎,频生仅经过指定力的成更传神方向和强度 ,即可生成天然流通的力提示运动作用 。支撑大局力(如风)和部分力(如敲击)两种方式 ,推出力以矢量场方式输入体系 。频生
研讨根据CogVideoX-5B-I2V模型,成更传神参加ControlNet模块处理数据 ,力提示使用Transformer架构生成49帧视频 ,推出仅需4台Nvidia A100 GPU练习一天 。频生练习数据彻底组成,成更传神包含旗号飘动、力提示球体翻滚等场景。推出模型在文本提示中参加物理术语后,频生能主动树立正确的力与运动联系 ,并展现出强壮的泛化才能 。
用户测验显现,“力提示”技能在运动匹配度和真实感上优于基准模型,虽然在杂乱场景中仍存缺乏,但其前进标志着AI正逐渐了解物理规矩,迈向更通用的人工智能。DeepMind首席执行官Demis Hassabis以为,这是AI开展的重要一步。
本文转载:戚而 https://5if.dezhouruihuan.com/news/82d399914.html
特别声明:本文仅供交流学习 , 版权归属原作者,部分文章推送时未能及时与原作者取得联系,并不代表本站赞同其观点和对其真实性负责,也不构成任何其他建议。若本文来源标注错误或无意侵犯到您的知识产权作品或损害了您的利益,我们会及时修改或删除。
相关文章
文章评论
来说两句吧...共有874条评论
- 站长推荐
- 点击排行
站长推荐