 文|乐乐。入驻 今日,视频手机无线蓝牙耳机(TWS)现已成为人人都用得起的多模的新产品。
。态成 但退回到9年前,智能终端战场苹果AirPods是入驻全球榜首款实在意义上的无线蓝牙耳机
。靠着自研并申请专利的视频手机Snoop监听技能,苹果处理了蓝牙耳机左右延时和能耗纷歧的多模的新问题。由此 ,态成AirPods吃下了2016-2018年的智能终端战场大部分商场 ,直到两年后其它厂商才学会相似技能。入驻 靠技能盈利取胜,视频手机是多模的新苹果的经典操作
,也是态成今日的手机厂商们在苹果身上学到的重要一课 。 关于近两年的智能终端战场手机商场来说
,AI无疑便是搅动手机商场的关键技能变量
。 为了找到AI技能落地的杀手级功用 ,从Agent
、AI修图到AI问答,智能终端在做的作业便是在AI生态上尽或许做各式各样的加法。 在高度同质化的AI手机赛道 ,手机厂商们亟需找到立异的AI技能落地功用。而荣耀,正在悄然拿下多个首发优势。 在近期荣耀400的发布会现场,图生视频成了荣耀“吃螃蟹”的又一首发功用,这背面是协作方生数科技旗下的AI视频大模型在移动端的初次规模化落地。 联手生数科技Vidu
,荣耀打破了三大难关——坚持风格共同性、对物理国际的了解
、端侧本钱紧缩
,让用户免费体会“老相片复生术”。 而就在两个月前,生数科技 Vidu Q1模型刚以VBench双榜榜首的成果碾压Sora与Runway,现在就悄然钻进千万用户的口袋
。 这场协作背面,一场更深层的革新正在发酵。 当时
,多模态正在重构智能终端的交互体会
,手机正成为图生视频技能普惠的战场之一
。当大模型的技能比赛从言语模型延伸到多模态,“让回忆重获生命”的图生视频,或许正是翻开群众商场的榜首把钥匙
。 当图生视频在手机上跑起来。 一张由AI制造的“Live Photo”
,成为了荣耀发布会现场世人评论的焦点
。 。 相片中,一个小孩抱着窗布看向镜头浅笑 。经由图生视频功用加工后,小孩抓着窗布向一边摇晃
,头部也跟着晃动方向轻轻歪斜
,脸上挂着的笑脸变成了动态
,能看到嘴角咧起的弧度和兴起的脸颊。 在荣耀产品线总裁方飞的演示中,只需求点击“AI生图”功用,选定相应相片和生成的视频时长(3秒/5秒) ,AI就能依据图片场景生成一段流通的视频 。上述事例便是由该功用生成 。 早在3月宣告向AI终端生态公司转型的荣耀,在数字系列荣耀400上落地了一系列AI才干。光是相片一项,荣耀就上线了AI图生视频、AI去褶皱、AI去眼镜反光、AI去玻璃反光 、图生视频等优化功用。 看起来简略的视频演示,背面是图生视频技能落地智能终端的一大步:霸占了技能难点
,才干让AI视频看起来无限趋近于实在
。 首要,要想让视频动起来的作用契合实在国际的运转规则,便是视频生成模型们前期的通病。比方提示词设定成两个人打羽毛球,交给AI来做,球或许会呈现随便飞起或许不依照球拍击打轨道飞翔等问题,导致生成出来的著作无法运用。 当下 ,怎么更好地模仿物理国际规则,也成了大模型们面前的难关。就在3月份 ,生数科技发布的模型Vidu Q1,在VBench-1.0的视频质量、视频语义共同性和 VBench-2.0的常识推理、物理了解等归纳维度上到达SOTA水平
。靠着对提示词的了解力增强
,Vidu能自动辨认人物动作、光影
、方位联络等内容,让生成的视频在动态上契合物理国际规则。 此外,在风格共同性上 ,拿手动漫、水墨等多种画风了解的Vidu,在坚持原图风格共同上的体现相对安稳 |