你的位置:九游海岛奇兵转移到苹果 > 新闻动态 > 生数科技发布高可控多模态视频生成模型Vidu Q1
生数科技发布高可控多模态视频生成模型Vidu Q1
发布日期:2025-04-18 04:03 点击次数:114
上证报中国证券网讯(记者 孙小程)3月29日,在中关村论坛上,清华大学人工智能研究院副院长、生数科技创始人兼首席科学家朱军教授发布高可控视频大模型Vidu Q1。该模型将在4月全球上线。
据介绍,Vidu Q1作为业内首个高可控AI视频大模型,其在多主体细节可控(特别是动作、布局可控)、音效同步可控、画质增强等方面均取得显著成效。
以多主体细节可控为例,在语义指令基础上,通过融入参考图的视觉指令,Vidu Q1支持对场景中多主体的位置、大小、运动轨迹等属性进行更进一步的可控,对所有动作行为(出场、退场、坐立姿态、行动路线)进行精准调整。用户能够明显体验到用更低的抽卡率,可实现更高质量的可控生成。
一直以来,AI视频生成过程中的随机性都是老大难问题,Vidu Q1针对AI视频生成的痛点,通过技术手段引入多元素控制,它不再是没有头绪的乱生成,而是做到了人为可控,这就让AI视频生成与当下精益求精的制作逐渐趋向一致。例如,在动漫领域,通过对角色、物体、场景等的精确控制,能够让创作者快速生成高质量动画。日前,好莱坞知名动漫工作室Aura Productions选择与Vidu合作,计划制作50集动画短剧。
“为了更好地引领多模态行业的发展,我们也基于实际探索和预测,对Vidu的未来发展路径做了比较多思考。视频生成的结果会融合更多的模态,同时,多模态技术在虚实结合、与物理世界交互等方面也具有更多可能。我们也期待,中国的AI视频生成赛道玩家能够持续在世界舞台上舞出风采,在百家争鸣中实现中国多模态技术的极大发展和人人可感知到的现实应用。”朱军说。
上一篇:没有了
下一篇:没有了
Powered by 九游海岛奇兵转移到苹果 @2013-2022 RSS地图 HTML地图