新华社北京8月1日电 —— 在科技日新月异的今天,中国的人工智能视频生成领域迎来了新的突破。用户只需在对话框中输入一句话或上传一张照片,点击“生成视频”按钮,不到一分钟的时间,一条生动有趣的短视频即可呈现眼前。这种便捷的体验,让众多“00后”用户纷纷尝鲜,感受科技带来的无限魅力。
年初,全球范围内文生视频大模型Sora的亮相引发了广泛关注,而在中国,这一领域的发展同样迅猛。近期,多家中国科技企业自主研发的视频生成产品扎堆上线,标志着中国人工智能大模型的应用领域再次拓宽。
生数科技作为行业的先行者之一,今年4月联合清华大学发布了视频大模型Vidu,并于7月底正式上线。该模型全面开放了文生视频和图生视频两大功能,用户可根据需求选择4秒或8秒的视频时长,分辨率最高可达1080P。生数科技的联合创始人兼首席执行官唐家渝表示,Vidu的推出旨在让更多人体验到文生视频和图生视频带来的美好感受。
与此同时,北京智谱AI公司也推出了其基于大模型开发的视频生成产品“清影”。这款产品不仅支持文本生成视频、图片生成视频,还实现了视频生成视频的创新功能,为用户提供了更加多样化的选择。智谱AI的首席执行官张鹏表示,清影的上线将进一步推动视频生成技术的发展和应用。
此外,快手公司也在今年6月发布了视频生成大模型“可灵”。该模型在文生视频和图生视频方面展现出了卓越的能力,能够创造逼真的运动场景并精确模拟物理特性,为用户带来更加震撼的视觉体验。
当前,中国视频生成产品的主流技术路线采用了深度学习模型与扩散模型相结合的架构,这一技术路线强依赖算法、算力和数据的支持。尽管中国的视频生成技术还处于起步阶段,面临着高质量数据、算法等一系列问题的挑战,但业内人士普遍认为,加速人工智能技术的研发与应用是推动其发展的关键所在。
展望未来,随着技术的不断迭代和升级,视频大模型将在影视动画制作等内容产业中发挥越来越重要的作用。唐家渝预判,未来十年内,影视创作生产的门槛将进一步降低,影视动画制作的成本也将大幅减少,从而更好地将人们的想象力和创造力转化为生产力。这一变革无疑将为中国的文化产业注入新的活力与机遇。