7月26日,智谱AI CEO张鹏在智谱Open Day上宣布,AI生成视频模型清影上线智谱清言,生成6秒视频只需要30秒的时间。即日起所有C端用户,都能通过清影体验到AI文生视频、图生视频能力。
据介绍,输入一段文字后,用户可以选择自己想要生成的风格,包括卡通3D、黑白、油画、电影感等,配上清影自带的音乐,就生成了充满AI想象力的视频片段。大模型能真正让用户用上,才更加“大有可玩”。
新型DiT模型架构,更高效地压缩视频信息,以及更充分地融合文本和视频内容,让清影在复杂指令遵从能力、内容连贯性、大幅的画面调度上具有一定独到之处。
在生成式视频模型的研发中,Scaling Law 继续在算法和数据两方面发挥作用。“我们积极在模型层面探索更高效的scaling方式。”在智谱 Open Day 上,智谱AI CEO 张鹏表示:“随着算法、数据不断迭代,相信Scaling Law将继续发挥强有力作用。”
“本次清影底座的视频生成模型是CogVideoX,它能将文本、时间、空间三个维度融合起来,参考了Sora的算法设计,它也是一个DiT架构,通过优化,CogVideoX 相比前代(CogVideo)推理速度提升了6倍。我们将继续努力迭代,在后续版本中,陆续推出更高分辨率、更长时长的生成视频功能。”