可灵大模型是快手团队推出的 AI视频生成 大模型,具备强大的视频创作能力,采用3D时空联合注意力机制,能够生成符合物理规律的大幅度运动视频,模拟真实世界特性。可灵支持生成长达2分钟、1080p分辨率的高清视频,并具有自由调整宽高比的功能。此外,该AI视频工具还结合了3D人脸和人体重建技术,实现表情和肢体的全驱动,只需一张全身照即可体验生动的AI唱跳功能。 可灵大模型的功能特色 大幅度的合理运动 :采用3D时空联合注意力机制,能够建模复杂时空运动,生成符合运动规律的大幅度运动视频。 长达2分钟的视频生成 :得益于高效的训练基础设施和推理优化,可灵能生成长达2分钟的视频内容。 模拟物理世界特性 :基于自研模型架构,能模拟真实世界的物理特性,生成符合物理规律的视频。 强大的概念组合能力 :利用对文本-视频语义的深刻理解和Diffusion Transformer架构,将用户想象力转化为具体画面。 电影级的画质生成 :基于自研3D VAE技术,可生成1080p分辨率的电影级视频。 支持自由的视频宽高比 :采用可变分辨率训练策略,能够在推理过程中输出多样的视频宽高比。 AI驱动的创新玩法 …
相关导航
暂无评论...