今天给大家带来了最新的。 快手版 SORA 发布–可灵大模型! 它采用了 Sora 相似的技术路线,结合多项自研技术创新,生成的视频不仅运动幅度大且合理,还能模拟物理世界特性,具备强大的概念组合能力和想象力。 数据上看,可灵支持生成长达 120 秒的 30fps 的超长视频,分辨率高达 1080p,日支持多种宽高比。 优点如下: 1.大幅度的合理运动 可灵采用3D时空联合注意力机制,能够更好地建模复杂时空运动,生成较大幅度运动的视频内容,同时能够符合运动规律。 2.长达2分钟的视频生成 得益于高效的训练基础设施、极致的推理优化和可扩展的基础架构,可灵大模型能够生成长达2分钟的视频,且帧率达到30fps。 3.模拟物理世界特性 基于自研模型架构及Scaling Law激发出的强大建模能力,可灵能够模拟真实世界的物理特性,生成符合物理规律的视频。 4.强大的概念组合能力 基于对文本-视频语义的深刻理解和 Diffusion Transformer 架构的强大能力,可灵能够将用户丰富的想象力转化为具体的画面,虚构真实世界中不会出现的的场景。 5.电影级的画面生成 基于自研3D VAE,可灵能够生成1080p分辨率的电影级视频,无论是浩瀚壮阔的宏大场景还是细腻入微的特写镜头,都能够生动呈现。 6.支持自由的输出视频宽高比 可灵采用了可变分辨率的训练策略,在推理过程中可以做到同样的内容输出多种多样的视频宽高比,满足更丰富场景中的视频素材使用需求。 现在已经可以申请内测了,在快影 APP 上的 AI 创作栏即可申请。如果买家秀如买家秀一样惊艳,那么绝对是 AI 视频创作的一大福音,同时也对大家的创作能力和想象力提出了更高的要求!
可灵大模型网址及视频演示网址: 可灵大模型 (kuaishou.com)
暂无评论内容