可灵大模型

3周前更新 2,986 00

可灵大模型是快手自研的视频生成大模型,能够生成长达2分钟、符合物理规律、电影级画面的视频内容。

所在地:
中国
语言:
zh,en
收录时间:
2024-10-29
可灵大模型可灵大模型
可灵大模型
AI独角兽

可灵大模型(Kling)是由快手大模型团队自研打造的视频生成大模型,具备以下核心特点:

  1. 大幅度的合理运动:可灵采用3D时空联合注意力机制,能够更好地建模复杂时空运动,生成较大幅度运动的视频内容,同时能够符合运动规律。
  2. 长达2分钟的视频生成:得益于高效的训练基础设施、极致的推理优化和可扩展的基础架构,可灵大模型能够生成长达2分钟的视频,且帧率达到30fps。
  3. 模拟物理世界特性:基于自研模型架构及Scaling Law激发出的强大建模能力,可灵能够模拟真实世界的物理特性,生成符合物理规律的视频。
  4. 强大的概念组合能力:基于对文本-视频语义的深刻理解和Diffusion Transformer架构的强大能力,可灵能够将用户丰富的想象力转化为具体的画面,虚构真实世界中不会出现的场景。
  5. 电影级的画面生成:基于自研3D VAE,可灵能够生成1080p分辨率的电影级视频,无论是浩瀚壮阔的宏大场景,还是细腻入微的特写镜头,都能够生动呈现。
  6. 支持自由的输出视频宽高比:可灵采用了可变分辨率的训练策略,在推理过程中可以做到同样的内容输出多种多样的视频宽高比,满足更丰富场景中的视频素材使用需求。

可灵大模型以其强大的视频生成能力,为用户提供了一种全新的艺术视频创作方式,使得视频创作变得更加轻松和高效

数据统计

相关导航