AI 视频创作视频生成

可灵大模型

可灵大模型(Kling)是由快手大模型团队自研打造的视频生成大模型

标签:

可灵大模型简介

可灵大模型(Kling)是由快手大模型团队自研打造的AI视频生成大模型,旨在提供高质量的视频生成能力,让用户可以轻松高效地完成艺术视频创作。可灵大模型采用3D时空联合注意力机制,能够生成分辨率高达1080p、时长最长为2分钟(帧率30fps)的视频。可灵大模型模型采用了与Sora相似的技术路线,并结合了多项自研技术创新,使其在视频生成方面具有显著优势。

可灵大模型

可灵大模型能够生成大幅度的合理运动以及模拟物理世界特性,具备强大的概念组合能力和想象力,这使得可灵AI能够创造出独特且富有创意的视频内容。目前,可灵大模型已经在快影App开放邀测体验,用户可以通过上传全身或半身照片来体验一键跳舞等功能。

可灵大模型功能特点

✴️ 大幅度的合理运动
可灵大模型采用3D时空联合注意力机制,能够更好地建模复杂时空运动,生成较大幅度运动的视频内容,同时能够符合运动规律。

✴️ 长达2分钟的视频生成
可灵大模型得益于高效的训练基础设施、极致的推理优化和可扩展的基础架构,可灵AI能够生成长达2分钟的视频,且帧率达到30fps。

✴️ 模拟物理世界特性
可灵大模型基于自研模型架构及Scaling Law激发出的强大建模能力,可灵AI能够模拟真实世界的物理特性,生成符合物理规律的视频。这进一步增强了视频的真实感和沉浸感。

✴️ 强大的概念组合能力
可灵大模型基于对文本-视频语义的深刻理解和 Diffusion Transformer 架构的强大能力,可灵AI能够将用户丰富的想象力转化为具体的画面,虚构真实世界中不会出现的的场景。

✴️ 电影级的画面生成
可灵大模型基于自研3D VAE,可灵能够生成1080p分辨率的电影级视频,无论是浩瀚壮阔的宏大场景,还是细腻入微的特写镜头,可灵AI都能够生动呈现。

✴️ 支持自由的输出视频宽高比
可灵大模型采用了可变分辨率的训练策略,在推理过程中可灵AI可以做到同样的内容输出多种多样的视频宽高比,满足更丰富场景中的视频素材使用需求。

可灵大模型创新玩法

🌈 表情身体驱动

可灵大模型基于自研的3D人脸和人体重建技术,结合背景稳定性和重定向模块,实现表情肢体全驱动技术,可灵AI仅需一张全身照片,即可体验生动的“唱跳”玩法。

可灵大模型

可灵大模型如何使用

目前,可灵大模型官网已经上线,可灵AI创作功能已经在快影App开放邀测体验,感兴趣的用户可以下载快影App,在AI创作区域中找到可灵AI创作进行申请,申请成功后即可体验可灵AI视频生成的功能。

可灵大模型官网入口

可灵大模型官网:https://kling.kuaishou.com/

快影App官网:https://h5.kwaiying.com/officialWebsite

数据统计

类似工具

暂无评论

暂无评论...