可灵 Kling 大模型介绍

可灵视频接口说明

Kling视频接口都是异步接口，分为提交任务和查询任务两个步骤。

可灵大模型 (Kling) 是由快手AI团队“快手AI Lab”自研推出的新一代文生视频大模型。它标志着快手在AIGC（人工智能生成内容）领域取得了重大突破，技术能力可对标国际顶尖水平的OpenAI Sora模型。

可灵模型的核心能力是将用户输入的丰富文本描述，转化为一段高质量、高分辨率、且符合物理逻辑的视频。它不仅是技术的展示，更是一个强大的内容创作工具，旨在赋能创作者，降低高质量视频的创作门槛。

可灵的卓越性能建立在一系列自研技术创新之上：

Sora同源技术架构：采用与Sora类似的Diffusion Transformer架构，结合快手团队在视频技术领域的深厚积累，使其能够高效学习和建模复杂的时空动态。
3D时空联合注意力机制 (3D Spatiotemporal Attention)：这是可灵实现复杂运动建模的关键。通过该机制，模型可以精准地理解和模拟现实世界中物体在三维空间中的运动规律和相互作用，从而生成大幅度、合理连贯的动作场面。
支持长视频与高分辨率：可灵能够生成长达2分钟的视频，并且帧率达到30fps，分辨率高达1080p。这突破了以往大多数模型只能生成几秒钟短片段的限制，使其能够承载更完整的故事叙事。
模拟真实物理世界：模型生成的视频内容遵循现实世界的物理规律，例如流体、光影反射、以及物体间的碰撞与运动惯性，使得视频的真实感和沉浸感大大增强。
强大的概念组合与想象力：可灵不仅能写实，更能“脑洞大开”。它可以理解并融合文本中抽象或虚构的概念（如“宇航员在海底看书”、“玻璃猫”），创造出充满想象力的超现实主义场景。

目前，可灵大模型已在快手旗下的视频剪辑应用 “快影” App 中开放邀测。用户可以下载最新版的快影App，申请加入测试，亲身体验AI视频生成的强大魅力。