可灵 Kling 大模型介绍
推荐看 官方文档
本接口所有请求格式和返回参数均严格遵循官方文档规范。
唯一区别在于调用路径(path)前需统一添加'/kling'前缀。
由于我们可能存在更新延迟的情况,强烈建议开发者直接参考官方文档获取最新信息。
https://app.klingai.com/cn/dev/document-api/apiReference/updateNotice
可灵视频接口说明
Kling视频接口都是异步接口,分为提交任务和查询任务两个步骤。
- 第一步:提交任务,拿到任务ID task_ID
- 第二步:根据 task_ID 查询任务进度,并且获得最终的视频URL或图片URL。
可灵大模型介绍
可灵大模型 (Kling) 是由快手AI团队“快手AI Lab”自研推出的新一代文生视频大模型。它标志着快手在AIGC(人工智能生成内容)领域取得了重大突破,技术能力可对标国际顶尖水平的OpenAI Sora模型。
可灵模型的核心能力是将用户输入的丰富文本描述,转化为一段高质量、高分辨率、且符合物理逻辑的视频。它不仅是技术的展示,更是一个强大的内容创作工具,旨在赋能创作者,降低高质量视频的创作门槛。
核心技术亮点
可灵的卓越性能建立在一系列自研技术创新之上:
Sora同源技术架构:采用与Sora类似的Diffusion Transformer架构,结合快手团队在视频技术领域的深厚积累,使其能够高效学习和建模复杂的时空动态。
3D时空联合注意力机制 (3D Spatiotemporal Attention):这是可灵实现复杂运动建模的关键。通过该机制,模型可以精准地理解和模拟现实世界中物体在三维空间中的运动规律和相互作用,从而生成大幅度、合理连贯的动作场面。
支持长视频与高分辨率:可灵能够生成长达2分钟的视频,并且帧率达到30fps,分辨率高达1080p。这突破了以往大多数模型只能生成几秒钟短片段的限制,使其能够承载更完整的故事叙事。
模拟真实物理世界:模型生成的视频内容遵循现实世界的物理规律,例如流体、光影反射、以及物体间的碰撞与运动惯性,使得视频的真实感和沉浸感大大增强。
强大的概念组合与想象力:可灵不仅能写实,更能“脑洞大开”。它可以理解并融合文本中抽象或虚构的概念(如“宇航员在海底看书”、“玻璃猫”),创造出充满想象力的超现实主义场景。
主要功能与应用
- 文生视频 (Text-to-Video):输入一段描述性文字,即可生成符合描述的视频内容。
- 图生视频 (Image-to-Video):输入一张静态图片,可灵能使其“动起来”,并根据文本提示进行动态扩展。
- 视频续写:对现有视频片段进行后续情节的创作和延伸。
- 多模态视频编辑:支持通过文本、图像、音频等多种方式引导和编辑视频生成,提供更高的创作自由度。
如何体验
目前,可灵大模型已在快手旗下的视频剪辑应用 “快影” App 中开放邀测。用户可以下载最新版的快影App,申请加入测试,亲身体验AI视频生成的强大魅力。