AI 模型

为真实制作而准备的 AI 图像与视频模型

了解 Ciaro Pro 中的 AI 图像模型和 text-to-image 工具，再把它们与我们的 text-to-video 模型放在一起比较，用于镜头运动、对白和可交付的成片画面。平台只会上线真正适合制作流程的模型，从最早的概念画面一直覆盖到最终输出。

只有当新模型真正适合工作流时，阵容才会更新

6图像模型

8视频模型

4K最高分辨率

HDR + EXR高端输出

一个工作流

从概念画面到最终运动镜头，无需切换工具

Ciaro Pro 把 AI 图像模型和视频生成模型放在同一个故事、镜头与剪辑工作流里。参考图、提示词和创意决策都会一路保留下来，而不是在每一步重新搭建。

需要视觉风格开发、角色一致性或清晰参考静帧时，先用图像模型。需要镜头运动、对白、原生音频、多模态参考，或 HDR、EXR 这类高端交付格式时，再切换到 text-to-video 模型。

图像生成

图像模型

这些 text-to-image 模型适合概念设计、参考静帧和视觉开发。有些更擅长写实感，有些更擅长严格执行提示词，还有些更适合通过多参考保持整场画面的统一。

Flux 2

写实图像生成模型，擅长结合参考图来保持镜头、道具和角色的一致性。

图像所有计划

Nano Banana

Google Gemini Pro 图像模型，支持更高质量的生成与编辑，最多可使用 14 张参考图。

图像所有计划

Nano Banana 2

基于 Gemini 3.1 Flash Image 的快速 text-to-image 与图像编辑模型，最多支持 14 张参考图。

图像所有计划

QWEN

图像模型，擅长理解提示词，并在画面中干净地渲染文字、UI 与图形细节。

图像所有计划

Seedream 4.5

ByteDance 图像模型，适合文本、图像和多参考生成，便于大规模探索风格方向。

图像所有计划

Gen 4

以参考图驱动的图像模型，适合需要角色和场景连续性的镜头。

图像所有计划

视频生成

视频模型

这些 text-to-video 模型可以把静帧、提示词和参考素材转成可用的运动画面。你可以按真实感、音频支持、参考控制、HDR / EXR 输出，以及它们对更长制作流程的适配度来比较视频生成模型。

Ray 3

电影级视频生成模型，适合定向运动与标准输出，并支持 HDR 和 EXR 选项。

视频HDREXR

Ray 3.2

推荐默认视频模型，提供更快的 1080p 生成、更强的真实感与更好的时间一致性。

视频HDREXR

Veo 3.1

Google 视频生成模型，支持原生音频和对白，并可通过扩展工作流生成更长镜头。

视频Indie+

Sora 2

OpenAI 的 text-to-video 模型，适合更长且连贯的片段，并提供标准与更高质量模式。

视频Indie+

Gen 4.5

Runway 的 image-to-video 模型，适合从静帧生成可控运动并保持角色一致性。

视频Indie+

Kling 3

多模态视频模型，适合富有表现力的镜头运动、人物动作以及支持原生音频的输出。

视频Indie+

Seedance 2.0

多模态 text-to-video AI 模型，可结合参考图、参考视频与音频来获得更受控的运动。

视频Indie+

HappyHorse 1.0

快速多模态视频模型，支持 text-to-video、image-to-video 和音频同步片段，并提供原生 1080p 输出。

视频1080pAudio

始终是最好的模型，始终保持最新。

我们会在新模型上线时持续加入。Pro 和 Studio 订阅用户可优先体验。你永远不会落后。

Start Free

按模型访问权限比较套餐

了解 Ciaro Pro 的不同套餐如何对应更高级的制作能力、积分与团队工作流。

查看价格

探索制作工作流

看看这些图像与视频模型如何融入连接的编剧、概念设计、分镜与编辑流程中。

查看制作工具

阅读模型工作流指南

浏览教程与模型深度解析，了解何时使用不同的输出、格式与生成工作流。

打开博客

Your vision. Every frame.

Start free. Scale when the production is ready.

Start Free Talk to us