AI 模型文档

了解平台上使用的 AI 模型及其开发商

API 文档返回首页

49

AI 模型

13

免费模型

14

图像

10

视频

19

文字

4

音频

2

后期制作

合作模型开发商

🖼️

免费图像模型

零成本使用顶级 AI 图像模型,无需付费。

FLUX.2 Pro免费

Black Forest Labs

免费 · 高质量文生图 · 有速率限制

flux-2-pro$0
FLUX.2 Max免费

Black Forest Labs

免费 · 最高质量 · 有速率限制

flux-2-max$0
FLUX.2 Flex免费

Black Forest Labs

免费 · 灵活风格 · 有速率限制

flux-2-flex$0
FLUX.2 Klein 4B免费

Black Forest Labs

免费 · 轻量快速 · 有速率限制

flux-2-klein-4b$0
Seedream 4.5免费

ByteDance

免费 · 中英双语 · 有速率限制 · 可能排队

seedream-v4.5$0
免费模型存在速率限制(约 10 次/分钟),高峰期可能排队等待。如需更快速度和更高稳定性,请使用付费模型。
🖼️

图像生成模型

从文字描述生成高质量图片,支持多种风格和分辨率。

Seedream 4.5标准

ByteDance

最新旗舰 · 原生中英双语 · 4K 超清

seedream-v4.5$0.40
Seedream 4快速

ByteDance

高质量图像生成 · 中英双语

seedream-v4$0.40
Dreamina 3.1高端

ByteDance

高保真美学风格 · 艺术感强

dreamina-v3.1/text-to-image$0.60
Qwen Image标准

Alibaba

20B 参数 · 中文文字渲染优秀

qwen-image/text-to-image$0.50
Wan 2.6 Image快速

Alibaba

Wan 系列图片版 · 高分辨率

wan-2.6/text-to-image$0.80
✏️

图像编辑模型

上传现有图片进行编辑、增强或风格转换。

FLUX Kontext Pro高端

Black Forest Labs

上下文感知编辑 · 修图/修文字首选

flux-kontext-pro$0.80
FLUX Kontext Pro Multi高端

Black Forest Labs

多图上下文编辑 · 风格一致性

flux-kontext-pro/multi$0.80
UNO标准

ByteDance

通用图像编辑 · 图文混合

uno$0.50
Real-ESRGAN快速

Xintao Wang et al.

图像超分辨率增强 · 画质提升

real-esrgan$0.50
🎬

视频生成模型(文本转视频)

通过文字描述自动生成短视频,部分模型支持同步生成音频。

Wan 2.2 — 480p Ultra Fast快速

Alibaba

极速生成 · 约 5 秒出片

wan-2.2/t2v-480p-ultra-fast$0.10
Wan 2.2 — 720p标准

Alibaba

高清分辨率

wan-2.2/t2v-720p$0.60
Wan 2.6音频标准

Alibaba

最新 Wan 系列 · 支持音频生成

wan-2.6/text-to-video$0.80
Seedance 1.5 Pro音频高端

ByteDance

电影级画质 · 支持音频

seedance-v1.5-pro/text-to-video$1.00
Kling Video O3高端

Kuaishou

最佳运动质量

kling-video-o3-std/text-to-video$1.20
Seedance 2.0音频高端

ByteDance

最新 · 音频 + 锁定镜头 · 最长 12s

seedance-2.0/text-to-video$1.20
🎞️

视频生成模型(图片转视频)

将静态图片转化为动态视频,赋予图片生命力。

Wan 2.2 i2v — 480p Fast快速

Alibaba

图片转视频 · 快速

wan-2.2/i2v-480p-ultra-fast$0.10
Wan 2.2 i2v — 720p标准

Alibaba

图片转视频 · 高清

wan-2.2/i2v-720p$0.60
Seedance 1.5 Pro i2v音频高端

ByteDance

图片转视频 · 电影级 · 音频

seedance-v1.5-pro/image-to-video$1.00
Seedance 2.0 i2v音频高端

ByteDance

图片转视频 · 音频 + 锁定镜头 · 12s

seedance-2.0/image-to-video$1.20
🆓

免费文字模型

零成本使用多款顶级 AI 大语言模型,无需付费。

GPT-OSS 120B免费

OpenAI

免费 · 120B 开源 · 有速率限制

gpt-oss-120b$0
Nemotron 3 Super免费

NVIDIA

免费 · 543B · 有速率限制

nemotron-3-super$0
Qwen3 Coder 480B免费

Qwen

免费 · 480B 编程专用 · 有速率限制

qwen3-coder-480b$0
Llama 3.3 70B免费

Meta

免费 · 70B · 有速率限制

llama-3.3-70b-instruct$0
Gemma 3 27B免费

Google

免费 · 27B · 有速率限制

gemma-3-27b-it$0
Mistral Small 3.1 24B免费

Mistral

免费 · 24B · 有速率限制

mistral-small-3.1-24b$0
DeepSeek V3免费

DeepSeek

免费 · 高质量中文 · 有速率限制

deepseek-chat-v3$0
Hermes 3 405B免费

Nous Research

免费 · 405B · 有速率限制

hermes-3-llama-3.1-405b$0
免费模型存在速率限制(约 10 次/分钟),高峰期可能排队等待。如需更快速度和更高稳定性,请使用付费模型。
📝

文字生成模型

多家领先 AI 大语言模型,用于社交内容创作、改写和优化。

GPT-4o高端

OpenAI

旗舰级 · 综合能力最强

openai/gpt-4o$12.50/1M in · $50/1M out
GPT-4o Mini快速

OpenAI

轻量快速 · 性价比高

openai/gpt-4o-mini$0.75/1M in · $3/1M out
GPT-5高端

OpenAI

最新旗舰模型

openai/gpt-5$6.25/1M in · $50/1M out
Claude Sonnet 4高端

Anthropic

出色的写作质量

anthropic/claude-sonnet-4$15/1M in · $75/1M out
Claude 3.5 Haiku快速

Anthropic

快速 · 高性价比

anthropic/claude-3.5-haiku$4/1M in · $20/1M out
Gemini 2.5 Flash快速

Google

极速 · 低成本

google/gemini-2.5-flash$1.50/1M in · $12.50/1M out
Gemini 2.5 Pro高端

Google

高性能推理

google/gemini-2.5-pro$6.25/1M in · $50/1M out
Grok 3高端

xAI

实时感知 · 紧跟热点

xai/grok-3$15/1M in · $75/1M out
Grok 3 Mini快速

xAI

轻量快速

xai/grok-3-mini$1.50/1M in · $2.50/1M out
Mistral Small快速

Mistral

高效欧洲模型

mistral/mistral-small$0.50/1M in · $1.50/1M out
Mistral Medium标准

Mistral

均衡性能

mistral/mistral-medium$2/1M in · $10/1M out
🎙️

语音合成模型

将文字转换为自然语音,支持多种音色和语速调节。

TTS-1标准

OpenAI

高品质文字转语音 · 6 种音色 (alloy, echo, fable, onyx, nova, shimmer)

openai/tts-1
可选音色: Alloy · Echo · Fable · Onyx · Nova · Shimmer
🎵

背景音乐生成模型

根据视频内容和文字描述自动生成同步的背景音乐,无需额外素材。

MMAudio V2标准

Cheng et al.

视频转音频 · 多模态同步 · 背景音乐生成

mmaudio-v2
🗣️

视频旁白模型

AI 自动分析视频内容并生成配音旁白。该功能由两个模型协作完成:先用 Gemini 2.5 Flash 分析视频画面,再用 TTS-1 将生成的脚本转换为语音。

Gemini 2.5 Flash分析快速

Google

视频内容分析 · 自动生成旁白脚本

google/gemini-2.5-flash
TTS-1合成标准

OpenAI

旁白语音合成 · 6 种音色

openai/tts-1
旁白风格: 专业 · 轻松 · 戏剧化 · 纪录片 · 活力
🎨

后期制作模型

视频后期处理工具 — 目标跟踪、内容替换和自然语言编辑。

SAM2 Video标准

Meta

视频目标跟踪 · 点击即跟踪 · 内容替换

meta/sam-2-video~$0.04/run
Wan 2.7 VideoEdit高端

Alibaba

自然语言视频编辑 · AI 智能修改

wan-2.7-videoedit~$0.50/run

模型等级说明

免费

零成本使用,有速率限制,高峰期可能排队。

快速

生成速度最快,费用最低,适合快速迭代和日常使用。

标准

速度与质量的最佳平衡,推荐大多数场景使用。

高端

最高质量输出,适合专业创作和重要内容发布。

立即试用媒体工作室 →