49
AI 模型
13
免费模型
14
图像
10
视频
19
文字
4
音频
2
后期制作
合作模型开发商
OpenAI
GPT 系列大语言模型及 TTS 语音合成的开发商
Anthropic
Claude 系列大语言模型开发商,专注安全与对齐
ByteDance
Seedream / Seedance / Dreamina 系列视觉模型的开发商
Alibaba
Wan 系列及 Qwen 系列模型的开发商
Gemini 系列大语言模型的开发商
xAI
Grok 系列大语言模型的开发商
Black Forest Labs
FLUX 系列图像编辑模型的开发商
Kuaishou
Kling 视频生成模型的开发商
Mistral
欧洲领先的开源大语言模型开发商
Cheng et al.
MMAudio 视频转音频模型的研究团队(UIUC / Sony Research)
免费图像模型
零成本使用顶级 AI 图像模型,无需付费。
Black Forest Labs
免费 · 高质量文生图 · 有速率限制
Black Forest Labs
免费 · 最高质量 · 有速率限制
Black Forest Labs
免费 · 灵活风格 · 有速率限制
Black Forest Labs
免费 · 轻量快速 · 有速率限制
ByteDance
免费 · 中英双语 · 有速率限制 · 可能排队
| 模型 | 开发商 | 说明 | 价格 | 等级 |
|---|---|---|---|---|
| FLUX.2 Pro | Black Forest Labs | 免费 · 高质量文生图 · 有速率限制 | $0 | 免费 |
| FLUX.2 Max | Black Forest Labs | 免费 · 最高质量 · 有速率限制 | $0 | 免费 |
| FLUX.2 Flex | Black Forest Labs | 免费 · 灵活风格 · 有速率限制 | $0 | 免费 |
| FLUX.2 Klein 4B | Black Forest Labs | 免费 · 轻量快速 · 有速率限制 | $0 | 免费 |
| Seedream 4.5 | ByteDance | 免费 · 中英双语 · 有速率限制 · 可能排队 | $0 | 免费 |
图像生成模型
从文字描述生成高质量图片,支持多种风格和分辨率。
ByteDance
最新旗舰 · 原生中英双语 · 4K 超清
ByteDance
高质量图像生成 · 中英双语
ByteDance
高保真美学风格 · 艺术感强
Alibaba
20B 参数 · 中文文字渲染优秀
Alibaba
Wan 系列图片版 · 高分辨率
| 模型 | 开发商 | 说明 | 价格 | 等级 |
|---|---|---|---|---|
| Seedream 4.5 | ByteDance | 最新旗舰 · 原生中英双语 · 4K 超清 | $0.40 | 标准 |
| Seedream 4 | ByteDance | 高质量图像生成 · 中英双语 | $0.40 | 快速 |
| Dreamina 3.1 | ByteDance | 高保真美学风格 · 艺术感强 | $0.60 | 高端 |
| Qwen Image | Alibaba | 20B 参数 · 中文文字渲染优秀 | $0.50 | 标准 |
| Wan 2.6 Image | Alibaba | Wan 系列图片版 · 高分辨率 | $0.80 | 快速 |
图像编辑模型
上传现有图片进行编辑、增强或风格转换。
Black Forest Labs
上下文感知编辑 · 修图/修文字首选
Black Forest Labs
多图上下文编辑 · 风格一致性
ByteDance
通用图像编辑 · 图文混合
Xintao Wang et al.
图像超分辨率增强 · 画质提升
| 模型 | 开发商 | 说明 | 价格 | 等级 |
|---|---|---|---|---|
| FLUX Kontext Pro | Black Forest Labs | 上下文感知编辑 · 修图/修文字首选 | $0.80 | 高端 |
| FLUX Kontext Pro Multi | Black Forest Labs | 多图上下文编辑 · 风格一致性 | $0.80 | 高端 |
| UNO | ByteDance | 通用图像编辑 · 图文混合 | $0.50 | 标准 |
| Real-ESRGAN | Xintao Wang et al. | 图像超分辨率增强 · 画质提升 | $0.50 | 快速 |
视频生成模型(文本转视频)
通过文字描述自动生成短视频,部分模型支持同步生成音频。
Alibaba
极速生成 · 约 5 秒出片
Alibaba
高清分辨率
Alibaba
最新 Wan 系列 · 支持音频生成
ByteDance
电影级画质 · 支持音频
Kuaishou
最佳运动质量
ByteDance
最新 · 音频 + 锁定镜头 · 最长 12s
| 模型 | 开发商 | 说明 | 价格 | 等级 |
|---|---|---|---|---|
| Wan 2.2 — 480p Ultra Fast | Alibaba | 极速生成 · 约 5 秒出片 | $0.10 | 快速 |
| Wan 2.2 — 720p | Alibaba | 高清分辨率 | $0.60 | 标准 |
| Wan 2.6音频 | Alibaba | 最新 Wan 系列 · 支持音频生成 | $0.80 | 标准 |
| Seedance 1.5 Pro音频 | ByteDance | 电影级画质 · 支持音频 | $1.00 | 高端 |
| Kling Video O3 | Kuaishou | 最佳运动质量 | $1.20 | 高端 |
| Seedance 2.0音频 | ByteDance | 最新 · 音频 + 锁定镜头 · 最长 12s | $1.20 | 高端 |
视频生成模型(图片转视频)
将静态图片转化为动态视频,赋予图片生命力。
Alibaba
图片转视频 · 快速
Alibaba
图片转视频 · 高清
ByteDance
图片转视频 · 电影级 · 音频
ByteDance
图片转视频 · 音频 + 锁定镜头 · 12s
| 模型 | 开发商 | 说明 | 价格 | 等级 |
|---|---|---|---|---|
| Wan 2.2 i2v — 480p Fast | Alibaba | 图片转视频 · 快速 | $0.10 | 快速 |
| Wan 2.2 i2v — 720p | Alibaba | 图片转视频 · 高清 | $0.60 | 标准 |
| Seedance 1.5 Pro i2v音频 | ByteDance | 图片转视频 · 电影级 · 音频 | $1.00 | 高端 |
| Seedance 2.0 i2v音频 | ByteDance | 图片转视频 · 音频 + 锁定镜头 · 12s | $1.20 | 高端 |
免费文字模型
零成本使用多款顶级 AI 大语言模型,无需付费。
OpenAI
免费 · 120B 开源 · 有速率限制
NVIDIA
免费 · 543B · 有速率限制
Qwen
免费 · 480B 编程专用 · 有速率限制
Meta
免费 · 70B · 有速率限制
免费 · 27B · 有速率限制
Mistral
免费 · 24B · 有速率限制
DeepSeek
免费 · 高质量中文 · 有速率限制
Nous Research
免费 · 405B · 有速率限制
| 模型 | 开发商 | 说明 | 价格 | 等级 |
|---|---|---|---|---|
| GPT-OSS 120B | OpenAI | 免费 · 120B 开源 · 有速率限制 | $0 | 免费 |
| Nemotron 3 Super | NVIDIA | 免费 · 543B · 有速率限制 | $0 | 免费 |
| Qwen3 Coder 480B | Qwen | 免费 · 480B 编程专用 · 有速率限制 | $0 | 免费 |
| Llama 3.3 70B | Meta | 免费 · 70B · 有速率限制 | $0 | 免费 |
| Gemma 3 27B | 免费 · 27B · 有速率限制 | $0 | 免费 | |
| Mistral Small 3.1 24B | Mistral | 免费 · 24B · 有速率限制 | $0 | 免费 |
| DeepSeek V3 | DeepSeek | 免费 · 高质量中文 · 有速率限制 | $0 | 免费 |
| Hermes 3 405B | Nous Research | 免费 · 405B · 有速率限制 | $0 | 免费 |
文字生成模型
多家领先 AI 大语言模型,用于社交内容创作、改写和优化。
OpenAI
旗舰级 · 综合能力最强
OpenAI
轻量快速 · 性价比高
OpenAI
最新旗舰模型
Anthropic
出色的写作质量
Anthropic
快速 · 高性价比
极速 · 低成本
高性能推理
xAI
实时感知 · 紧跟热点
xAI
轻量快速
Mistral
高效欧洲模型
Mistral
均衡性能
| 模型 | 开发商 | 说明 | 价格 | 等级 |
|---|---|---|---|---|
| GPT-4o | OpenAI | 旗舰级 · 综合能力最强 | $12.50/1M in · $50/1M out | 高端 |
| GPT-4o Mini | OpenAI | 轻量快速 · 性价比高 | $0.75/1M in · $3/1M out | 快速 |
| GPT-5 | OpenAI | 最新旗舰模型 | $6.25/1M in · $50/1M out | 高端 |
| Claude Sonnet 4 | Anthropic | 出色的写作质量 | $15/1M in · $75/1M out | 高端 |
| Claude 3.5 Haiku | Anthropic | 快速 · 高性价比 | $4/1M in · $20/1M out | 快速 |
| Gemini 2.5 Flash | 极速 · 低成本 | $1.50/1M in · $12.50/1M out | 快速 | |
| Gemini 2.5 Pro | 高性能推理 | $6.25/1M in · $50/1M out | 高端 | |
| Grok 3 | xAI | 实时感知 · 紧跟热点 | $15/1M in · $75/1M out | 高端 |
| Grok 3 Mini | xAI | 轻量快速 | $1.50/1M in · $2.50/1M out | 快速 |
| Mistral Small | Mistral | 高效欧洲模型 | $0.50/1M in · $1.50/1M out | 快速 |
| Mistral Medium | Mistral | 均衡性能 | $2/1M in · $10/1M out | 标准 |
语音合成模型
将文字转换为自然语音,支持多种音色和语速调节。
OpenAI
高品质文字转语音 · 6 种音色 (alloy, echo, fable, onyx, nova, shimmer)
| 模型 | 开发商 | 说明 | 价格 | 等级 |
|---|---|---|---|---|
| TTS-1 | OpenAI | 高品质文字转语音 · 6 种音色 (alloy, echo, fable, onyx, nova, shimmer) | - | 标准 |
背景音乐生成模型
根据视频内容和文字描述自动生成同步的背景音乐,无需额外素材。
Cheng et al.
视频转音频 · 多模态同步 · 背景音乐生成
| 模型 | 开发商 | 说明 | 价格 | 等级 |
|---|---|---|---|---|
| MMAudio V2 | Cheng et al. | 视频转音频 · 多模态同步 · 背景音乐生成 | - | 标准 |
视频旁白模型
AI 自动分析视频内容并生成配音旁白。该功能由两个模型协作完成:先用 Gemini 2.5 Flash 分析视频画面,再用 TTS-1 将生成的脚本转换为语音。
视频内容分析 · 自动生成旁白脚本
OpenAI
旁白语音合成 · 6 种音色
| 模型 | 开发商 | 说明 | 价格 | 等级 |
|---|---|---|---|---|
| Gemini 2.5 Flash分析 | 视频内容分析 · 自动生成旁白脚本 | - | 快速 | |
| TTS-1合成 | OpenAI | 旁白语音合成 · 6 种音色 | - | 标准 |
后期制作模型
视频后期处理工具 — 目标跟踪、内容替换和自然语言编辑。
Meta
视频目标跟踪 · 点击即跟踪 · 内容替换
Alibaba
自然语言视频编辑 · AI 智能修改
| 模型 | 开发商 | 说明 | 价格 | 等级 |
|---|---|---|---|---|
| SAM2 Video | Meta | 视频目标跟踪 · 点击即跟踪 · 内容替换 | ~$0.04/run | 标准 |
| Wan 2.7 VideoEdit | Alibaba | 自然语言视频编辑 · AI 智能修改 | ~$0.50/run | 高端 |
模型等级说明
零成本使用,有速率限制,高峰期可能排队。
生成速度最快,费用最低,适合快速迭代和日常使用。
速度与质量的最佳平衡,推荐大多数场景使用。
最高质量输出,适合专业创作和重要内容发布。