多模态模型

实时多模态模型

GPT-4o

OpenAI

GPT-4o 是 OpenAI 旗下的 底座与基础模型 产品,主打 实时多模态模型,常见标签包括 底座模型、多模态。

闭源/平台模型开放 / 平台分发无 API
底座模型多模态
旗舰多模态模型

Gemini 2.5 Pro

Google DeepMind

Gemini 2.5 Pro 是 Google DeepMind 旗下的 底座与基础模型 产品,主打 旗舰多模态模型,常见标签包括 底座模型、多模态。

闭源/平台模型开放 / 平台分发无 API
底座模型多模态
轻量多模态模型

Gemini 2.5 Flash

Google DeepMind

Gemini 2.5 Flash 是 Google DeepMind 旗下的 底座与基础模型 产品,主打 轻量多模态模型,常见标签包括 底座模型、多模态。

闭源/平台模型开放 / 平台分发无 API
底座模型多模态
高端推理模型

Claude Opus 4

Anthropic

Claude Opus 4 是 Anthropic 旗下的 底座与基础模型 产品,主打 高端推理模型,常见标签包括 底座模型、多模态。

闭源/平台模型开放 / 平台分发无 API
底座模型多模态
主力推理模型

Claude Sonnet 4

Anthropic

Claude Sonnet 4 是 Anthropic 旗下的 底座与基础模型 产品,主打 主力推理模型,常见标签包括 底座模型、多模态。

闭源/平台模型开放 / 平台分发无 API
底座模型多模态
全模态模型

Qwen Omni

阿里通义

Qwen Omni 是 阿里通义 旗下的 底座与基础模型 产品,主打 全模态模型,常见标签包括 底座模型、多模态、开源。

开源/自部署开源免费 / 自部署无 API
底座模型多模态开源
多模态家族

Qwen VL

阿里通义

Qwen VL 是 阿里通义 旗下的 底座与基础模型 产品,主打 多模态家族,常见标签包括 底座模型、多模态、开源。

开源/自部署开源免费 / 自部署无 API
底座模型多模态开源
音频理解模型

Qwen Audio

阿里通义

Qwen Audio 是 阿里通义 旗下的 底座与基础模型 产品,主打 音频理解模型,常见标签包括 底座模型、多模态、开源。

开源/自部署开源免费 / 自部署无 API
底座模型多模态开源
开源多模态

DeepSeek VL

DeepSeek

DeepSeek VL 是 DeepSeek 旗下的 底座与基础模型 产品,主打 开源多模态,常见标签包括 底座模型、多模态、开源。

开源/自部署开源免费 / 自部署无 API
底座模型多模态开源
多模态推理模型

Seed 1.5

字节 Seed

Seed 1.5 是 字节 Seed 旗下的 底座与基础模型 产品,主打 多模态推理模型,常见标签包括 底座模型、多模态、国内生态。

闭源/平台模型开放 / 平台分发无 API
底座模型多模态国内生态
多模态底座

Hunyuan Models

腾讯混元

Hunyuan Models 是 腾讯混元 旗下的 底座与基础模型 产品,主打 多模态底座,常见标签包括 底座模型、多模态、国内生态。

闭源/平台模型开放 / 平台分发无 API
底座模型多模态国内生态
文心模型家族

ERNIE Models

百度文心

ERNIE Models 是 百度文心 旗下的 底座与基础模型 产品,主打 文心模型家族,常见标签包括 底座模型、国内生态。

闭源/平台模型开放 / 平台分发无 API
底座模型国内生态多模态
多模态模型家族

MiniMax Models

MiniMax

MiniMax Models 适合查看 MiniMax 在文本、语音、视频和全球化产品层面的完整布局。

闭源/平台模型开放 / 平台分发无 API
底座模型多模态国内生态
多模态模型家族

Step Models

阶跃星辰

Step Models 是 阶跃星辰 旗下的 底座与基础模型 产品,主打 多模态模型家族,常见标签包括 底座模型、多模态、国内生态。

闭源/平台模型开放 / 平台分发无 API
底座模型多模态国内生态
视频生成模型

Wan 2.1

阿里通义

Wan 2.1 是 阿里通义 旗下的 底座与基础模型 产品,主打 视频生成模型,常见标签包括 底座模型、多模态、开源。

开源/自部署开源免费 / 自部署无 API
底座模型多模态开源
视频生成模型

CogVideoX

智谱 AI

CogVideoX 是 智谱 AI 旗下的 底座与基础模型 产品,主打 视频生成模型,常见标签包括 底座模型、多模态、开源。

开源/自部署开源免费 / 自部署无 API
底座模型多模态开源
视频生成模型

Sora 2

OpenAI

Sora 2 是 OpenAI 旗下的 底座与基础模型 产品,主打 视频生成模型,常见标签包括 底座模型、多模态。

闭源/平台模型开放 / 平台分发无 API
底座模型多模态
图像生成模型

GPT Image 1.5

OpenAI

GPT Image 1.5 是 OpenAI 旗下的 底座与基础模型 产品,主打 图像生成模型,常见标签包括 底座模型、多模态。

闭源/平台模型开放 / 平台分发无 API
底座模型多模态
视觉语言模型

InternVL

OpenGVLab

InternVL 是 OpenGVLab 旗下的 底座与基础模型 产品,主打 视觉语言模型,常见标签包括 底座模型、多模态、开源。

开源/自部署开源免费 / 自部署无 API
底座模型多模态开源
轻量多模态

MiniCPM-V

OpenBMB

MiniCPM-V 是 OpenBMB 旗下的 底座与基础模型 产品,主打 轻量多模态,常见标签包括 底座模型、多模态、开源。

开源/自部署开源免费 / 自部署无 API
底座模型多模态开源
视觉语言模型

Pixtral

Mistral AI

Pixtral 是 Mistral AI 旗下的 底座与基础模型 产品,主打 视觉语言模型,常见标签包括 底座模型、多模态。

闭源/平台模型开放 / 平台分发无 API
底座模型多模态
多模态基座

PaliGemma

Google

PaliGemma 是 Google 旗下的 底座与基础模型 产品,主打 多模态基座,常见标签包括 底座模型、多模态、开源。

开源/自部署开源免费 / 自部署无 API
底座模型多模态开源
开源多模态

Molmo

Allen AI

Molmo 是 Allen AI 旗下的 底座与基础模型 产品,主打 开源多模态,常见标签包括 底座模型、多模态、开源。

开源/自部署开源免费 / 自部署无 API
底座模型多模态开源
视觉语言基础模型

Florence-2

Microsoft

Florence-2 是 Microsoft 旗下的 底座与基础模型 产品,主打 视觉语言基础模型,常见标签包括 底座模型、多模态、开源。

开源/自部署开源免费 / 自部署无 API
底座模型多模态开源
官方热门

ChatGPT

OpenAI

ChatGPT 是 OpenAI 面向大众的主力 AI 助手入口,核心价值在于把通用问答、写作、搜索、文件分析和多模态交互做成统一产品体验。

闭源/平台免费 / 订阅API
文本模型ChatAPI
多模态

Gemini

Google

Gemini 是 Google 面向大众的 AI 入口之一,真正的优势不只是聊天,而是和搜索、Google Workspace、Android 与多模态能力的联动。

闭源/平台免费 / 订阅API
文本模型ChatAPI
长文强项

Claude

Anthropic

Claude 是 Anthropic 面向终端用户的主力助手产品,最突出的标签不是聊天,而是长文本处理、稳健写作、文档理解和企业安全感。

闭源/平台免费 / 订阅API
文本模型ChatAPI
实时信息

Grok

xAI

Grok 是 xAI 提供的文本大模型产品,主打实时信息方向,可直接进入官网查看能力与使用方式。

闭源/平台免费 / 订阅无 API
文本模型Chat多模态
中文热门

Kimi

Moonshot AI

Kimi 是 Moonshot AI 面向中文用户最有代表性的产品页之一,核心标签是长上下文、中文体验和资料整理能力。

闭源/平台免费 / 订阅API
国内模型APIChat
国民助手

豆包

ByteDance

豆包是字节体系面向大众的 AI 入口,价值在于国民化产品体验、中文使用门槛低,以及和字节内容生态的联动潜力。

闭源/平台免费 / 订阅无 API
国内模型Chat多模态
阿里系

通义千问

Alibaba Cloud

通义千问是阿里系面向终端用户的主入口之一,背后真正重要的是它与 Qwen 模型家族、阿里云平台和企业生态的连接关系。

闭源/平台免费 / 订阅API
国内模型APIChat
推理热门

DeepSeek

DeepSeek

DeepSeek 是当前国内关注度最高的推理型 AI 助手之一,核心看点不是花哨功能,而是推理表现、响应质量和价格效率。

闭源/平台免费 / 订阅API
国内模型APIChat
腾讯系

腾讯元宝

Tencent

通过描述生成UI设计稿

闭源/平台免费 / 订阅无 API
国内模型Chat多模态
清华系

智谱清言

Zhipu AI

通过描述生成UI设计稿

闭源/平台免费 / 订阅API
国内模型APIChat
官方模型

Aurora Image

xAI

Aurora Image 是 xAI 旗下的 底座与基础模型 产品,主打 官方模型,常见标签包括 底座模型、API、多模态。

闭源/平台模型开放 / 平台分发API
底座模型API多模态
官方模型

Aya Vision 32B

Cohere

Aya Vision 32B 是 Cohere 旗下的 底座与基础模型 产品,主打 官方模型,常见标签包括 底座模型、API、开源。

开源/自部署开源免费 / 自部署API
底座模型API开源
开源模型

Chameleon 7B

Meta

Chameleon 7B 是 Meta 旗下的 底座与基础模型 产品,主打 开源模型,常见标签包括 底座模型、开源、多模态。

开源/自部署开源免费 / 自部署无 API
底座模型开源多模态
官方模型

CogView 4

智谱 AI

CogView 4 是 智谱 AI 旗下的 底座与基础模型 产品,主打 官方模型,常见标签包括 底座模型、API、国内生态。

闭源/平台模型开放 / 平台分发API
底座模型API国内生态
官方模型

CogVLM2

智谱 AI

CogVLM2 是 智谱 AI 旗下的 底座与基础模型 产品,主打 官方模型,常见标签包括 底座模型、API、国内生态。

开源/自部署开源免费 / 自部署API
底座模型API国内生态
官方模型

Command A Vision

Cohere

Command A Vision 是 Cohere 旗下的 底座与基础模型 产品,主打 官方模型,常见标签包括 底座模型、API、多模态。

闭源/平台模型开放 / 平台分发API
底座模型API多模态
官方模型

Cosmos Predict1

NVIDIA

Cosmos Predict1 是 NVIDIA 旗下的 底座与基础模型 产品,主打 官方模型,常见标签包括 底座模型、API、多模态。

闭源/平台模型开放 / 平台分发API
底座模型API多模态
官方模型

Cosmos Reason1

NVIDIA

Cosmos Reason1 是 NVIDIA 旗下的 底座与基础模型 产品,主打 官方模型,常见标签包括 底座模型、API、多模态。

闭源/平台模型开放 / 平台分发API
底座模型API多模态
官方模型

Cosmos Transfer1

NVIDIA

Cosmos Transfer1 是 NVIDIA 旗下的 底座与基础模型 产品,主打 官方模型,常见标签包括 底座模型、API、多模态。

闭源/平台模型开放 / 平台分发API
底座模型API多模态
官方模型

DeepSeek Janus Pro

DeepSeek

DeepSeek Janus Pro 是 DeepSeek 旗下的 底座与基础模型 产品,主打 官方模型,常见标签包括 底座模型、API、国内生态。

闭源/平台模型开放 / 平台分发API
底座模型API国内生态
推理模型家族

DeepSeek Models

DeepSeek

DeepSeek Models 适合查看 DeepSeek 在通用推理、深度思考、多模态与 API 成本控制上的整体布局。

闭源/平台模型开放 / 平台分发无 API
底座模型国内生态多模态
官方模型

DeepSeek VL2

DeepSeek

DeepSeek VL2 是 DeepSeek 旗下的 底座与基础模型 产品,主打 官方模型,常见标签包括 底座模型、API、国内生态。

闭源/平台模型开放 / 平台分发API
底座模型API国内生态
官方模型

Gemini 1.5 Flash

Google DeepMind

Gemini 1.5 Flash 是 Google DeepMind 旗下的 底座与基础模型 产品,主打 官方模型,常见标签包括 底座模型、API、多模态。

闭源/平台模型开放 / 平台分发API
底座模型API多模态
官方模型

Gemini 1.5 Pro

Google DeepMind

Gemini 1.5 Pro 是 Google DeepMind 旗下的 底座与基础模型 产品,主打 官方模型,常见标签包括 底座模型、API、多模态。

闭源/平台模型开放 / 平台分发API
底座模型API多模态
官方模型

Gemini 2.0 Flash

Google DeepMind

Gemini 2.0 Flash 是 Google DeepMind 旗下的 底座与基础模型 产品,主打 官方模型,常见标签包括 底座模型、API、多模态。

闭源/平台模型开放 / 平台分发API
底座模型API多模态
官方模型

Gemini 2.0 Flash Lite

Google DeepMind

Gemini 2.0 Flash Lite 是 Google DeepMind 旗下的 底座与基础模型 产品,主打 官方模型,常见标签包括 底座模型、API、多模态。

闭源/平台模型开放 / 平台分发API
底座模型API多模态
官方模型

Gemini 2.0 Flash Live

Google DeepMind

Gemini 2.0 Flash Live 是 Google DeepMind 旗下的 底座与基础模型 产品,主打 官方模型,常见标签包括 底座模型、API、多模态。

闭源/平台模型开放 / 平台分发API
底座模型API多模态
多模态模型家族

Gemini Models

Google DeepMind

Gemini Models 是 Google DeepMind 旗下的 底座与基础模型 产品,主打 多模态模型家族,常见标签包括 底座模型、多模态。

闭源/平台模型开放 / 平台分发无 API
底座模型多模态
GLM 模型家族

GLM Models

智谱 AI

GLM Models 汇总智谱 AI 的中文模型家族、推理能力和开放平台入口,适合作为国内模型能力总览。

闭源/平台模型开放 / 平台分发无 API
底座模型国内生态多模态
官方模型

GLM-4V 9B

智谱 AI

GLM-4V 9B 是 智谱 AI 旗下的 底座与基础模型 产品,主打 官方模型,常见标签包括 底座模型、API、国内生态。

开源/自部署开源免费 / 自部署API
底座模型API国内生态
官方模型

GPT Image 1

OpenAI

GPT Image 1 是 OpenAI 旗下的 底座与基础模型 产品,主打 官方模型,常见标签包括 底座模型、API、多模态。

闭源/平台模型开放 / 平台分发API
底座模型API多模态
通用多模态模型

GPT-4.1

OpenAI

GPT-4.1 是 OpenAI 旗下的 底座与基础模型 产品,主打 通用多模态模型,常见标签包括 底座模型、多模态。

闭源/平台模型开放 / 平台分发无 API
底座模型多模态
官方模型

GPT-4o mini

OpenAI

GPT-4o mini 是 OpenAI 旗下的 底座与基础模型 产品,主打 官方模型,常见标签包括 底座模型、API、多模态。

闭源/平台模型开放 / 平台分发API
底座模型API多模态
官方模型

GPT-4o mini Realtime

OpenAI

GPT-4o mini Realtime 是 OpenAI 旗下的 底座与基础模型 产品,主打 官方模型,常见标签包括 底座模型、API、多模态。

闭源/平台模型开放 / 平台分发API
底座模型API多模态
官方模型

GPT-4o Realtime

OpenAI

GPT-4o Realtime 是 OpenAI 旗下的 底座与基础模型 产品,主打 官方模型,常见标签包括 底座模型、API、多模态。

闭源/平台模型开放 / 平台分发API
底座模型API多模态
开源模型

Granite Vision 3.2

IBM

Granite Vision 3.2 是 IBM 旗下的 底座与基础模型 产品,主打 开源模型,常见标签包括 底座模型、开源、多模态。

开源/自部署开源免费 / 自部署无 API
底座模型开源多模态
官方模型

Grok 2 Vision

xAI

Grok 2 Vision 是 xAI 旗下的 底座与基础模型 产品,主打 官方模型,常见标签包括 底座模型、API、多模态。

闭源/平台模型开放 / 平台分发API
底座模型API多模态
官方模型

Grok Live

xAI

Grok Live 是 xAI 旗下的 底座与基础模型 产品,主打 官方模型,常见标签包括 底座模型、API、多模态。

闭源/平台模型开放 / 平台分发API
底座模型API多模态
推理模型家族

Grok Models

xAI

Grok Models 是 xAI 旗下的 底座与基础模型 产品,主打 推理模型家族,常见标签包括 底座模型、多模态。

闭源/平台模型开放 / 平台分发无 API
底座模型多模态
官方模型

Hailuo 02

MiniMax

Hailuo 02 是 MiniMax 旗下的 底座与基础模型 产品,主打 官方模型,常见标签包括 底座模型、API、国内生态。

闭源/平台模型开放 / 平台分发API
底座模型API国内生态
官方模型

Hailuo Video 01

MiniMax

Hailuo Video 01 是 MiniMax 旗下的 底座与基础模型 产品,主打 官方模型,常见标签包括 底座模型、API、国内生态。

闭源/平台模型开放 / 平台分发API
底座模型API国内生态
官方模型

Hunyuan 3D 2.0

腾讯混元

Hunyuan 3D 2.0 是 腾讯混元 旗下的 底座与基础模型 产品,主打 官方模型,常见标签包括 底座模型、API、国内生态。

闭源/平台模型开放 / 平台分发API
底座模型API国内生态
官方模型

Hunyuan Video

腾讯混元

Hunyuan Video 是 腾讯混元 旗下的 底座与基础模型 产品,主打 官方模型,常见标签包括 底座模型、API、国内生态。

闭源/平台模型开放 / 平台分发API
底座模型API国内生态
官方模型

Hunyuan Vision

腾讯混元

Hunyuan Vision 是 腾讯混元 旗下的 底座与基础模型 产品,主打 官方模型,常见标签包括 底座模型、API、国内生态。

闭源/平台模型开放 / 平台分发API
底座模型API国内生态
图片生成

Imagen 3

Google DeepMind

Imagen 3 是 Google DeepMind 旗下的 AI 绘图 产品,主打 图片生成,常见标签包括 图片生成、多模态。

闭源/平台免费 / 付费无 API
图片生成多模态
官方模型

Imagen 4

Google DeepMind

Imagen 4 是 Google DeepMind 旗下的 底座与基础模型 产品,主打 官方模型,常见标签包括 底座模型、API、多模态。

闭源/平台模型开放 / 平台分发API
底座模型API多模态
开放模型家族

Llama

Meta

Llama 是 Meta 旗下的 底座与基础模型 产品,主打 开放模型家族,常见标签包括 底座模型、多模态、开源。

开源/自部署开源免费 / 自部署无 API
底座模型多模态开源
开源模型

Llama 3.2 11B Vision

Meta

Llama 3.2 11B Vision 是 Meta 旗下的 底座与基础模型 产品,主打 开源模型,常见标签包括 底座模型、开源、多模态。

开源/自部署开源免费 / 自部署无 API
底座模型开源多模态
开源模型

Llama 3.2 90B Vision

Meta

Llama 3.2 90B Vision 是 Meta 旗下的 底座与基础模型 产品,主打 开源模型,常见标签包括 底座模型、开源、多模态。

开源/自部署开源免费 / 自部署无 API
底座模型开源多模态
开源模型

Llama 4 Maverick

Meta

Llama 4 Maverick 是 Meta 旗下的 底座与基础模型 产品,主打 开源模型,常见标签包括 底座模型、开源、多模态。

开源/自部署开源免费 / 自部署无 API
底座模型开源多模态
开源模型

Llama 4 Scout

Meta

Llama 4 Scout 是 Meta 旗下的 底座与基础模型 产品,主打 开源模型,常见标签包括 底座模型、开源、多模态。

开源/自部署开源免费 / 自部署无 API
底座模型开源多模态
官方模型

MedGemma

Google DeepMind

MedGemma 是 Google DeepMind 旗下的 底座与基础模型 产品,主打 官方模型,常见标签包括 底座模型、API、开源。

开源/自部署开源免费 / 自部署API
底座模型API开源
多模态平台

MiniMax

MiniMax

MiniMax 是 MiniMax 提供的国内大模型产品,主打多模态平台方向,可直接进入官网查看能力与使用方式。

闭源/平台免费 / 订阅API
国内模型API多模态
推理模型家族

Nemotron

NVIDIA

Nemotron 是 NVIDIA 旗下的 底座与基础模型 产品,主打 推理模型家族,常见标签包括 底座模型、多模态。

闭源/平台模型开放 / 平台分发无 API
底座模型多模态
闭源模型家族

OpenAI Models

OpenAI

OpenAI Models 汇总 OpenAI 的主力基础模型、推理模型、实时模型与嵌入能力入口,适合做总览页。

闭源/平台模型开放 / 平台分发无 API
底座模型Chat多模态
官方模型

PaddleOCR-VL

百度文心

PaddleOCR-VL 是 百度文心 旗下的 底座与基础模型 产品,主打 官方模型,常见标签包括 底座模型、API、国内生态。

开源/自部署开源免费 / 自部署API
底座模型API国内生态
开源模型

Phi-3.5 Vision

Microsoft

Phi-3.5 Vision 是 Microsoft 旗下的 底座与基础模型 产品,主打 开源模型,常见标签包括 底座模型、开源、多模态。

开源/自部署开源免费 / 自部署无 API
底座模型开源多模态
开源模型

Phi-4 Multimodal

Microsoft

Phi-4 Multimodal 是 Microsoft 旗下的 底座与基础模型 产品,主打 开源模型,常见标签包括 底座模型、开源、多模态。

开源/自部署开源免费 / 自部署无 API
底座模型开源多模态
官方模型

Pixtral 12B

Mistral AI

Pixtral 12B 是 Mistral AI 旗下的 底座与基础模型 产品,主打 官方模型,常见标签包括 底座模型、API、多模态。

开源/自部署开源免费 / 自部署API
底座模型API多模态
开源模型

QVQ-72B Preview

阿里通义

QVQ-72B Preview 是 阿里通义 旗下的 底座与基础模型 产品,主打 开源模型,常见标签包括 底座模型、国内生态、开源。

开源/自部署开源免费 / 自部署无 API
底座模型国内生态开源
开放模型家族

Qwen

阿里通义

Qwen 是目前最完整的国产开源模型家族之一,覆盖文本、视觉、音频、代码与全模态方向。

开源/自部署开源免费 / 自部署无 API
底座模型多模态开源
开源模型

Qwen2.5 Audio 7B

阿里通义

Qwen2.5 Audio 7B 是 阿里通义 旗下的 底座与基础模型 产品,主打 开源模型,常见标签包括 底座模型、国内生态、开源。

开源/自部署开源免费 / 自部署无 API
底座模型国内生态开源
开源模型

Qwen2.5 Omni 7B

阿里通义

Qwen2.5 Omni 7B 是 阿里通义 旗下的 底座与基础模型 产品,主打 开源模型,常见标签包括 底座模型、国内生态、开源。

开源/自部署开源免费 / 自部署无 API
底座模型国内生态开源
开源模型

Qwen2.5 VL 72B

阿里通义

Qwen2.5 VL 72B 是 阿里通义 旗下的 底座与基础模型 产品,主打 开源模型,常见标签包括 底座模型、国内生态、开源。

开源/自部署开源免费 / 自部署无 API
底座模型国内生态开源
开源模型

Qwen2.5 VL 7B

阿里通义

Qwen2.5 VL 7B 是 阿里通义 旗下的 底座与基础模型 产品,主打 开源模型,常见标签包括 底座模型、国内生态、开源。

开源/自部署开源免费 / 自部署无 API
底座模型国内生态开源
底座模型家族

Seed Models

字节 Seed

Seed Models 聚合字节系底座模型与多模态能力入口,重点在企业级产品化和内容场景落地。

闭源/平台模型开放 / 平台分发无 API
底座模型多模态国内生态
多模态模型平台

SenseNova

商汤科技

SenseNova 是 商汤科技 旗下的 底座与基础模型 产品,主打 多模态模型平台,常见标签包括 底座模型、多模态、国内生态。

闭源/平台模型开放 / 平台分发无 API
底座模型多模态国内生态
官方模型

SenseNova 3D

商汤日日新

SenseNova 3D 是 商汤日日新 旗下的 底座与基础模型 产品,主打 官方模型,常见标签包括 底座模型、API、国内生态。

闭源/平台模型开放 / 平台分发API
底座模型API国内生态
官方模型

SenseNova Vision

商汤日日新

SenseNova Vision 是 商汤日日新 旗下的 底座与基础模型 产品,主打 官方模型,常见标签包括 底座模型、API、国内生态。

闭源/平台模型开放 / 平台分发API
底座模型API国内生态
开源模型

SmolVLM 500M

Hugging Face

SmolVLM 500M 是 Hugging Face 旗下的 底座与基础模型 产品,主打 开源模型,常见标签包括 底座模型、开源、多模态。

开源/自部署开源免费 / 自部署无 API
底座模型开源多模态
开源模型

SmolVLM2 2.2B

Hugging Face

SmolVLM2 2.2B 是 Hugging Face 旗下的 底座与基础模型 产品,主打 开源模型,常见标签包括 底座模型、开源、多模态。

开源/自部署开源免费 / 自部署无 API
底座模型开源多模态
文生视频模型

Sora

OpenAI

Sora 是 OpenAI 旗下的 AI 视频 产品,主打 文生视频模型,常见标签包括 多模态、视频编辑。

闭源/平台免费试用 / 订阅无 API
多模态视频编辑
官方模型

Step 1V

阶跃星辰

Step 1V 是 阶跃星辰 旗下的 底座与基础模型 产品,主打 官方模型,常见标签包括 底座模型、API、国内生态。

闭源/平台模型开放 / 平台分发API
底座模型API国内生态
官方模型

Step Audio

阶跃星辰

Step Audio 是 阶跃星辰 旗下的 底座与基础模型 产品,主打 官方模型,常见标签包括 底座模型、API、国内生态。

闭源/平台模型开放 / 平台分发API
底座模型API国内生态
官方模型

Step R1 V Mini

阶跃星辰

Step R1 V Mini 是 阶跃星辰 旗下的 底座与基础模型 产品,主打 官方模型,常见标签包括 底座模型、API、国内生态。

闭源/平台模型开放 / 平台分发API
底座模型API国内生态
官方模型

Step Video I2V

阶跃星辰

Step Video I2V 是 阶跃星辰 旗下的 底座与基础模型 产品,主打 官方模型,常见标签包括 底座模型、API、国内生态。

闭源/平台模型开放 / 平台分发API
底座模型API国内生态
官方模型

Step Video T2V

阶跃星辰

Step Video T2V 是 阶跃星辰 旗下的 底座与基础模型 产品,主打 官方模型,常见标签包括 底座模型、API、国内生态。

闭源/平台模型开放 / 平台分发API
底座模型API国内生态
视频模型

Veo

Google DeepMind

Veo 是 Google DeepMind 旗下的 AI 视频 产品,主打 视频模型,常见标签包括 多模态、视频编辑。

闭源/平台免费试用 / 订阅无 API
多模态视频编辑
视频生成

Veo 2

Google DeepMind

Veo 2 是 Google DeepMind 旗下的 AI 视频 产品,主打 视频生成,常见标签包括 视频编辑、多模态。

闭源/平台免费试用 / 订阅无 API
视频编辑多模态
官方模型

Veo 3

Google DeepMind

Veo 3 是 Google DeepMind 旗下的 底座与基础模型 产品,主打 官方模型,常见标签包括 底座模型、API、多模态。

闭源/平台模型开放 / 平台分发API
底座模型API多模态
官方模型

Voxtral Mini

Mistral AI

Voxtral Mini 是 Mistral AI 旗下的 底座与基础模型 产品,主打 官方模型,常见标签包括 底座模型、API、多模态。

闭源/平台模型开放 / 平台分发API
底座模型API多模态
官方模型

Voxtral Small

Mistral AI

Voxtral Small 是 Mistral AI 旗下的 底座与基础模型 产品,主打 官方模型,常见标签包括 底座模型、API、多模态。

闭源/平台模型开放 / 平台分发API
底座模型API多模态
官方模型

Yi Vision

零一万物

Yi Vision 是 零一万物 旗下的 底座与基础模型 产品,主打 官方模型,常见标签包括 底座模型、API、国内生态。

闭源/平台模型开放 / 平台分发API
底座模型API国内生态
选择指南

多模态模型如何选

  • 先确认输入类型:图文理解、视频理解、语音理解不是同一能力,必须按真实输入筛。
  • 评估时优先看识别准确率和上下文长度,再看是否支持多轮混合输入。
  • 如果是接入场景,重点看 API 延迟、图像大小限制和批量处理能力。
  • 商用前必须确认隐私、上传保留策略和多媒体内容合规。

多模态模型 分类页最值得先看什么?

建议先看官网入口、价格方式、是否支持 API、开闭源状态与典型场景。