实时多模态模型GPT-4o
GPT-4o 是 OpenAI 旗下的 底座与基础模型 产品,主打 实时多模态模型,常见标签包括 底座模型、多模态。
实时多模态模型GPT-4o 是 OpenAI 旗下的 底座与基础模型 产品,主打 实时多模态模型,常见标签包括 底座模型、多模态。
旗舰多模态模型Gemini 2.5 Pro 是 Google DeepMind 旗下的 底座与基础模型 产品,主打 旗舰多模态模型,常见标签包括 底座模型、多模态。
轻量多模态模型Gemini 2.5 Flash 是 Google DeepMind 旗下的 底座与基础模型 产品,主打 轻量多模态模型,常见标签包括 底座模型、多模态。
高端推理模型Claude Opus 4 是 Anthropic 旗下的 底座与基础模型 产品,主打 高端推理模型,常见标签包括 底座模型、多模态。
主力推理模型Claude Sonnet 4 是 Anthropic 旗下的 底座与基础模型 产品,主打 主力推理模型,常见标签包括 底座模型、多模态。
全模态模型Qwen Omni 是 阿里通义 旗下的 底座与基础模型 产品,主打 全模态模型,常见标签包括 底座模型、多模态、开源。
多模态家族Qwen VL 是 阿里通义 旗下的 底座与基础模型 产品,主打 多模态家族,常见标签包括 底座模型、多模态、开源。
音频理解模型Qwen Audio 是 阿里通义 旗下的 底座与基础模型 产品,主打 音频理解模型,常见标签包括 底座模型、多模态、开源。
开源多模态DeepSeek VL 是 DeepSeek 旗下的 底座与基础模型 产品,主打 开源多模态,常见标签包括 底座模型、多模态、开源。
多模态推理模型Seed 1.5 是 字节 Seed 旗下的 底座与基础模型 产品,主打 多模态推理模型,常见标签包括 底座模型、多模态、国内生态。
多模态底座Hunyuan Models 是 腾讯混元 旗下的 底座与基础模型 产品,主打 多模态底座,常见标签包括 底座模型、多模态、国内生态。
文心模型家族ERNIE Models 是 百度文心 旗下的 底座与基础模型 产品,主打 文心模型家族,常见标签包括 底座模型、国内生态。
多模态模型家族MiniMax Models 适合查看 MiniMax 在文本、语音、视频和全球化产品层面的完整布局。
多模态模型家族Step Models 是 阶跃星辰 旗下的 底座与基础模型 产品,主打 多模态模型家族,常见标签包括 底座模型、多模态、国内生态。
视频生成模型Wan 2.1 是 阿里通义 旗下的 底座与基础模型 产品,主打 视频生成模型,常见标签包括 底座模型、多模态、开源。
视频生成模型CogVideoX 是 智谱 AI 旗下的 底座与基础模型 产品,主打 视频生成模型,常见标签包括 底座模型、多模态、开源。
视频生成模型Sora 2 是 OpenAI 旗下的 底座与基础模型 产品,主打 视频生成模型,常见标签包括 底座模型、多模态。
图像生成模型GPT Image 1.5 是 OpenAI 旗下的 底座与基础模型 产品,主打 图像生成模型,常见标签包括 底座模型、多模态。
视觉语言模型InternVL 是 OpenGVLab 旗下的 底座与基础模型 产品,主打 视觉语言模型,常见标签包括 底座模型、多模态、开源。
轻量多模态MiniCPM-V 是 OpenBMB 旗下的 底座与基础模型 产品,主打 轻量多模态,常见标签包括 底座模型、多模态、开源。
视觉语言模型Pixtral 是 Mistral AI 旗下的 底座与基础模型 产品,主打 视觉语言模型,常见标签包括 底座模型、多模态。
多模态基座PaliGemma 是 Google 旗下的 底座与基础模型 产品,主打 多模态基座,常见标签包括 底座模型、多模态、开源。
开源多模态Molmo 是 Allen AI 旗下的 底座与基础模型 产品,主打 开源多模态,常见标签包括 底座模型、多模态、开源。
视觉语言基础模型Florence-2 是 Microsoft 旗下的 底座与基础模型 产品,主打 视觉语言基础模型,常见标签包括 底座模型、多模态、开源。
官方热门ChatGPT 是 OpenAI 面向大众的主力 AI 助手入口,核心价值在于把通用问答、写作、搜索、文件分析和多模态交互做成统一产品体验。
Gemini 是 Google 面向大众的 AI 入口之一,真正的优势不只是聊天,而是和搜索、Google Workspace、Android 与多模态能力的联动。
长文强项Claude 是 Anthropic 面向终端用户的主力助手产品,最突出的标签不是聊天,而是长文本处理、稳健写作、文档理解和企业安全感。
Grok 是 xAI 提供的文本大模型产品,主打实时信息方向,可直接进入官网查看能力与使用方式。
Kimi 是 Moonshot AI 面向中文用户最有代表性的产品页之一,核心标签是长上下文、中文体验和资料整理能力。
国民助手豆包是字节体系面向大众的 AI 入口,价值在于国民化产品体验、中文使用门槛低,以及和字节内容生态的联动潜力。
阿里系通义千问是阿里系面向终端用户的主入口之一,背后真正重要的是它与 Qwen 模型家族、阿里云平台和企业生态的连接关系。
推理热门DeepSeek 是当前国内关注度最高的推理型 AI 助手之一,核心看点不是花哨功能,而是推理表现、响应质量和价格效率。
腾讯系通过描述生成UI设计稿
清华系通过描述生成UI设计稿
官方模型Aurora Image 是 xAI 旗下的 底座与基础模型 产品,主打 官方模型,常见标签包括 底座模型、API、多模态。
官方模型Aya Vision 32B 是 Cohere 旗下的 底座与基础模型 产品,主打 官方模型,常见标签包括 底座模型、API、开源。
开源模型Chameleon 7B 是 Meta 旗下的 底座与基础模型 产品,主打 开源模型,常见标签包括 底座模型、开源、多模态。
官方模型CogView 4 是 智谱 AI 旗下的 底座与基础模型 产品,主打 官方模型,常见标签包括 底座模型、API、国内生态。
官方模型CogVLM2 是 智谱 AI 旗下的 底座与基础模型 产品,主打 官方模型,常见标签包括 底座模型、API、国内生态。
官方模型Command A Vision 是 Cohere 旗下的 底座与基础模型 产品,主打 官方模型,常见标签包括 底座模型、API、多模态。
官方模型Cosmos Predict1 是 NVIDIA 旗下的 底座与基础模型 产品,主打 官方模型,常见标签包括 底座模型、API、多模态。
官方模型Cosmos Reason1 是 NVIDIA 旗下的 底座与基础模型 产品,主打 官方模型,常见标签包括 底座模型、API、多模态。
官方模型Cosmos Transfer1 是 NVIDIA 旗下的 底座与基础模型 产品,主打 官方模型,常见标签包括 底座模型、API、多模态。
官方模型DeepSeek Janus Pro 是 DeepSeek 旗下的 底座与基础模型 产品,主打 官方模型,常见标签包括 底座模型、API、国内生态。
推理模型家族DeepSeek Models 适合查看 DeepSeek 在通用推理、深度思考、多模态与 API 成本控制上的整体布局。
官方模型DeepSeek VL2 是 DeepSeek 旗下的 底座与基础模型 产品,主打 官方模型,常见标签包括 底座模型、API、国内生态。
官方模型Gemini 1.5 Flash 是 Google DeepMind 旗下的 底座与基础模型 产品,主打 官方模型,常见标签包括 底座模型、API、多模态。
官方模型Gemini 1.5 Pro 是 Google DeepMind 旗下的 底座与基础模型 产品,主打 官方模型,常见标签包括 底座模型、API、多模态。
官方模型Gemini 2.0 Flash 是 Google DeepMind 旗下的 底座与基础模型 产品,主打 官方模型,常见标签包括 底座模型、API、多模态。
官方模型Gemini 2.0 Flash Lite 是 Google DeepMind 旗下的 底座与基础模型 产品,主打 官方模型,常见标签包括 底座模型、API、多模态。
官方模型Gemini 2.0 Flash Live 是 Google DeepMind 旗下的 底座与基础模型 产品,主打 官方模型,常见标签包括 底座模型、API、多模态。
多模态模型家族Gemini Models 是 Google DeepMind 旗下的 底座与基础模型 产品,主打 多模态模型家族,常见标签包括 底座模型、多模态。
GLM 模型家族GLM Models 汇总智谱 AI 的中文模型家族、推理能力和开放平台入口,适合作为国内模型能力总览。
官方模型GLM-4V 9B 是 智谱 AI 旗下的 底座与基础模型 产品,主打 官方模型,常见标签包括 底座模型、API、国内生态。
官方模型GPT Image 1 是 OpenAI 旗下的 底座与基础模型 产品,主打 官方模型,常见标签包括 底座模型、API、多模态。
通用多模态模型GPT-4.1 是 OpenAI 旗下的 底座与基础模型 产品,主打 通用多模态模型,常见标签包括 底座模型、多模态。
官方模型GPT-4o mini 是 OpenAI 旗下的 底座与基础模型 产品,主打 官方模型,常见标签包括 底座模型、API、多模态。
官方模型GPT-4o mini Realtime 是 OpenAI 旗下的 底座与基础模型 产品,主打 官方模型,常见标签包括 底座模型、API、多模态。
官方模型GPT-4o Realtime 是 OpenAI 旗下的 底座与基础模型 产品,主打 官方模型,常见标签包括 底座模型、API、多模态。
开源模型Granite Vision 3.2 是 IBM 旗下的 底座与基础模型 产品,主打 开源模型,常见标签包括 底座模型、开源、多模态。
官方模型Grok 2 Vision 是 xAI 旗下的 底座与基础模型 产品,主打 官方模型,常见标签包括 底座模型、API、多模态。
官方模型Grok Live 是 xAI 旗下的 底座与基础模型 产品,主打 官方模型,常见标签包括 底座模型、API、多模态。
推理模型家族Grok Models 是 xAI 旗下的 底座与基础模型 产品,主打 推理模型家族,常见标签包括 底座模型、多模态。
官方模型Hailuo 02 是 MiniMax 旗下的 底座与基础模型 产品,主打 官方模型,常见标签包括 底座模型、API、国内生态。
官方模型Hailuo Video 01 是 MiniMax 旗下的 底座与基础模型 产品,主打 官方模型,常见标签包括 底座模型、API、国内生态。
官方模型Hunyuan 3D 2.0 是 腾讯混元 旗下的 底座与基础模型 产品,主打 官方模型,常见标签包括 底座模型、API、国内生态。
官方模型Hunyuan Video 是 腾讯混元 旗下的 底座与基础模型 产品,主打 官方模型,常见标签包括 底座模型、API、国内生态。
官方模型Hunyuan Vision 是 腾讯混元 旗下的 底座与基础模型 产品,主打 官方模型,常见标签包括 底座模型、API、国内生态。
图片生成Imagen 3 是 Google DeepMind 旗下的 AI 绘图 产品,主打 图片生成,常见标签包括 图片生成、多模态。
官方模型Imagen 4 是 Google DeepMind 旗下的 底座与基础模型 产品,主打 官方模型,常见标签包括 底座模型、API、多模态。
开放模型家族Llama 是 Meta 旗下的 底座与基础模型 产品,主打 开放模型家族,常见标签包括 底座模型、多模态、开源。
开源模型Llama 3.2 11B Vision 是 Meta 旗下的 底座与基础模型 产品,主打 开源模型,常见标签包括 底座模型、开源、多模态。
开源模型Llama 3.2 90B Vision 是 Meta 旗下的 底座与基础模型 产品,主打 开源模型,常见标签包括 底座模型、开源、多模态。
开源模型Llama 4 Maverick 是 Meta 旗下的 底座与基础模型 产品,主打 开源模型,常见标签包括 底座模型、开源、多模态。
开源模型Llama 4 Scout 是 Meta 旗下的 底座与基础模型 产品,主打 开源模型,常见标签包括 底座模型、开源、多模态。
官方模型MedGemma 是 Google DeepMind 旗下的 底座与基础模型 产品,主打 官方模型,常见标签包括 底座模型、API、开源。
MiniMax 是 MiniMax 提供的国内大模型产品,主打多模态平台方向,可直接进入官网查看能力与使用方式。
推理模型家族Nemotron 是 NVIDIA 旗下的 底座与基础模型 产品,主打 推理模型家族,常见标签包括 底座模型、多模态。
闭源模型家族OpenAI Models 汇总 OpenAI 的主力基础模型、推理模型、实时模型与嵌入能力入口,适合做总览页。
官方模型PaddleOCR-VL 是 百度文心 旗下的 底座与基础模型 产品,主打 官方模型,常见标签包括 底座模型、API、国内生态。
开源模型Phi-3.5 Vision 是 Microsoft 旗下的 底座与基础模型 产品,主打 开源模型,常见标签包括 底座模型、开源、多模态。
开源模型Phi-4 Multimodal 是 Microsoft 旗下的 底座与基础模型 产品,主打 开源模型,常见标签包括 底座模型、开源、多模态。
官方模型Pixtral 12B 是 Mistral AI 旗下的 底座与基础模型 产品,主打 官方模型,常见标签包括 底座模型、API、多模态。
开源模型QVQ-72B Preview 是 阿里通义 旗下的 底座与基础模型 产品,主打 开源模型,常见标签包括 底座模型、国内生态、开源。
开放模型家族Qwen 是目前最完整的国产开源模型家族之一,覆盖文本、视觉、音频、代码与全模态方向。
Qwen2.5 Audio 7B 是 阿里通义 旗下的 底座与基础模型 产品,主打 开源模型,常见标签包括 底座模型、国内生态、开源。
Qwen2.5 Omni 7B 是 阿里通义 旗下的 底座与基础模型 产品,主打 开源模型,常见标签包括 底座模型、国内生态、开源。
Qwen2.5 VL 72B 是 阿里通义 旗下的 底座与基础模型 产品,主打 开源模型,常见标签包括 底座模型、国内生态、开源。
Qwen2.5 VL 7B 是 阿里通义 旗下的 底座与基础模型 产品,主打 开源模型,常见标签包括 底座模型、国内生态、开源。
底座模型家族Seed Models 聚合字节系底座模型与多模态能力入口,重点在企业级产品化和内容场景落地。
多模态模型平台SenseNova 是 商汤科技 旗下的 底座与基础模型 产品,主打 多模态模型平台,常见标签包括 底座模型、多模态、国内生态。
官方模型SenseNova 3D 是 商汤日日新 旗下的 底座与基础模型 产品,主打 官方模型,常见标签包括 底座模型、API、国内生态。
官方模型SenseNova Vision 是 商汤日日新 旗下的 底座与基础模型 产品,主打 官方模型,常见标签包括 底座模型、API、国内生态。
开源模型SmolVLM 500M 是 Hugging Face 旗下的 底座与基础模型 产品,主打 开源模型,常见标签包括 底座模型、开源、多模态。
开源模型SmolVLM2 2.2B 是 Hugging Face 旗下的 底座与基础模型 产品,主打 开源模型,常见标签包括 底座模型、开源、多模态。
文生视频模型Sora 是 OpenAI 旗下的 AI 视频 产品,主打 文生视频模型,常见标签包括 多模态、视频编辑。
官方模型Step 1V 是 阶跃星辰 旗下的 底座与基础模型 产品,主打 官方模型,常见标签包括 底座模型、API、国内生态。
官方模型Step Audio 是 阶跃星辰 旗下的 底座与基础模型 产品,主打 官方模型,常见标签包括 底座模型、API、国内生态。
官方模型Step R1 V Mini 是 阶跃星辰 旗下的 底座与基础模型 产品,主打 官方模型,常见标签包括 底座模型、API、国内生态。
官方模型Step Video I2V 是 阶跃星辰 旗下的 底座与基础模型 产品,主打 官方模型,常见标签包括 底座模型、API、国内生态。
官方模型Step Video T2V 是 阶跃星辰 旗下的 底座与基础模型 产品,主打 官方模型,常见标签包括 底座模型、API、国内生态。
视频模型Veo 是 Google DeepMind 旗下的 AI 视频 产品,主打 视频模型,常见标签包括 多模态、视频编辑。
视频生成Veo 2 是 Google DeepMind 旗下的 AI 视频 产品,主打 视频生成,常见标签包括 视频编辑、多模态。
官方模型Veo 3 是 Google DeepMind 旗下的 底座与基础模型 产品,主打 官方模型,常见标签包括 底座模型、API、多模态。
官方模型Voxtral Mini 是 Mistral AI 旗下的 底座与基础模型 产品,主打 官方模型,常见标签包括 底座模型、API、多模态。
官方模型Voxtral Small 是 Mistral AI 旗下的 底座与基础模型 产品,主打 官方模型,常见标签包括 底座模型、API、多模态。
官方模型Yi Vision 是 零一万物 旗下的 底座与基础模型 产品,主打 官方模型,常见标签包括 底座模型、API、国内生态。
建议先看官网入口、价格方式、是否支持 API、开闭源状态与典型场景。