ASR 语音识别

企业语音服务

Alibaba Cloud Speech

阿里云

Alibaba Cloud Speech 是 阿里云 旗下的 ASR 语音识别 产品,主打 企业语音服务,常见标签包括 ASR、语音 API、国内生态。

闭源/平台免费试用 / 按量计费API
ASR语音 API国内生态
云端转写

Amazon Transcribe

AWS

Amazon Transcribe 是 AWS 旗下的 ASR 语音识别 产品,主打 云端转写,常见标签包括 ASR、语音 API、API。

闭源/平台免费试用 / 按量计费API
ASR语音 APIAPI
转写平台

AssemblyAI

AssemblyAI

AssemblyAI 是 AssemblyAI 旗下的 ASR 语音识别 产品,主打 转写平台,常见标签包括 ASR、语音 API、API。

闭源/平台免费试用 / 按量计费API
ASR语音 APIAPI
企业语音服务

Azure AI Speech

Microsoft

Azure AI Speech 是 Microsoft 旗下的 ASR 语音识别 产品,主打 企业语音服务,常见标签包括 ASR、语音 API、API。

闭源/平台免费试用 / 按量计费API
ASR语音 APIAPI
云端识别

Baidu Speech

百度智能云

Baidu Speech 是 百度智能云 旗下的 ASR 语音识别 产品,主打 云端识别,常见标签包括 ASR、语音 API、国内生态。

闭源/平台免费试用 / 按量计费API
ASR语音 API国内生态
语音识别

Canary 1B

NVIDIA

Canary 1B 是 NVIDIA 旗下的 ASR 语音识别 产品,主打 语音识别,常见标签包括 ASR、开源。

开源/自部署开源免费 / 自部署API
ASR开源
官方模型

Cohere Transcribe

Cohere

Cohere Transcribe 是 Cohere 旗下的 底座与基础模型 产品,主打 官方模型,常见标签包括 底座模型、API、ASR。

闭源/平台模型开放 / 平台分发API
底座模型APIASR
语音 API

Deepgram

Deepgram

Deepgram 是 Deepgram 旗下的 ASR 语音识别 产品,主打 语音 API,常见标签包括 ASR、语音 API、实时识别。

闭源/平台免费试用 / 按量计费API
ASR语音 API实时识别
音视频编辑

Descript

Descript

Descript makes editing video and audio as easy as editing text.

闭源/平台免费 / 订阅无 API
语音音频ASRAI 音乐
会议转写

Fireflies AI

Fireflies

Fireflies AI 是 Fireflies 旗下的 ASR 语音识别 产品,主打 会议转写,常见标签包括 ASR、工作流、知识库。

闭源/平台免费试用 / 按量计费API
ASR工作流知识库
语音识别框架

FunASR

阿里通义

FunASR 是 阿里通义 旗下的 ASR 语音识别 产品,主打 语音识别框架,常见标签包括 ASR、开源、国内生态。

开源/自部署开源免费 / 自部署API
ASR开源国内生态
多语种转写

Gladia

Gladia

Gladia 是 Gladia 旗下的 ASR 语音识别 产品,主打 多语种转写,常见标签包括 ASR、语音 API、API。

闭源/平台免费试用 / 按量计费API
ASR语音 APIAPI
云端识别

Google Cloud Speech-to-Text

Google

Google Cloud Speech-to-Text 是 Google 旗下的 ASR 语音识别 产品,主打 云端识别,常见标签包括 ASR、语音 API、API。

闭源/平台免费试用 / 按量计费API
ASR语音 APIAPI
官方模型

GPT-4o mini Transcribe

OpenAI

GPT-4o mini Transcribe 是 OpenAI 旗下的 底座与基础模型 产品,主打 官方模型,常见标签包括 底座模型、API、ASR。

闭源/平台模型开放 / 平台分发API
底座模型APIASR
官方模型

GPT-4o Transcribe

OpenAI

GPT-4o Transcribe 是 OpenAI 旗下的 底座与基础模型 产品,主打 官方模型,常见标签包括 底座模型、API、ASR。

闭源/平台模型开放 / 平台分发API
底座模型APIASR
开源模型

Granite Speech 3.3

IBM

Granite Speech 3.3 是 IBM 旗下的 底座与基础模型 产品,主打 开源模型,常见标签包括 底座模型、开源、ASR。

开源/自部署开源免费 / 自部署无 API
底座模型开源ASR
中文语音识别

iFlytek Open Platform

科大讯飞

iFlytek Open Platform 是 科大讯飞 旗下的 ASR 语音识别 产品,主打 中文语音识别,常见标签包括 ASR、语音 API、国内生态。

闭源/平台免费试用 / 按量计费API
ASR语音 API国内生态
语音识别

Kyutai STT 1B

Kyutai

Kyutai STT 1B 是 Kyutai 旗下的 ASR 语音识别 产品,主打 语音识别,常见标签包括 ASR、开源。

开源/自部署开源免费 / 自部署API
ASR开源
开源 ASR

Moonshine ASR

Moonshine

Moonshine ASR 是 Moonshine 旗下的 ASR 语音识别 产品,主打 开源 ASR,常见标签包括 ASR、开源。

开源/自部署开源免费 / 自部署API
ASR开源
会议记录

Otter AI

Otter

Otter AI 是 Otter 旗下的 办公与工作流 产品,主打 会议记录,常见标签包括 工作流、ASR。

闭源/平台免费 / 付费无 API
工作流ASR
官方模型

Parakeet CTC 1.1B

NVIDIA

Parakeet CTC 1.1B 是 NVIDIA 旗下的 底座与基础模型 产品,主打 官方模型,常见标签包括 底座模型、API、ASR。

闭源/平台模型开放 / 平台分发API
底座模型APIASR
语音识别

Parakeet RNNT 1.1B

NVIDIA

Parakeet RNNT 1.1B 是 NVIDIA 旗下的 ASR 语音识别 产品,主打 语音识别,常见标签包括 ASR、开源。

开源/自部署开源免费 / 自部署API
ASR开源
会议效率

Read AI

Read AI

Read AI 是 Read AI 旗下的 办公与工作流 产品,主打 会议效率,常见标签包括 工作流、ASR。

闭源/平台免费 / 付费无 API
工作流ASR
语音识别 API

Rev AI

Rev

Rev AI 是 Rev 旗下的 ASR 语音识别 产品,主打 语音识别 API,常见标签包括 ASR、语音 API、API。

闭源/平台免费试用 / 按量计费API
ASR语音 APIAPI
多语语音识别

SeamlessM4T

Meta

SeamlessM4T 是 Meta 旗下的 ASR 语音识别 产品,主打 多语语音识别,常见标签包括 ASR、开源。

开源/自部署开源免费 / 自部署API
ASR开源
开源语音识别

SenseVoice

阿里通义

SenseVoice 是 阿里通义 旗下的 ASR 语音识别 产品,主打 开源语音识别,常见标签包括 ASR、开源、国内生态。

开源/自部署开源免费 / 自部署API
ASR开源国内生态
官方模型

SenseVoice Large

商汤日日新

SenseVoice Large 是 商汤日日新 旗下的 底座与基础模型 产品,主打 官方模型,常见标签包括 底座模型、API、国内生态。

闭源/平台模型开放 / 平台分发API
底座模型API国内生态
开源 ASR

Sherpa ONNX ASR

Sherpa

Sherpa ONNX ASR 是 Sherpa 旗下的 ASR 语音识别 产品,主打 开源 ASR,常见标签包括 ASR、开源。

开源/自部署开源免费 / 自部署API
ASR开源
低延迟转写

Soniox

Soniox

Soniox 是 Soniox 旗下的 ASR 语音识别 产品,主打 低延迟转写,常见标签包括 ASR、实时识别、语音 API。

闭源/平台免费试用 / 按量计费API
ASR实时识别语音 API
开源 ASR

SpeechBrain ASR

SpeechBrain

SpeechBrain ASR 是 SpeechBrain 旗下的 ASR 语音识别 产品,主打 开源 ASR,常见标签包括 ASR、开源。

开源/自部署开源免费 / 自部署API
ASR开源
企业级识别

Speechmatics

Speechmatics

Speechmatics 是 Speechmatics 旗下的 ASR 语音识别 产品,主打 企业级识别,常见标签包括 ASR、语音 API、API。

闭源/平台免费试用 / 按量计费API
ASR语音 APIAPI
语音识别 API

Tencent Cloud ASR

腾讯云

Tencent Cloud ASR 是 腾讯云 旗下的 ASR 语音识别 产品,主打 语音识别 API,常见标签包括 ASR、语音 API、国内生态。

闭源/平台免费试用 / 按量计费API
ASR语音 API国内生态
会议效率

tl;dv

tl;dv

tl;dv 是 tl;dv 旗下的 办公与工作流 产品,主打 会议效率,常见标签包括 工作流、ASR。

闭源/平台免费 / 付费无 API
工作流ASR
官方模型

Voxtral Mini Transcribe

Mistral AI

Voxtral Mini Transcribe 是 Mistral AI 旗下的 底座与基础模型 产品,主打 官方模型,常见标签包括 底座模型、API、ASR。

闭源/平台模型开放 / 平台分发API
底座模型APIASR
开源识别

Whisper

OpenAI

Whisper 是 OpenAI 旗下的 ASR 语音识别 产品,主打 开源识别,常见标签包括 ASR、开源。

开源/自部署开源免费 / 自部署API
ASR开源
开源 ASR

Whisper Large V3

OpenAI

Whisper Large V3 是 OpenAI 旗下的 ASR 语音识别 产品,主打 开源 ASR,常见标签包括 ASR、开源。

开源/自部署开源免费 / 自部署API
ASR开源
开源 ASR

Whisper Large V3 Turbo

OpenAI

Whisper Large V3 Turbo 是 OpenAI 旗下的 ASR 语音识别 产品,主打 开源 ASR,常见标签包括 ASR、开源。

开源/自部署开源免费 / 自部署API
ASR开源
选择指南

ASR 语音识别如何选

  • 先按音频环境筛:会议、客服、电话、访谈、短视频,不同模型鲁棒性差很多。
  • 核心指标先看错误率、说话人分离和时间轴准确度。
  • 生产接入要看实时流式、批量转写和术语热词支持。
  • 如果涉及敏感音频,再看本地部署、私有化和数据保存策略。

ASR 语音识别 分类页最值得先看什么?

建议先看官网入口、价格方式、是否支持 API、开闭源状态与典型场景。