语音音频与 AI 音乐

语音头部

ElevenLabs

ElevenLabs

ElevenLabs 是 ElevenLabs 提供的语音音频产品,主打语音头部方向,可直接进入官网查看能力与使用方式。

闭源/平台免费 / 订阅API
语音音频APITTS
AI 音乐

Suno

Suno

Suno 是 Suno 提供的语音音频产品,主打AI 音乐方向,可直接进入官网查看能力与使用方式。

闭源/平台免费 / 订阅无 API
语音音频音乐生成AI 音乐
作曲生成

AIVA

AIVA

AIVA 是 AIVA 旗下的 语音音频与 AI 音乐 产品,主打 作曲生成,常见标签包括 AI 音乐。

闭源/平台免费 / 付费无 API
AI 音乐
企业语音服务

Alibaba Cloud Speech

阿里云

Alibaba Cloud Speech 是 阿里云 旗下的 ASR 语音识别 产品,主打 企业语音服务,常见标签包括 ASR、语音 API、国内生态。

闭源/平台免费试用 / 按量计费API
ASR语音 API国内生态
企业配音

Amazon Polly

AWS

Amazon Polly 是 AWS 旗下的 TTS 与语音克隆 产品,主打 企业配音,常见标签包括 TTS、语音 API、API。

闭源/平台免费试用 / 按量计费API
TTS语音 APIAPI
云端转写

Amazon Transcribe

AWS

Amazon Transcribe 是 AWS 旗下的 ASR 语音识别 产品,主打 云端转写,常见标签包括 ASR、语音 API、API。

闭源/平台免费试用 / 按量计费API
ASR语音 APIAPI
转写平台

AssemblyAI

AssemblyAI

AssemblyAI 是 AssemblyAI 旗下的 ASR 语音识别 产品,主打 转写平台,常见标签包括 ASR、语音 API、API。

闭源/平台免费试用 / 按量计费API
ASR语音 APIAPI
AI 音乐

AudioGen Medium

Meta

AudioGen Medium 是 Meta 旗下的 语音音频与 AI 音乐 产品,主打 AI 音乐,常见标签包括 AI 音乐、开源。

开源/自部署开源免费 / 自部署无 API
AI 音乐开源
企业语音服务

Azure AI Speech

Microsoft

Azure AI Speech 是 Microsoft 旗下的 ASR 语音识别 产品,主打 企业语音服务,常见标签包括 ASR、语音 API、API。

闭源/平台免费试用 / 按量计费API
ASR语音 APIAPI
企业级语音

Azure Text to Speech

Microsoft

Azure Text to Speech 是 Microsoft 旗下的 TTS 与语音克隆 产品,主打 企业级语音,常见标签包括 TTS、语音 API、API。

闭源/平台免费试用 / 按量计费API
TTS语音 APIAPI
云端识别

Baidu Speech

百度智能云

Baidu Speech 是 百度智能云 旗下的 ASR 语音识别 产品,主打 云端识别,常见标签包括 ASR、语音 API、国内生态。

闭源/平台免费试用 / 按量计费API
ASR语音 API国内生态
版权友好音乐

Beatoven.ai

Beatoven

Beatoven.ai 是 Beatoven 旗下的 语音音频与 AI 音乐 产品,主打 版权友好音乐,常见标签包括 AI 音乐。

闭源/平台免费 / 付费无 API
AI 音乐
一键生成音乐

Boomy

Boomy

Boomy 是 Boomy 旗下的 语音音频与 AI 音乐 产品,主打 一键生成音乐,常见标签包括 AI 音乐。

闭源/平台免费 / 付费无 API
AI 音乐
语音识别

Canary 1B

NVIDIA

Canary 1B 是 NVIDIA 旗下的 ASR 语音识别 产品,主打 语音识别,常见标签包括 ASR、开源。

开源/自部署开源免费 / 自部署API
ASR开源
实时语音

Cartesia

Cartesia

Cartesia 是 Cartesia 旗下的 TTS 与语音克隆 产品,主打 实时语音,常见标签包括 TTS、语音 API、API。

闭源/平台免费试用 / 按量计费API
TTS语音 APIAPI
开源 TTS

Chatterbox TTS

Resemble AI

Chatterbox TTS 是 Resemble AI 旗下的 TTS 与语音克隆 产品,主打 开源 TTS,常见标签包括 TTS、开源。

开源/自部署开源免费 / 自部署API
TTS开源
开源 TTS

Coqui TTS

Coqui

Coqui TTS 是 Coqui 旗下的 TTS 与语音克隆 产品,主打 开源 TTS,常见标签包括 TTS、开源。

开源/自部署开源免费 / 自部署API
TTS开源
开源 TTS

CosyVoice

阿里通义

CosyVoice 是 阿里通义 旗下的 TTS 与语音克隆 产品,主打 开源 TTS,常见标签包括 TTS、开源、国内生态。

开源/自部署开源免费 / 自部署API
TTS开源国内生态
开源 TTS

CosyVoice 2

阿里通义

CosyVoice 2 是 阿里通义 旗下的 TTS 与语音克隆 产品,主打 开源 TTS,常见标签包括 TTS、开源、国内生态。

开源/自部署开源免费 / 自部署API
TTS开源国内生态
开源 TTS

CSM-1B

Sesame

CSM-1B 是 Sesame 旗下的 TTS 与语音克隆 产品,主打 开源 TTS,常见标签包括 TTS、开源。

开源/自部署开源免费 / 自部署API
TTS开源
语音 API

Deepgram

Deepgram

Deepgram 是 Deepgram 旗下的 ASR 语音识别 产品,主打 语音 API,常见标签包括 ASR、语音 API、实时识别。

闭源/平台免费试用 / 按量计费API
ASR语音 API实时识别
音视频编辑

Descript

Descript

Descript makes editing video and audio as easy as editing text.

闭源/平台免费 / 订阅无 API
语音音频ASRAI 音乐
配音本地化

Dubverse

Dubverse

Dubverse 是 Dubverse 旗下的 TTS 与语音克隆 产品,主打 配音本地化,常见标签包括 TTS、翻译、工作流。

闭源/平台免费试用 / 按量计费API
TTS翻译工作流
开源 TTS

F5-TTS

SWivid

F5-TTS 是 SWivid 旗下的 TTS 与语音克隆 产品,主打 开源 TTS,常见标签包括 TTS、开源。

开源/自部署开源免费 / 自部署API
TTS开源
会议转写

Fireflies AI

Fireflies

Fireflies AI 是 Fireflies 旗下的 ASR 语音识别 产品,主打 会议转写,常见标签包括 ASR、工作流、知识库。

闭源/平台免费试用 / 按量计费API
ASR工作流知识库
语音克隆

Fish Audio

Fish Audio

Fish Audio 是 Fish Audio 旗下的 TTS 与语音克隆 产品,主打 语音克隆,常见标签包括 TTS、语音克隆、API。

闭源/平台免费试用 / 按量计费API
TTS语音克隆API
语音识别框架

FunASR

阿里通义

FunASR 是 阿里通义 旗下的 ASR 语音识别 产品,主打 语音识别框架,常见标签包括 ASR、开源、国内生态。

开源/自部署开源免费 / 自部署API
ASR开源国内生态
多语种转写

Gladia

Gladia

Gladia 是 Gladia 旗下的 ASR 语音识别 产品,主打 多语种转写,常见标签包括 ASR、语音 API、API。

闭源/平台免费试用 / 按量计费API
ASR语音 APIAPI
云端识别

Google Cloud Speech-to-Text

Google

Google Cloud Speech-to-Text 是 Google 旗下的 ASR 语音识别 产品,主打 云端识别,常见标签包括 ASR、语音 API、API。

闭源/平台免费试用 / 按量计费API
ASR语音 APIAPI
云端 TTS

Google Cloud Text-to-Speech

Google

Google Cloud Text-to-Speech 是 Google 旗下的 TTS 与语音克隆 产品,主打 云端 TTS,常见标签包括 TTS、语音 API、API。

闭源/平台免费试用 / 按量计费API
TTS语音 APIAPI
中文语音识别

iFlytek Open Platform

科大讯飞

iFlytek Open Platform 是 科大讯飞 旗下的 ASR 语音识别 产品,主打 中文语音识别,常见标签包括 ASR、语音 API、国内生态。

闭源/平台免费试用 / 按量计费API
ASR语音 API国内生态
歌声与声音克隆

Kits AI

Kits AI

Kits AI 是 Kits AI 旗下的 TTS 与语音克隆 产品,主打 歌声与声音克隆,常见标签包括 TTS、语音克隆、AI 音乐。

闭源/平台免费试用 / 按量计费API
TTS语音克隆AI 音乐
开源 TTS

Kokoro 82M

Hexgrad

Kokoro 82M 是 Hexgrad 旗下的 TTS 与语音克隆 产品,主打 开源 TTS,常见标签包括 TTS、开源。

开源/自部署开源免费 / 自部署API
TTS开源
语音识别

Kyutai STT 1B

Kyutai

Kyutai STT 1B 是 Kyutai 旗下的 ASR 语音识别 产品,主打 语音识别,常见标签包括 ASR、开源。

开源/自部署开源免费 / 自部署API
ASR开源
商用音乐生成

Loudly

Loudly

Loudly 是 Loudly 旗下的 语音音频与 AI 音乐 产品,主打 商用音乐生成,常见标签包括 AI 音乐。

闭源/平台免费 / 付费无 API
AI 音乐
品牌配音

LOVO

LOVO

LOVO 是 LOVO 提供的语音音频产品,主打品牌配音方向,可直接进入官网查看能力与使用方式。

闭源/平台免费 / 订阅无 API
语音音频TTSAI 音乐
AI 音乐

Lyria 2

Google

Lyria 2 是 Google 旗下的 语音音频与 AI 音乐 产品,主打 AI 音乐,常见标签包括 AI 音乐。

闭源/平台免费 / 付费无 API
AI 音乐
音轨分离

Moises

Moises

Moises 是 Moises 旗下的 语音音频与 AI 音乐 产品,主打 音轨分离,常见标签包括 音频编辑、工作流。

闭源/平台免费 / 付费无 API
音频编辑工作流AI 音乐
开源 ASR

Moonshine ASR

Moonshine

Moonshine ASR 是 Moonshine 旗下的 ASR 语音识别 产品,主打 开源 ASR,常见标签包括 ASR、开源。

开源/自部署开源免费 / 自部署API
ASR开源
流媒体音乐生成

Mubert

Mubert

Mubert 是 Mubert 旗下的 语音音频与 AI 音乐 产品,主打 流媒体音乐生成,常见标签包括 AI 音乐、API。

闭源/平台免费 / 付费API
AI 音乐API
商业配音

Murf

Murf

Murf 是 Murf 提供的语音音频产品,主打商业配音方向,可直接进入官网查看能力与使用方式。

闭源/平台免费 / 订阅无 API
语音音频TTSAI 音乐
歌声生成

Musicfy

Musicfy

Musicfy 是 Musicfy 旗下的 语音音频与 AI 音乐 产品,主打 歌声生成,常见标签包括 AI 音乐、语音克隆。

闭源/平台免费 / 付费无 API
AI 音乐语音克隆
AI 音乐

MusicGen Large

Meta

MusicGen Large 是 Meta 旗下的 语音音频与 AI 音乐 产品,主打 AI 音乐,常见标签包括 AI 音乐、开源。

开源/自部署开源免费 / 自部署无 API
AI 音乐开源
AI 音乐

MusicLM

Google

MusicLM 是 Google 旗下的 语音音频与 AI 音乐 产品,主打 AI 音乐,常见标签包括 AI 音乐。

闭源/平台免费 / 付费无 API
AI 音乐
脚本配音

Narakeet

Narakeet

Narakeet 是 Narakeet 旗下的 TTS 与语音克隆 产品,主打 脚本配音,常见标签包括 TTS、工作流。

闭源/平台免费试用 / 按量计费API
TTS工作流
开源语音克隆

OpenVoice

MyShell

OpenVoice 是 MyShell 旗下的 TTS 与语音克隆 产品,主打 开源语音克隆,常见标签包括 TTS、语音克隆、开源。

开源/自部署开源免费 / 自部署API
TTS语音克隆开源
语音识别

Parakeet RNNT 1.1B

NVIDIA

Parakeet RNNT 1.1B 是 NVIDIA 旗下的 ASR 语音识别 产品,主打 语音识别,常见标签包括 ASR、开源。

开源/自部署开源免费 / 自部署API
ASR开源
开源 TTS

Piper TTS

Piper

Piper TTS 是 Piper 旗下的 TTS 与语音克隆 产品,主打 开源 TTS,常见标签包括 TTS、开源。

开源/自部署开源免费 / 自部署API
TTS开源
对话语音

PlayDialog

PlayDialog

PlayDialog 是 PlayDialog 旗下的 TTS 与语音克隆 产品,主打 对话语音,常见标签包括 TTS、语音 API、API。

闭源/平台免费试用 / 按量计费API
TTS语音 APIAPI
TTS API

PlayHT

PlayHT

具有 600 多种 AI 语音的 AI 语音生成器

闭源/平台免费 / 订阅API
语音音频APITTS
播客工作流

Podcastle

Podcastle

Podcastle 是 Podcastle 旗下的 语音音频与 AI 音乐 产品,主打 播客工作流,常见标签包括 音频编辑、工作流。

闭源/平台免费 / 付费无 API
音频编辑工作流AI 音乐
品牌配音

ReadSpeaker

ReadSpeaker

ReadSpeaker 是 ReadSpeaker 旗下的 TTS 与语音克隆 产品,主打 品牌配音,常见标签包括 TTS、语音克隆。

闭源/平台免费试用 / 按量计费API
TTS语音克隆
语音克隆

Resemble AI

Resemble AI

Resemble AI 是 Resemble AI 提供的语音音频产品,主打语音克隆方向,可直接进入官网查看能力与使用方式。

闭源/平台免费 / 订阅API
语音音频APITTS
语音识别 API

Rev AI

Rev

Rev AI 是 Rev 旗下的 ASR 语音识别 产品,主打 语音识别 API,常见标签包括 ASR、语音 API、API。

闭源/平台免费试用 / 按量计费API
ASR语音 APIAPI
实验性音乐生成

Riffusion

Riffusion

Riffusion 是 Riffusion 旗下的 语音音频与 AI 音乐 产品,主打 实验性音乐生成,常见标签包括 AI 音乐、开源。

开源/自部署开源免费 / 自部署无 API
AI 音乐开源
AI 音乐

Riffusion Fuzz

Riffusion

Riffusion Fuzz 是 Riffusion 旗下的 语音音频与 AI 音乐 产品,主打 AI 音乐,常见标签包括 AI 音乐。

闭源/平台免费 / 付费无 API
AI 音乐
多语语音识别

SeamlessM4T

Meta

SeamlessM4T 是 Meta 旗下的 ASR 语音识别 产品,主打 多语语音识别,常见标签包括 ASR、开源。

开源/自部署开源免费 / 自部署API
ASR开源
开源语音识别

SenseVoice

阿里通义

SenseVoice 是 阿里通义 旗下的 ASR 语音识别 产品,主打 开源语音识别,常见标签包括 ASR、开源、国内生态。

开源/自部署开源免费 / 自部署API
ASR开源国内生态
开源 ASR

Sherpa ONNX ASR

Sherpa

Sherpa ONNX ASR 是 Sherpa 旗下的 ASR 语音识别 产品,主打 开源 ASR,常见标签包括 ASR、开源。

开源/自部署开源免费 / 自部署API
ASR开源
低延迟转写

Soniox

Soniox

Soniox 是 Soniox 旗下的 ASR 语音识别 产品,主打 低延迟转写,常见标签包括 ASR、实时识别、语音 API。

闭源/平台免费试用 / 按量计费API
ASR实时识别语音 API
背景音乐生成

Soundraw

Soundraw

Soundraw 是 Soundraw 旗下的 语音音频与 AI 音乐 产品,主打 背景音乐生成,常见标签包括 AI 音乐。

闭源/平台免费 / 付费无 API
AI 音乐
开源 TTS

Spark-TTS

SparkAudio

Spark-TTS 是 SparkAudio 旗下的 TTS 与语音克隆 产品,主打 开源 TTS,常见标签包括 TTS、开源。

开源/自部署开源免费 / 自部署API
TTS开源
开源 ASR

SpeechBrain ASR

SpeechBrain

SpeechBrain ASR 是 SpeechBrain 旗下的 ASR 语音识别 产品,主打 开源 ASR,常见标签包括 ASR、开源。

开源/自部署开源免费 / 自部署API
ASR开源
朗读工具

Speechify

Speechify

领先的文本转语音应用程序

闭源/平台免费 / 订阅无 API
语音音频TTSAI 音乐
企业级识别

Speechmatics

Speechmatics

Speechmatics 是 Speechmatics 旗下的 ASR 语音识别 产品,主打 企业级识别,常见标签包括 ASR、语音 API、API。

闭源/平台免费试用 / 按量计费API
ASR语音 APIAPI
AI 音乐

Stable Audio

Stability AI

Stable Audio 是 Stability AI 旗下的 语音音频与 AI 音乐 产品,主打 AI 音乐,常见标签包括 AI 音乐、音频编辑。

闭源/平台免费 / 付费无 API
AI 音乐音频编辑
AI 音频

Stable Audio Open

Stability AI

Stable Audio Open 是 Stability AI 旗下的 语音音频与 AI 音乐 产品,主打 AI 音频,常见标签包括 AI 音乐、音频编辑。

闭源/平台免费 / 付费无 API
AI 音乐音频编辑
开源 TTS

StyleTTS2

StyleTTS

StyleTTS2 是 StyleTTS 旗下的 TTS 与语音克隆 产品,主打 开源 TTS,常见标签包括 TTS、开源。

开源/自部署开源免费 / 自部署API
TTS开源
AI 音乐

Suno v4

Suno

Suno v4 是 Suno 旗下的 语音音频与 AI 音乐 产品,主打 AI 音乐,常见标签包括 AI 音乐。

闭源/平台免费 / 付费无 API
AI 音乐
AI 音乐

Suno v4.5

Suno

Suno v4.5 是 Suno 旗下的 语音音频与 AI 音乐 产品,主打 AI 音乐,常见标签包括 AI 音乐。

闭源/平台免费 / 付费无 API
AI 音乐
语音识别 API

Tencent Cloud ASR

腾讯云

Tencent Cloud ASR 是 腾讯云 旗下的 ASR 语音识别 产品,主打 语音识别 API,常见标签包括 ASR、语音 API、国内生态。

闭源/平台免费试用 / 按量计费API
ASR语音 API国内生态
开源 TTS

Tortoise TTS

Tortoise

Tortoise TTS 是 Tortoise 旗下的 TTS 与语音克隆 产品,主打 开源 TTS,常见标签包括 TTS、开源。

开源/自部署开源免费 / 自部署API
TTS开源
在线配音

TTSMaker

TTSMaker

TTSMaker 是 TTSMaker 旗下的 TTS 与语音克隆 产品,主打 在线配音,常见标签包括 TTS。

闭源/平台免费试用 / 按量计费API
TTS
角色配音

Typecast

Typecast

Typecast 是 Typecast 旗下的 TTS 与语音克隆 产品,主打 角色配音,常见标签包括 TTS、语音克隆。

闭源/平台免费试用 / 按量计费API
TTS语音克隆
音乐生成

Udio

Udio

Discover, create, and share music with the world.

闭源/平台免费 / 订阅无 API
语音音频音乐生成AI 音乐
AI 音乐

Udio 1.3

Udio

Udio 1.3 是 Udio 旗下的 语音音频与 AI 音乐 产品,主打 AI 音乐,常见标签包括 AI 音乐。

闭源/平台免费 / 付费无 API
AI 音乐
企业配音

WellSaid Labs

WellSaid Labs

WellSaid Labs 是 WellSaid Labs 提供的语音音频产品,主打企业配音方向,可直接进入官网查看能力与使用方式。

闭源/平台免费 / 订阅无 API
语音音频TTSAI 音乐
开源识别

Whisper

OpenAI

Whisper 是 OpenAI 旗下的 ASR 语音识别 产品,主打 开源识别,常见标签包括 ASR、开源。

开源/自部署开源免费 / 自部署API
ASR开源
开源 ASR

Whisper Large V3

OpenAI

Whisper Large V3 是 OpenAI 旗下的 ASR 语音识别 产品,主打 开源 ASR,常见标签包括 ASR、开源。

开源/自部署开源免费 / 自部署API
ASR开源
开源 ASR

Whisper Large V3 Turbo

OpenAI

Whisper Large V3 Turbo 是 OpenAI 旗下的 ASR 语音识别 产品,主打 开源 ASR,常见标签包括 ASR、开源。

开源/自部署开源免费 / 自部署API
ASR开源
开源 TTS

XTTS v2

Coqui

XTTS v2 是 Coqui 旗下的 TTS 与语音克隆 产品,主打 开源 TTS,常见标签包括 TTS、开源。

开源/自部署开源免费 / 自部署API
TTS开源
开源 TTS

Zonos TTS

Zyphra

Zonos TTS 是 Zyphra 旗下的 TTS 与语音克隆 产品,主打 开源 TTS,常见标签包括 TTS、开源。

开源/自部署开源免费 / 自部署API
TTS开源
选择指南

语音音频与 AI 音乐如何选

  • 先区分 TTS、配音、音乐生成、语音克隆,不能混在一起选。
  • 配音场景先听音色自然度和断句,再看价格;广告和旁白最怕机械感。
  • 多语言项目重点看语言覆盖、口音质量和字幕流程支持。
  • 商用前必须看声音授权、克隆同意机制和生成内容版权。

语音音频与 AI 音乐 分类页最值得先看什么?

建议先看官网入口、价格方式、是否支持 API、开闭源状态与典型场景。