ElevenLabs
ElevenLabs 是 ElevenLabs 提供的语音音频产品,主打语音头部方向,可直接进入官网查看能力与使用方式。
ElevenLabs 是 ElevenLabs 提供的语音音频产品,主打语音头部方向,可直接进入官网查看能力与使用方式。
Suno 是 Suno 提供的语音音频产品,主打AI 音乐方向,可直接进入官网查看能力与使用方式。
作曲生成AIVA 是 AIVA 旗下的 语音音频与 AI 音乐 产品,主打 作曲生成,常见标签包括 AI 音乐。
企业语音服务Alibaba Cloud Speech 是 阿里云 旗下的 ASR 语音识别 产品,主打 企业语音服务,常见标签包括 ASR、语音 API、国内生态。
企业配音Amazon Polly 是 AWS 旗下的 TTS 与语音克隆 产品,主打 企业配音,常见标签包括 TTS、语音 API、API。
云端转写Amazon Transcribe 是 AWS 旗下的 ASR 语音识别 产品,主打 云端转写,常见标签包括 ASR、语音 API、API。
转写平台AssemblyAI 是 AssemblyAI 旗下的 ASR 语音识别 产品,主打 转写平台,常见标签包括 ASR、语音 API、API。
AI 音乐AudioGen Medium 是 Meta 旗下的 语音音频与 AI 音乐 产品,主打 AI 音乐,常见标签包括 AI 音乐、开源。
企业语音服务Azure AI Speech 是 Microsoft 旗下的 ASR 语音识别 产品,主打 企业语音服务,常见标签包括 ASR、语音 API、API。
企业级语音Azure Text to Speech 是 Microsoft 旗下的 TTS 与语音克隆 产品,主打 企业级语音,常见标签包括 TTS、语音 API、API。
云端识别Baidu Speech 是 百度智能云 旗下的 ASR 语音识别 产品,主打 云端识别,常见标签包括 ASR、语音 API、国内生态。
版权友好音乐Beatoven.ai 是 Beatoven 旗下的 语音音频与 AI 音乐 产品,主打 版权友好音乐,常见标签包括 AI 音乐。
一键生成音乐Boomy 是 Boomy 旗下的 语音音频与 AI 音乐 产品,主打 一键生成音乐,常见标签包括 AI 音乐。
语音识别Canary 1B 是 NVIDIA 旗下的 ASR 语音识别 产品,主打 语音识别,常见标签包括 ASR、开源。
实时语音Cartesia 是 Cartesia 旗下的 TTS 与语音克隆 产品,主打 实时语音,常见标签包括 TTS、语音 API、API。
开源 TTSChatterbox TTS 是 Resemble AI 旗下的 TTS 与语音克隆 产品,主打 开源 TTS,常见标签包括 TTS、开源。
开源 TTSCoqui TTS 是 Coqui 旗下的 TTS 与语音克隆 产品,主打 开源 TTS,常见标签包括 TTS、开源。
开源 TTSCosyVoice 是 阿里通义 旗下的 TTS 与语音克隆 产品,主打 开源 TTS,常见标签包括 TTS、开源、国内生态。
开源 TTSCosyVoice 2 是 阿里通义 旗下的 TTS 与语音克隆 产品,主打 开源 TTS,常见标签包括 TTS、开源、国内生态。
开源 TTSCSM-1B 是 Sesame 旗下的 TTS 与语音克隆 产品,主打 开源 TTS,常见标签包括 TTS、开源。
语音 APIDeepgram 是 Deepgram 旗下的 ASR 语音识别 产品,主打 语音 API,常见标签包括 ASR、语音 API、实时识别。
音视频编辑Descript makes editing video and audio as easy as editing text.
配音本地化Dubverse 是 Dubverse 旗下的 TTS 与语音克隆 产品,主打 配音本地化,常见标签包括 TTS、翻译、工作流。
开源 TTSF5-TTS 是 SWivid 旗下的 TTS 与语音克隆 产品,主打 开源 TTS,常见标签包括 TTS、开源。
会议转写Fireflies AI 是 Fireflies 旗下的 ASR 语音识别 产品,主打 会议转写,常见标签包括 ASR、工作流、知识库。
语音克隆Fish Audio 是 Fish Audio 旗下的 TTS 与语音克隆 产品,主打 语音克隆,常见标签包括 TTS、语音克隆、API。
语音识别框架FunASR 是 阿里通义 旗下的 ASR 语音识别 产品,主打 语音识别框架,常见标签包括 ASR、开源、国内生态。
多语种转写Gladia 是 Gladia 旗下的 ASR 语音识别 产品,主打 多语种转写,常见标签包括 ASR、语音 API、API。
云端识别Google Cloud Speech-to-Text 是 Google 旗下的 ASR 语音识别 产品,主打 云端识别,常见标签包括 ASR、语音 API、API。
云端 TTSGoogle Cloud Text-to-Speech 是 Google 旗下的 TTS 与语音克隆 产品,主打 云端 TTS,常见标签包括 TTS、语音 API、API。
中文语音识别iFlytek Open Platform 是 科大讯飞 旗下的 ASR 语音识别 产品,主打 中文语音识别,常见标签包括 ASR、语音 API、国内生态。
歌声与声音克隆Kits AI 是 Kits AI 旗下的 TTS 与语音克隆 产品,主打 歌声与声音克隆,常见标签包括 TTS、语音克隆、AI 音乐。
开源 TTSKokoro 82M 是 Hexgrad 旗下的 TTS 与语音克隆 产品,主打 开源 TTS,常见标签包括 TTS、开源。
语音识别Kyutai STT 1B 是 Kyutai 旗下的 ASR 语音识别 产品,主打 语音识别,常见标签包括 ASR、开源。
商用音乐生成Loudly 是 Loudly 旗下的 语音音频与 AI 音乐 产品,主打 商用音乐生成,常见标签包括 AI 音乐。
品牌配音LOVO 是 LOVO 提供的语音音频产品,主打品牌配音方向,可直接进入官网查看能力与使用方式。
Lyria 2 是 Google 旗下的 语音音频与 AI 音乐 产品,主打 AI 音乐,常见标签包括 AI 音乐。
音轨分离Moises 是 Moises 旗下的 语音音频与 AI 音乐 产品,主打 音轨分离,常见标签包括 音频编辑、工作流。
开源 ASRMoonshine ASR 是 Moonshine 旗下的 ASR 语音识别 产品,主打 开源 ASR,常见标签包括 ASR、开源。
流媒体音乐生成Mubert 是 Mubert 旗下的 语音音频与 AI 音乐 产品,主打 流媒体音乐生成,常见标签包括 AI 音乐、API。
Murf 是 Murf 提供的语音音频产品,主打商业配音方向,可直接进入官网查看能力与使用方式。
歌声生成Musicfy 是 Musicfy 旗下的 语音音频与 AI 音乐 产品,主打 歌声生成,常见标签包括 AI 音乐、语音克隆。
AI 音乐MusicGen Large 是 Meta 旗下的 语音音频与 AI 音乐 产品,主打 AI 音乐,常见标签包括 AI 音乐、开源。
AI 音乐MusicLM 是 Google 旗下的 语音音频与 AI 音乐 产品,主打 AI 音乐,常见标签包括 AI 音乐。
脚本配音Narakeet 是 Narakeet 旗下的 TTS 与语音克隆 产品,主打 脚本配音,常见标签包括 TTS、工作流。
开源语音克隆OpenVoice 是 MyShell 旗下的 TTS 与语音克隆 产品,主打 开源语音克隆,常见标签包括 TTS、语音克隆、开源。
语音识别Parakeet RNNT 1.1B 是 NVIDIA 旗下的 ASR 语音识别 产品,主打 语音识别,常见标签包括 ASR、开源。
开源 TTSPiper TTS 是 Piper 旗下的 TTS 与语音克隆 产品,主打 开源 TTS,常见标签包括 TTS、开源。
对话语音PlayDialog 是 PlayDialog 旗下的 TTS 与语音克隆 产品,主打 对话语音,常见标签包括 TTS、语音 API、API。
TTS API具有 600 多种 AI 语音的 AI 语音生成器
播客工作流Podcastle 是 Podcastle 旗下的 语音音频与 AI 音乐 产品,主打 播客工作流,常见标签包括 音频编辑、工作流。
品牌配音ReadSpeaker 是 ReadSpeaker 旗下的 TTS 与语音克隆 产品,主打 品牌配音,常见标签包括 TTS、语音克隆。
语音克隆Resemble AI 是 Resemble AI 提供的语音音频产品,主打语音克隆方向,可直接进入官网查看能力与使用方式。
语音识别 APIRev AI 是 Rev 旗下的 ASR 语音识别 产品,主打 语音识别 API,常见标签包括 ASR、语音 API、API。
实验性音乐生成Riffusion 是 Riffusion 旗下的 语音音频与 AI 音乐 产品,主打 实验性音乐生成,常见标签包括 AI 音乐、开源。
AI 音乐Riffusion Fuzz 是 Riffusion 旗下的 语音音频与 AI 音乐 产品,主打 AI 音乐,常见标签包括 AI 音乐。
多语语音识别SeamlessM4T 是 Meta 旗下的 ASR 语音识别 产品,主打 多语语音识别,常见标签包括 ASR、开源。
开源语音识别SenseVoice 是 阿里通义 旗下的 ASR 语音识别 产品,主打 开源语音识别,常见标签包括 ASR、开源、国内生态。
Sherpa ONNX ASR 是 Sherpa 旗下的 ASR 语音识别 产品,主打 开源 ASR,常见标签包括 ASR、开源。
低延迟转写Soniox 是 Soniox 旗下的 ASR 语音识别 产品,主打 低延迟转写,常见标签包括 ASR、实时识别、语音 API。
背景音乐生成Soundraw 是 Soundraw 旗下的 语音音频与 AI 音乐 产品,主打 背景音乐生成,常见标签包括 AI 音乐。
开源 TTSSpark-TTS 是 SparkAudio 旗下的 TTS 与语音克隆 产品,主打 开源 TTS,常见标签包括 TTS、开源。
开源 ASRSpeechBrain ASR 是 SpeechBrain 旗下的 ASR 语音识别 产品,主打 开源 ASR,常见标签包括 ASR、开源。
朗读工具领先的文本转语音应用程序
企业级识别Speechmatics 是 Speechmatics 旗下的 ASR 语音识别 产品,主打 企业级识别,常见标签包括 ASR、语音 API、API。
AI 音乐Stable Audio 是 Stability AI 旗下的 语音音频与 AI 音乐 产品,主打 AI 音乐,常见标签包括 AI 音乐、音频编辑。
AI 音频Stable Audio Open 是 Stability AI 旗下的 语音音频与 AI 音乐 产品,主打 AI 音频,常见标签包括 AI 音乐、音频编辑。
开源 TTSStyleTTS2 是 StyleTTS 旗下的 TTS 与语音克隆 产品,主打 开源 TTS,常见标签包括 TTS、开源。
AI 音乐Suno v4 是 Suno 旗下的 语音音频与 AI 音乐 产品,主打 AI 音乐,常见标签包括 AI 音乐。
AI 音乐Suno v4.5 是 Suno 旗下的 语音音频与 AI 音乐 产品,主打 AI 音乐,常见标签包括 AI 音乐。
语音识别 APITencent Cloud ASR 是 腾讯云 旗下的 ASR 语音识别 产品,主打 语音识别 API,常见标签包括 ASR、语音 API、国内生态。
开源 TTSTortoise TTS 是 Tortoise 旗下的 TTS 与语音克隆 产品,主打 开源 TTS,常见标签包括 TTS、开源。
在线配音TTSMaker 是 TTSMaker 旗下的 TTS 与语音克隆 产品,主打 在线配音,常见标签包括 TTS。
角色配音Typecast 是 Typecast 旗下的 TTS 与语音克隆 产品,主打 角色配音,常见标签包括 TTS、语音克隆。
Discover, create, and share music with the world.
AI 音乐Udio 1.3 是 Udio 旗下的 语音音频与 AI 音乐 产品,主打 AI 音乐,常见标签包括 AI 音乐。
企业配音WellSaid Labs 是 WellSaid Labs 提供的语音音频产品,主打企业配音方向,可直接进入官网查看能力与使用方式。
开源识别Whisper 是 OpenAI 旗下的 ASR 语音识别 产品,主打 开源识别,常见标签包括 ASR、开源。
开源 ASRWhisper Large V3 是 OpenAI 旗下的 ASR 语音识别 产品,主打 开源 ASR,常见标签包括 ASR、开源。
开源 ASRWhisper Large V3 Turbo 是 OpenAI 旗下的 ASR 语音识别 产品,主打 开源 ASR,常见标签包括 ASR、开源。
开源 TTSXTTS v2 是 Coqui 旗下的 TTS 与语音克隆 产品,主打 开源 TTS,常见标签包括 TTS、开源。
开源 TTSZonos TTS 是 Zyphra 旗下的 TTS 与语音克隆 产品,主打 开源 TTS,常见标签包括 TTS、开源。
建议先看官网入口、价格方式、是否支持 API、开闭源状态与典型场景。