Skip to content

火山带情感控制的文本转语音(TTS) API 文档

概述

文本转语音(TTS)技术可以将文字内容转换为自然流畅的语音输出。本API支持多种音色和情感风格,适用于语音播报、有声读物、智能语音助手等场景。

基础信息

  • 请求地址:https://www.dmxapi.cn/v1/audio/speech
  • 请求方法:POST
  • 认证方式:Bearer Token

请求参数

参数名类型必填说明
modelstring模型类型,固定为tts-pro
inputstring需要转换的文本内容
voicestring音色选择(见下方音色列表)
emotionstring情感控制 happy , angry , fear , surprise

音色列表

支持几十种音色,包括:

  • 柔美女友 妩媚女生 京腔小爷 猴哥 熊二 如来佛祖 咆哮哥 四郎 懒小羊 TVB女声 动漫小新 紫薇
  • 容嬷嬷 华妃 河南小哥 湾区大叔 广西老表 山东小哥 长沙妹坨 樱花小哥 上海阿姨 京腔 港普男声
  • 东北老铁 粤语男声 重庆小伙 魅力姐姐 高冷御姐 魅力女友 耿直女声 活泼女声 随性女声 知性女声
  • 撒娇学妹 冷静少女 元气少女 活泼女孩 阳光少年 活泼少年 小男孩 小女孩 萌娃 沉稳老者 老婆婆
  • 阳光青年 广告男声 悠悠君子 强势青年 阳光男生 沉稳男声 悲伤青年 病娇少女 黛玉 顾姐 动漫海绵
  • 天津小哥 西安掌柜 台湾女生 温柔淑女 悲伤女声 开朗学长 儒雅大叔 温柔阿姨 刚正大叔 云龙哥

Python调用示例

python
import json
import requests

# API配置
url = "https://www.dmxapi.cn/v1/audio/speech"
api_token = "sk-******"  # 替换为你的 DMXAPI 令牌
text = "大家好,我是林夏,一个在数字与文字间游走的斜杠青年。"

# 请求参数
payload = {
    "model": "tts-pro",
    "input": text,
    "voice": "京腔小爷",  # 设置音色 柔美女友 妩媚女生 京腔小爷 猴哥...
    "emotion": "happy"   # 设置情感  "happy", "angry", "fear", "surprise"
}

# 请求头
headers = {
    "Content-Type": "application/json",
    "Authorization": f"Bearer {api_token}"
}

try:
    # 发送请求
    response = requests.post(
        url, 
        headers=headers, 
        data=json.dumps(payload),
        stream=True
    )
    
    # 检查响应状态
    response.raise_for_status()
    
    # 保存音频文件
    with open("output.mp3", "wb") as f:
        f.write(response.content)  # 写入二进制音频数据
        
    print("语音生成成功,已保存为output.mp3")

except requests.exceptions.HTTPError as e:
    print(f"请求失败: {e.response.status_code}")
    print(f"错误详情: {e.response.text}")
except Exception as e:
    print(f"发生错误: {str(e)}")

响应处理

成功请求将返回二进制音频数据(MP3格式),可直接保存为文件或播放。

错误码

状态码说明
401认证失败
400参数错误
500服务器内部错误

注意事项

  1. 请妥善保管API密钥,不要暴露在客户端代码中
  2. 文本内容长度有限制,单条音频长度约15秒。
  3. 建议使用HTTPS协议保证传输安全

一个 Key 用全球大模型