火山带情感控制的文本转语音(TTS) API 文档
概述
文本转语音(TTS)技术可以将文字内容转换为自然流畅的语音输出。本API支持多种音色和情感风格,适用于语音播报、有声读物、智能语音助手等场景。
基础信息
- 请求地址:
https://www.dmxapi.cn/v1/audio/speech
- 请求方法:POST
- 认证方式:Bearer Token
请求参数
参数名 | 类型 | 必填 | 说明 |
---|---|---|---|
model | string | 是 | 模型类型,固定为tts-pro |
input | string | 是 | 需要转换的文本内容 |
voice | string | 是 | 音色选择(见下方音色列表) |
emotion | string | 否 | 情感控制 happy , angry , fear , surprise |
音色列表
支持几十种音色,包括:
- 柔美女友 妩媚女生 京腔小爷 猴哥 熊二 如来佛祖 咆哮哥 四郎 懒小羊 TVB女声 动漫小新 紫薇
- 容嬷嬷 华妃 河南小哥 湾区大叔 广西老表 山东小哥 长沙妹坨 樱花小哥 上海阿姨 京腔 港普男声
- 东北老铁 粤语男声 重庆小伙 魅力姐姐 高冷御姐 魅力女友 耿直女声 活泼女声 随性女声 知性女声
- 撒娇学妹 冷静少女 元气少女 活泼女孩 阳光少年 活泼少年 小男孩 小女孩 萌娃 沉稳老者 老婆婆
- 阳光青年 广告男声 悠悠君子 强势青年 阳光男生 沉稳男声 悲伤青年 病娇少女 黛玉 顾姐 动漫海绵
- 天津小哥 西安掌柜 台湾女生 温柔淑女 悲伤女声 开朗学长 儒雅大叔 温柔阿姨 刚正大叔 云龙哥
Python调用示例
python
import json
import requests
# API配置
url = "https://www.dmxapi.cn/v1/audio/speech"
api_token = "sk-******" # 替换为你的 DMXAPI 令牌
text = "大家好,我是林夏,一个在数字与文字间游走的斜杠青年。"
# 请求参数
payload = {
"model": "tts-pro",
"input": text,
"voice": "京腔小爷", # 设置音色 柔美女友 妩媚女生 京腔小爷 猴哥...
"emotion": "happy" # 设置情感 "happy", "angry", "fear", "surprise"
}
# 请求头
headers = {
"Content-Type": "application/json",
"Authorization": f"Bearer {api_token}"
}
try:
# 发送请求
response = requests.post(
url,
headers=headers,
data=json.dumps(payload),
stream=True
)
# 检查响应状态
response.raise_for_status()
# 保存音频文件
with open("output.mp3", "wb") as f:
f.write(response.content) # 写入二进制音频数据
print("语音生成成功,已保存为output.mp3")
except requests.exceptions.HTTPError as e:
print(f"请求失败: {e.response.status_code}")
print(f"错误详情: {e.response.text}")
except Exception as e:
print(f"发生错误: {str(e)}")
响应处理
成功请求将返回二进制音频数据(MP3格式),可直接保存为文件或播放。
错误码
状态码 | 说明 |
---|---|
401 | 认证失败 |
400 | 参数错误 |
500 | 服务器内部错误 |
注意事项
- 请妥善保管API密钥,不要暴露在客户端代码中
- 文本内容长度有限制,单条音频长度约15秒。
- 建议使用HTTPS协议保证传输安全