Openai 请求格式 STT(ASR)语音转文本 API 文档

whisper 模型接口说明

该接口基于 Whisper 模型实现语音转文本功能，支持常见音频格式。

基础概念

Whisper模型: OpenAI 开源的语音识别模型，支持多语言转写
音频格式: 支持 mp3、wav、m4a 等常见格式

接口地址

POST https://www.dmxapi.cn/v1/audio/transcriptions

请求参数

参数名	类型	必填	说明
model	string	是	固定值 "whisper-1"
file	file	是	要转写的音频文件

请求头

Authorization: Bearer sk-*********************  # 替换为你的 DMXAPI 令牌

Python 调用示例

python

import json
import requests

def voice_to_text(file_path):
    """
    语音转文本功能
    
    参数:
        file_path: 音频文件路径
        
    返回:
        识别出的文本内容
    """
    url = "https://www.dmxapi.cn/v1/audio/transcriptions"
    
    # 构造请求参数
    payload = {"model": "whisper-1"}
    files = {"file": ("audio.mp3", open(file_path, "rb"))}
    
    # 设置请求头(请替换为你的API密钥)
    headers = {"Authorization": "Bearer sk-***************************"} # 替换为你的 DMXAPI 令牌
    
    # 发送POST请求
    response = requests.post(url, headers=headers, data=payload, files=files)
    
    # 解析响应数据
    data = json.loads(response.text)
    
    # 返回识别结果
    return data.get("text", "")

# 使用示例
print(voice_to_text("audio.mp3"))  # 替换为你的音频文件路径

注意事项

音频文件大小建议不超过25MB
支持中文、英文等多种语言
请妥善保管API密钥，不要泄露

-thinking思考功能的开关

可灵官方 Kling

海螺视频 hailuo

-thinking思考功能的开关

常用函数

Openai 请求格式 STT(ASR)语音转文本 API 文档

whisper 模型接口说明

基础概念

接口地址

请求参数

请求头

Python 调用示例

注意事项

Openai 请求格式 STT(ASR)语音转文本 API 文档 ​

whisper 模型接口说明 ​

基础概念 ​

接口地址 ​

请求参数 ​

请求头 ​

Python 调用示例 ​

注意事项 ​

Openai 请求格式 STT(ASR)语音转文本 API 文档

whisper 模型接口说明

基础概念

接口地址

请求参数

请求头

Python 调用示例

注意事项