/v1/audio/speech

POST https://ai-api.mandao.com/v1/audio/speech

文本转语音(TTS)接口,OpenAI Audio API 兼容格式。

请求参数

Header 参数

参数名 类型 必需 说明
Authorization string Bearer Token 认证
Content-Type string application/json

Body 参数 (application/json)

参数名 类型 必需 说明
model string 模型 ID
input string 待合成的文本
voice string 语音类型
response_format string 音频格式,如 mp3opusaacflac
speed number 语速,范围 0.25~4.0

返回响应

200 成功

返回音频文件的二进制流(Content-Type: audio/mpeg 等)。


/v1/audio/transcriptions

POST https://ai-api.mandao.com/v1/audio/transcriptions

语音转文本(语音识别)接口,OpenAI Audio API 兼容格式。

请求参数

Body 参数 (multipart/form-data)

参数名 类型 必需 说明
model string 模型 ID
file file 待转写的音频文件
language string 音频语言(ISO-639-1 格式)
response_format string 响应格式:jsontextsrtverbose_jsonvtt

返回响应

200 成功

{
    "text": "这是转写后的文本内容..."
}

/v1/audio/translations

POST https://ai-api.mandao.com/v1/audio/translations

语音翻译接口,将音频翻译为英文文本。参数与 transcriptions 类似。

注意事项

  • 音频文件大小限制取决于具体模型和渠道配置。
  • 支持的音频格式包括:mp3mp4mpegmpgam4awavwebm