/v1/audio/speech
POST https://ai-api.mandao.com/v1/audio/speech
文本转语音(TTS)接口,OpenAI Audio API 兼容格式。
请求参数
Header 参数
| 参数名 | 类型 | 必需 | 说明 |
|---|---|---|---|
| Authorization | string | 是 | Bearer Token 认证 |
| Content-Type | string | 是 | application/json |
Body 参数 (application/json)
| 参数名 | 类型 | 必需 | 说明 |
|---|---|---|---|
| model | string | 是 | 模型 ID |
| input | string | 是 | 待合成的文本 |
| voice | string | 是 | 语音类型 |
| response_format | string | 否 | 音频格式,如 mp3、opus、aac、flac |
| speed | number | 否 | 语速,范围 0.25~4.0 |
返回响应
200 成功
返回音频文件的二进制流(Content-Type: audio/mpeg 等)。
/v1/audio/transcriptions
POST https://ai-api.mandao.com/v1/audio/transcriptions
语音转文本(语音识别)接口,OpenAI Audio API 兼容格式。
请求参数
Body 参数 (multipart/form-data)
| 参数名 | 类型 | 必需 | 说明 |
|---|---|---|---|
| model | string | 是 | 模型 ID |
| file | file | 是 | 待转写的音频文件 |
| language | string | 否 | 音频语言(ISO-639-1 格式) |
| response_format | string | 否 | 响应格式:json、text、srt、verbose_json、vtt |
返回响应
200 成功
{
"text": "这是转写后的文本内容..."
}
/v1/audio/translations
POST https://ai-api.mandao.com/v1/audio/translations
语音翻译接口,将音频翻译为英文文本。参数与 transcriptions 类似。
注意事项
- 音频文件大小限制取决于具体模型和渠道配置。
- 支持的音频格式包括:
mp3、mp4、mpeg、mpga、m4a、wav、webm。