跳转到主要内容
POST
/
v1
/
t2a_v2
curl --request POST \
--url https://api.minimaxi.com/v1/t2a_v2 \
--header 'Authorization: Bearer <token>' \
--header 'Content-Type: <content-type>' \
--data '{
"model": "speech-2.5-hd-preview",
"text": "今天是不是很开心呀,当然了!",
"stream": false,
"voice_setting": {
"voice_id": "male-qn-qingse",
"speed": 1,
"vol": 1,
"pitch": 0,
"emotion": "happy"
},
"pronunciation_dict": {
"tone": [
"处理/(chu3)(li3)",
"危险/dangerous"
]
},
"audio_setting": {
"sample_rate": 32000,
"bitrate": 128000,
"format": "mp3",
"channel": 1
},
"subtitle_enable": false
}'
{
"data": {
"audio": "<hex编码的audio>",
"status": 2
},
"extra_info": {
"audio_length": 9900,
"audio_sample_rate": 32000,
"audio_size": 160323,
"bitrate": 128000,
"word_count": 52,
"invisible_character_ratio": 0,
"usage_characters": 101,
"audio_format": "mp3",
"audio_channel": 1
},
"trace_id": "01b8bf9bb7433cc75c18eee6cfa8fe21",
"base_resp": {
"status_code": 0,
"status_msg": "success"
}
}
备用接口地址 https://api-bj.minimaxi.com/v1/t2a_v2

Authorizations

Authorization
string
header
required

HTTP: Bearer Auth

  • Security Scheme Type: http
  • HTTP Authorization Scheme: Bearer API_key,用于验证账户信息,可在 账户管理>接口密钥 中查看。

Headers

Content-Type
enum<string>
default:application/json
required

请求体的媒介类型,请设置为 application/json,确保请求数据的格式为 JSON

Available options:
application/json

Body

application/json
model
enum<string>
required

请求的模型版本,可选范围:speech-2.5-hd-preview, speech-2.5-turbo-preview, speech-02-hd, speech-02-turbo, speech-01-hd, speech-01-turbo.

Available options:
speech-2.5-hd-preview,
speech-2.5-turbo-preview,
speech-02-hd,
speech-02-turbo,
speech-01-hd,
speech-01-turbo
text
string
required

需要合成语音的文本,长度限制小于 10000 字符,若文本长度大于 3000 字符,推荐使用流式输出

  • 段落切换用换行符标记
  • 停顿控制:支持自定义文本之间的语音时间间隔,以实现自定义文本语音停顿时间的效果。使用方式:在文本中增加<#x#>标记,x 为停顿时长(单位:秒),范围 [0.01, 99.99],最多保留两位小数。文本间隔时间需设置在两个可以语音发音的文本之间,不可连续使用多个停顿标记
stream
boolean

控制是否流式输出。默认 false,即不开启流式

stream_options
object
voice_setting
object
audio_setting
object
pronunciation_dict
object
timber_weights
object[]
language_boost
enum<string>

是否增强对指定的小语种和方言的识别能力。默认值为 null,可设置为 auto 让模型自主判断。

Available options:
Chinese,
Chinese,Yue,
English,
Arabic,
Russian,
Spanish,
French,
Portuguese,
German,
Turkish,
Dutch,
Ukrainian,
Vietnamese,
Indonesian,
Japanese,
Italian,
Korean,
Thai,
Polish,
Romanian,
Greek,
Czech,
Finnish,
Hindi,
Bulgarian,
Danish,
Hebrew,
Malay,
Persian,
Slovak,
Swedish,
Croatian,
Filipino,
Hungarian,
Norwegian,
Slovenian,
Catalan,
Nynorsk,
Tamil,
Afrikaans,
auto
voice_modify
object

声音效果器设置,该参数支持的音频格式:

  • 非流式:mp3, wav, flac
  • 流式:mp3
subtitle_enable
boolean
default:false

控制是否开启字幕服务,默认值为 false。此参数仅在非流式输出场景下有效,且仅对 speech-2.5-hd-preview speech-2.5-turbo-preview speech-02-turbo speech-02-hd speech-01-turbo speech-01-hd 模型有效

output_format
enum<string>
default:hex

控制输出结果形式的参数,可选值范围为[url, hex],默认值为 hex 。该参数仅在非流式场景生效,流式场景仅支持返回 hex 形式。返回的 url 有效期为 24 小时

Available options:
url,
hex
aigc_watermark
boolean
default:false

控制在合成音频的末尾添加音频节奏标识,默认值为 False。该参数仅对非流式合成生效

Response

data
object

返回的合成数据对象,可能为 null,需进行非空判断

trace_id
string

本次会话的 id,用于在咨询/反馈时帮助定位问题

extra_info
object

音频的附加信息

base_resp
object

本次请求的状态码和详情

I