跳转到主要内容
POST
/
v1
/
t2a_v2
curl --request POST \ --url https://api.minimaxi.com/v1/t2a_v2 \ --header 'Authorization: Bearer <token>' \ --header 'Content-Type: <content-type>' \ --data ' { "model": "speech-2.6-hd", "text": "今天是不是很开心呀,当然了!", "stream": false, "voice_setting": { "voice_id": "male-qn-qingse", "speed": 1, "vol": 1, "pitch": 0, "emotion": "happy" }, "pronunciation_dict": { "tone": [ "处理/(chu3)(li3)", "危险/dangerous" ] }, "audio_setting": { "sample_rate": 32000, "bitrate": 128000, "format": "mp3", "channel": 1 }, "subtitle_enable": false } '
{
  "data": {
    "audio": "<hex编码的audio>",
    "status": 2
  },
  "extra_info": {
    "audio_length": 9900,
    "audio_sample_rate": 32000,
    "audio_size": 160323,
    "bitrate": 128000,
    "word_count": 52,
    "invisible_character_ratio": 0,
    "usage_characters": 26,
    "audio_format": "mp3",
    "audio_channel": 1
  },
  "trace_id": "01b8bf9bb7433cc75c18eee6cfa8fe21",
  "base_resp": {
    "status_code": 0,
    "status_msg": "success"
  }
}
备用接口地址 https://api-bj.minimaxi.com/v1/t2a_v2

授权

Authorization
string
header
必填

HTTP: Bearer Auth

  • Security Scheme Type: http
  • HTTP Authorization Scheme: Bearer API_key,用于验证账户信息,可在 账户管理>接口密钥 中查看。

请求头

Content-Type
enum<string>
默认值:application/json
必填

请求体的媒介类型,请设置为 application/json,确保请求数据的格式为 JSON

可用选项:
application/json

请求体

application/json
model
enum<string>
必填

请求的模型版本,可选范围:speech-2.8-hd, speech-2.8-turbo, speech-2.6-hd, speech-2.6-turbo, speech-02-hd, speech-02-turbo, speech-01-hd, speech-01-turbo.

可用选项:
speech-2.8-hd,
speech-2.8-turbo,
speech-2.6-hd,
speech-2.6-turbo,
speech-02-hd,
speech-02-turbo,
speech-01-hd,
speech-01-turbo
text
string
必填

需要合成语音的文本,长度限制小于 10000 字符,若文本长度大于 3000 字符,推荐使用流式输出

  • 段落切换用换行符标记
  • 停顿控制:支持自定义文本之间的语音时间间隔,以实现自定义文本语音停顿时间的效果。使用方式:在文本中增加<#x#>标记,x 为停顿时长(单位:秒),范围 [0.01, 99.99],最多保留两位小数。文本间隔时间需设置在两个可以语音发音的文本之间,不可连续使用多个停顿标记
stream
boolean

控制是否流式输出。默认 false,即不开启流式

stream_options
object
voice_setting
object
audio_setting
object
pronunciation_dict
object
timber_weights
object[]
language_boost
enum<string>

是否增强对指定的小语种和方言的识别能力。默认值为 null,可设置为 auto 让模型自主判断。

可用选项:
Chinese,
Chinese,Yue,
English,
Arabic,
Russian,
Spanish,
French,
Portuguese,
German,
Turkish,
Dutch,
Ukrainian,
Vietnamese,
Indonesian,
Japanese,
Italian,
Korean,
Thai,
Polish,
Romanian,
Greek,
Czech,
Finnish,
Hindi,
Bulgarian,
Danish,
Hebrew,
Malay,
Persian,
Slovak,
Swedish,
Croatian,
Filipino,
Hungarian,
Norwegian,
Slovenian,
Catalan,
Nynorsk,
Tamil,
Afrikaans,
auto
voice_modify
object

声音效果器设置,该参数支持的音频格式:

  • 非流式:mp3, wav, flac
  • 流式:mp3
subtitle_enable
boolean
默认值:false

控制是否开启字幕服务,默认值为 false。此参数仅在非流式输出场景下有效,且仅对 speech-2.6-hd speech-2.6-turbo speech-02-turbo speech-02-hd speech-01-turbo speech-01-hd 模型有效

output_format
enum<string>
默认值:hex

控制输出结果形式的参数,可选值范围为[url, hex],默认值为 hex 。该参数仅在非流式场景生效,流式场景仅支持返回 hex 形式。返回的 url 有效期为 24 小时

可用选项:
url,
hex
aigc_watermark
boolean
默认值:false

控制在合成音频的末尾添加音频节奏标识,默认值为 False。该参数仅对非流式合成生效

continuous_sound
boolean

是否启用连续发音模式,仅支持 speech-2.8-hdspeech-2.8-turbo 模型

响应

data
object

返回的合成数据对象,可能为 null,需进行非空判断

trace_id
string

本次会话的 id,用于在咨询/反馈时帮助定位问题

extra_info
object

音频的附加信息

base_resp
object

本次请求的状态码和详情