使用本接口,在HTTP网络通信协议下进行同步语音合成。
https://api-bj.minimaxi.com/v1/t2a_v2请求体的媒介类型,请设置为 application/json,确保请求数据的格式为 JSON
application/json 请求的模型版本,可选范围:speech-2.6-hd, speech-2.6-turbo, speech-02-hd, speech-02-turbo, speech-01-hd, speech-01-turbo.
speech-2.6-hd, speech-2.6-turbo, speech-02-hd, speech-02-turbo, speech-01-hd, speech-01-turbo 需要合成语音的文本,长度限制小于 10000 字符,若文本长度大于 3000 字符,推荐使用流式输出
<#x#>标记,x 为停顿时长(单位:秒),范围 [0.01, 99.99],最多保留两位小数。文本间隔时间需设置在两个可以语音发音的文本之间,不可连续使用多个停顿标记控制是否流式输出。默认 false,即不开启流式
是否增强对指定的小语种和方言的识别能力。默认值为 null,可设置为 auto 让模型自主判断。
Chinese, Chinese,Yue, English, Arabic, Russian, Spanish, French, Portuguese, German, Turkish, Dutch, Ukrainian, Vietnamese, Indonesian, Japanese, Italian, Korean, Thai, Polish, Romanian, Greek, Czech, Finnish, Hindi, Bulgarian, Danish, Hebrew, Malay, Persian, Slovak, Swedish, Croatian, Filipino, Hungarian, Norwegian, Slovenian, Catalan, Nynorsk, Tamil, Afrikaans, auto 声音效果器设置,该参数支持的音频格式:
mp3, wav, flacmp3控制是否开启字幕服务,默认值为 false。此参数仅在非流式输出场景下有效,且仅对 speech-2.6-hd speech-2.6-turbo speech-02-turbo speech-02-hd speech-01-turbo speech-01-hd 模型有效
控制输出结果形式的参数,可选值范围为[url, hex],默认值为 hex 。该参数仅在非流式场景生效,流式场景仅支持返回 hex 形式。返回的 url 有效期为 24 小时
url, hex 控制在合成音频的末尾添加音频节奏标识,默认值为 False。该参数仅对非流式合成生效