Voice Clone
curl --request POST \
--url https://api.minimaxi.com/v1/voice_clone \
--header 'Authorization: Bearer <token>' \
--header 'Content-Type: application/json' \
--data '
{
"file_id": 123456789,
"voice_id": "<voice_id>",
"clone_prompt": {
"prompt_audio": 987654321,
"prompt_text": "This voice sounds natural and pleasant."
},
"text": "A gentle breeze sweeps across the soft grass(breath), carrying the fresh scent along with the songs of birds.",
"model": "speech-2.8-hd",
"need_noise_reduction": false,
"need_volume_normalization": false,
"aigc_watermark": false
}
'{
"input_sensitive": false,
"input_sensitive_type": 0,
"demo_audio": "",
"extra_info": {
"audio_length": 11124,
"audio_sample_rate": 32000,
"audio_size": 179926,
"bitrate": 128000,
"word_count": 18,
"usage_characters": 18
},
"base_resp": {
"status_code": 0,
"status_msg": "success"
}
}音色快速复刻
音色快速复刻
使用本接口进行音色快速复刻。 复刻得到的音色若 7 天内未正式调用,则系统会删除该音色。
POST
/
v1
/
voice_clone
Voice Clone
curl --request POST \
--url https://api.minimaxi.com/v1/voice_clone \
--header 'Authorization: Bearer <token>' \
--header 'Content-Type: application/json' \
--data '
{
"file_id": 123456789,
"voice_id": "<voice_id>",
"clone_prompt": {
"prompt_audio": 987654321,
"prompt_text": "This voice sounds natural and pleasant."
},
"text": "A gentle breeze sweeps across the soft grass(breath), carrying the fresh scent along with the songs of birds.",
"model": "speech-2.8-hd",
"need_noise_reduction": false,
"need_volume_normalization": false,
"aigc_watermark": false
}
'{
"input_sensitive": false,
"input_sensitive_type": 0,
"demo_audio": "",
"extra_info": {
"audio_length": 11124,
"audio_sample_rate": 32000,
"audio_size": 179926,
"bitrate": 128000,
"word_count": 18,
"usage_characters": 18
},
"base_resp": {
"status_code": 0,
"status_msg": "success"
}
}授权
请求体
application/json
Voice clone request parameters
克隆音色的 voice_id,正确示例:"MiniMax001"。用户进行自定义 voice_id 时需注意:
- 自定义的 voice_id 长度范围[8,256]
- 首字符必须为英文字母
- 允许数字、字母、-、_
- 末位字符不可为 -、_
- voice_id 不可与已有 id 重复,否则会报错
音色复刻示例音频,提供本参数将有助于增强语音合成的音色相似度和稳定性。若使用本参数,需同时上传一小段示例音频 上传的音频文件需遵从以下规范:
- 上传的音频文件格式需为:mp3、m4a、wav 格式
- 上传的音频文件的时长小于 8 秒
- 上传的音频文件大小需不超过 20 mb
Show child attributes
Show child attributes
复刻试听参数,限制 1000 字符以内。模型将使用复刻后的音色朗读本段文本内容,并返回试听音频链接。 注:试听将根据字符数正常收取语音合成费用,定价与 T2A 各接口一致
- 语气词标签:仅当模型选择
speech-2.8-hd或speech-2.8-turbo时,支持在文本中插入语气词标签。支持的语气词:(laughs)(笑声)、(chuckle)(轻笑)、(coughs)(咳嗽)、(clear-throat)(清嗓子)、(groans)(呻吟)、(breath)(正常换气)、(pant)(喘气)、(inhale)(吸气)、(exhale)(呼气)、(gasps)(倒吸气)、(sniffs)(吸鼻子)、(sighs)(叹气)、(snorts)(喷鼻息)、(burps)(打嗝)、(lip-smacking)(咂嘴)、(humming)(哼唱)、(hissing)(嘶嘶声)、(emm)(嗯)、(whistles)(口哨)、(sneezes)(喷嚏)、(crying)(抽泣)、(applause)(鼓掌)
复刻试听参数。指定合成试听音频使用的语音模型,提供 text 字段时必传此字段。可选项:
可用选项:
speech-2.8-hd, speech-2.8-turbo, speech-2.6-hd, speech-2.6-turbo, speech-02-hd, speech-02-turbo, speech-01-hd, speech-01-turbo 是否增强对指定的小语种和方言的识别能力。默认值为 null,可设置为 auto 让模型自主判断。
可用选项:
Chinese, Chinese,Yue, English, Arabic, Russian, Spanish, French, Portuguese, German, Turkish, Dutch, Ukrainian, Vietnamese, Indonesian, Japanese, Italian, Korean, Thai, Polish, Romanian, Greek, Czech, Finnish, Hindi, Bulgarian, Danish, Hebrew, Malay, Persian, Slovak, Swedish, Croatian, Filipino, Hungarian, Norwegian, Slovenian, Catalan, Nynorsk, Tamil, Afrikaans, auto 音频复刻参数,表示是否开启降噪,默认值为 false
音频复刻参数,是否开启音量归一化,默认值为 false
是否在合成试听音频的末尾添加音频节奏标识,默认值为 false
响应
200 - application/json
Successful response
此页面对您有帮助吗?
⌘I