支持模型
以下为 MiniMax 提供的语音模型及其特性说明。| 模型 | 特性 |
|---|---|
| speech-2.5-hd-preview | 最新的 HD 模型,韵律表现出色,复刻相似度极佳 |
| speech-2.5-turbo-preview | 最新的 Turbo 模型,支持 40 个语种 |
| speech-02-hd | 拥有出色的韵律、稳定性和复刻相似度,音质表现突出 |
| speech-02-turbo | 拥有出色的韵律和稳定性,小语种能力加强,性能表现出色 |
| speech-01-hd | 拥有超高的复刻相似度,音质表现突出 |
| speech-01-turbo | 在出色的生成效果基础上有更快的生成速度 |
接口说明
- 上传待克隆音频 调用 上传复刻音频) 上传待克隆的音频文件并获取
file_id。 - 上传示例音频 (可选) 若需要提供示例音频以增强克隆效果,需要再次调用 上传示例音频 上传示例音频文件并获得对应的
file_id。填写在clone_prompt中的prompt_audio中。 - 调用复刻接口 基于获取的
file_id和自定义的voice_id作为输入参数,调用 快速复刻 克隆音色。
- 调用本接口进行音色克隆时,不会立即收取音色复刻费用。音色的复刻费用将在首次使用此复刻音色进行语音合成时收取(不包含本接口内的试听行为)。
- 本接口产出的快速复刻音色为临时音色,若希望永久保留某复刻音色,请于 168 小时(7 天)内在任意 T2A 语音合成接口中调用该音色(不包含本接口内的试听行为)。若超过时限,该音色将被删除。
- 接口采用无状态设计:每次调用仅处理传入数据,且不存储用户上传内容,不涉及任何业务逻辑状态。






