音色快速复刻（Voice Cloning）

使用本接口需要完成个人认证及企业认证用户后，方可调用。请在账户管理 -> 账户信息中，完成个人用户认证或企业用户认证，以确保可以正常使用本功能。本接口适用场景：IP 音色复刻、音色克隆等需要快速复刻某一音色的相关场景。本接口支持单、双声道复刻声音，支持按照指定音频文件快速复刻相同音色的语音。

支持模型

以下为 MiniMax 提供的语音模型及其特性说明。

模型	特性
speech-2.8-hd	最新的 HD 模型，精准还原真实语气细节，全面提升音色相似度
speech-2.8-turbo	最新的 Turbo 模型，精准还原真实语气细节，全面提升音色相似度
speech-2.6-hd	HD 模型，韵律表现出色，极致音质与韵律表现，生成更快更自然
speech-2.6-turbo	Turbo 模型，音质优异，超低时延，响应更灵敏
speech-02-hd	拥有出色的韵律、稳定性和复刻相似度，音质表现突出
speech-02-turbo	拥有出色的韵律和稳定性，小语种能力加强，性能表现出色

上传待克隆音频 调用上传复刻音频) 上传待克隆的音频文件并获取 file_id。
上传示例音频 (可选) 若需要提供示例音频以增强克隆效果，需要再次调用上传示例音频上传示例音频文件并获得对应的 file_id。填写在clone_prompt中的prompt_audio中。
调用复刻接口 基于获取的 file_id 和自定义的 voice_id 作为输入参数，调用快速复刻克隆音色。

⚠️ 注意：

调用本接口进行音色克隆时，不会立即收取音色复刻费用。音色的复刻费用将在首次使用此复刻音色进行语音合成时收取（不包含本接口内的试听行为）。
本接口产出的快速复刻音色为临时音色，若希望永久保留某复刻音色，请于 168 小时（7 天）内在任意 T2A 语音合成接口中调用该音色（不包含本接口内的试听行为）。若超过时限，该音色将被删除。
接口采用无状态设计：每次调用仅处理传入数据，且不存储用户上传内容，不涉及任何业务逻辑状态。

MiniMax 提供官方的 Python 版本和 JavaScript 版本模型上下文协议（MCP）服务器实现代码，支持音色克隆功能，详细说明请参考 MiniMax MCP 使用指南文档