Documentation Index
Fetch the complete documentation index at: https://platform.minimaxi.com/docs/llms.txt
Use this file to discover all available pages before exploring further.
嘉
嘉川
2026年5月21日
工具简介
Voice ID Lucky Draw 是一个面向 voice clone 质量调优场景的 Web 工具:用户上传一段长音频,系统自动切分并发起 6 次复刻(3 次 Zero-Shot + 3 次 One-Shot),返回 6 个候选voice_id。用户可以像「抽卡」一样,在统一文案下试听比对每个候选音色,选出满意的一张再激活,未被激活继续使用的候选不会产生复刻费。
为什么需要「抽卡」
同一段原始声音,在不同的切片、prompt 与复刻策略下,得到的voice_id 可能在相似度、情绪、稳定性、业务适配度上各有差异。
传统流程一次只产出一个结果,要试出好音色往往需要反复上传、反复参数调整。Voice ID Lucky Draw 把这些差异集中生成出来,让用户在 6 个候选中挑出最满意的一张,显著提高音色复刻一次到位的概率。
批量候选
一次操作产出 6 个候选
voice_id,Zero-Shot 与 One-Shot 策略各 3 次统一试听
所有候选用同一段试听文案合成,音色差异可横向对比
切分合规
自动选择说话间隙切片,产出符合接口要求的
clone_audio 与 prompt_audio未激活无复刻费
未继续使用的候选
voice_id 不产生 9.9 元复刻费用,降低试错成本适用于音色复刻效果不稳定、希望一次操作横向比较多候选的场景。
使用方法
上传与切分音频
上传音频后,后端读取原始文件,进行转码、采样率处理和自动切分。切分逻辑会尽量选择说话间隙,生成两类语料:
clone_audio:普通复刻原始语料,每条大于 10 秒prompt_audio:可选参考音频语料,每条小于 8 秒
ASR 与文本校对
prompt_audio 会进入 ASR,自动识别对应文字。因为 prompt_audio 要求音频和文字一致,页面提供试听和文本编辑能力,用户可以修正错字、补充标点,确保 prompt_text 与音频内容严格对应。批量发起复刻
完成切分后,系统批量发起复刻,组合 3 次 zero_shot 和 3 次 one_shot:
- zero_shot:主要使用切片语料
- one_shot:使用原始整段 clone 音频加 prompt 切片语料
voice_id。立即体验
Voice ID Lucky Draw
在线试用音色复刻抽卡工具,准备好 MiniMax API Key 与 Group ID 即可开始
总结
Voice ID Lucky Draw 把音色复刻的「一发命中」难题转化为「批量候选 + 试听筛选」流程:- 批量产出 6 个候选
voice_id(Zero-Shot 3 次 + One-Shot 3 次),最大化挖掘原始音频的潜力 - 统一试听文案让候选可横向比较
- 未继续使用的候选无复刻费(试听合成仍按 T2A 字符数计费)降低尝试成本
- 整套流程开箱即用,无需自己处理音频切分、ASR 与多次接口编排
相关资源
语音复刻 API
接口文档与参数说明
T2A 合成 API
用 voice_id 指定音色合成最终音频
MiniMax 开放平台
获取 API Key 与 Group ID