创建异步语音合成任务

授权

Authorization

string

header

必填

HTTP: Bearer Auth

Security Scheme Type: http
HTTP Authorization Scheme: Bearer API_key，用于验证账户信息，可在账户管理>接口密钥中查看。

请求头

Content-Type

enum<string>

默认值:application/json

必填

请求体的媒介类型，请设置为 application/json，确保请求数据的格式为 JSON

可用选项:

application/json

请求体

application/json

model

enum<string>

必填

请求的模型版本，可选范围：speech-2.8-hd, speech-2.8-turbo, speech-2.6-hd, speech-2.6-turbo, speech-02-hd, speech-02-turbo, speech-01-hd, speech-01-turbo.

可用选项:

speech-2.8-hd,

speech-2.8-turbo,

speech-2.6-hd,

speech-2.6-turbo,

speech-02-hd,

speech-02-turbo,

speech-01-hd,

speech-01-turbo

text

string

必填

待合成音频的文本，限制最长 5 万字符。和 text_file_id 二选一必填

语气词标签：仅当模型选择 speech-2.8-hd 或 speech-2.8-turbo 时，支持在文本中插入语气词标签。支持的语气词：(laughs)（笑声）、(chuckle)（轻笑）、(coughs)（咳嗽）、(clear-throat)（清嗓子）、(groans)（呻吟）、(breath)（正常换气）、(pant)（喘气）、(inhale)（吸气）、(exhale)（呼气）、(gasps)（倒吸气）、(sniffs)（吸鼻子）、(sighs)（叹气）、(snorts)（喷鼻息）、(burps)（打嗝）、(lip-smacking)（咂嘴）、(humming)（哼唱）、(hissing)（嘶嘶声）、(emm)（嗯）、(whistles)（口哨）、(sneezes)（喷嚏）、(crying)（抽泣）、(applause)（鼓掌）

text_file_id

integer<int64>

必填

待合成音频的文本文件待合成音频的文本文件 id，单个文件长度限制小于 100 万字符，支持的文件格式：txt、zip。和 text 二选一必填，传入后自动校验格式。

txt 文件：长度限制 <1,000,000 字符。支持使用 <#x#> 标记自定义停顿。x 为停顿时长（单位：秒），范围 [0.01,99.99]，最多保留两位小数。注意停顿需设置在两个可以语音发音的文本之间，不可连续使用多个停顿标记
zip 文件：
- 压缩包内需包含同一格式的 txt 或 json 文件。
- json 文件格式：支持 [title, content, extra] 三个字段，分别表示标题、正文、附加信息。若三个字段都存在，则产出 3 组结果，共 9 个文件，统一存放在一个文件夹中。若某字段不存在或内容为空，则该字段不会生成对应结果

voice_setting

object

必填

Show child attributes

audio_setting

object

Show child attributes

pronunciation_dict

object

Show child attributes

language_boost

enum<string>

是否增强对指定的小语种和方言的识别能力。默认值为 null，可设置为 auto 让模型自主判断。

注意：speech-01 和 speech-02 系列模型暂不支持 Persian、Filipino、Tamil 这三个语种。

可用选项:

Chinese,

Chinese,Yue,

English,

Arabic,

Russian,

Spanish,

French,

Portuguese,

German,

Turkish,

Dutch,

Ukrainian,

Vietnamese,

Indonesian,

Japanese,

Italian,

Korean,

Thai,

Polish,

Romanian,

Greek,

Czech,

Finnish,

Hindi,

Bulgarian,

Danish,

Hebrew,

Malay,

Persian,

Slovak,

Swedish,

Croatian,

Filipino,

Hungarian,

Norwegian,

Slovenian,

Catalan,

Nynorsk,

Tamil,

Afrikaans,

auto

voice_modify

object

声音效果器设置。

支持的音频格式：mp3、wav、flac。（其他格式如 pcm、pcmu_raw、pcmu_wav、opus 不支持，传入会返回参数错误。）

Show child attributes

aigc_watermark

boolean

默认值:false

控制在合成音频的末尾添加音频节奏标识，默认值为 False。该参数仅对非流式合成生效

响应

200 - application/json

task_id

string

当前任务的 ID

file_id

integer<int64>

任务创建成功后返回的对应音频文件的 ID。

当任务完成后，可通过 file_id 调用文件检索接口进行下载
当请求出错时，不返回该字段注意：返回的下载 URL 自生成起 9 小时（32,400 秒）内有效，过期后文件将失效，生成的信息便会丢失，请注意下载信息的时间

task_token

string

完成当前任务使用的密钥信息

usage_characters

integer

计费字符数

base_resp

object

本次请求的状态码及其详情

Show child attributes

API 指引

文本

语音

视频

图片

音乐

文件

模型

返回文件信息

txt 文件

json 文件

授权

请求头

请求体

响应

​返回文件信息

​txt 文件

​json 文件

授权

请求头

请求体

响应

返回文件信息

txt 文件

json 文件