使用本接口调用 M2-her 模型,支持角色扮演、多轮对话等对话场景。支持丰富的角色设定(system、user_system、group 等)和示例对话学习。
请求体的媒介类型,请设置为 application/json,确保请求数据的格式为 JSON
application/json 模型 ID。可选值:M2-her
M2-her 是否使用流式传输,默认为 false。设置为 true 后,响应将分批返回
指定生成内容长度的上限(Token 数),上限为 2048。超过上限的内容会被截断。如果生成因 length 原因中断,请尝试调高此值。
x >= 1温度系数,影响输出随机性,取值范围 (0, 1],M2-her 模型默认值为 1.0。值越高,输出越随机;值越低,输出越确定
0 < x <= 1采样策略,影响输出随机性,取值范围 (0, 1],M2-her 模型默认值为 0.95
0 < x <= 1本次响应的唯一 ID
响应选择列表
响应创建的 Unix 时间戳(秒)
本次请求使用的模型 ID
对象类型。非流式为 chat.completion,流式为 chat.completion.chunk
chat.completion, chat.completion.chunk 本次请求的 Token 使用情况统计
输入内容是否命中敏感词。如果输入内容严重违规,接口会返回内容违规错误信息,回复内容为空
输入命中敏感词类型,当input_sensitive为true时返回。取值为以下其一:1 严重违规;2 色情;3 广告;4 违禁;5 谩骂;6 暴恐;7 其他
输出内容是否命中敏感词。如果输出内容严重违规,接口会返回内容违规错误信息,回复内容为空
输出命中敏感词类型
错误状态码和详情