跳转到主要内容

Token Plan 支持哪些模型,以及如何切换模型?

Token Plan 支持 MiniMax 全模态模型——文本、语音、视频、图像和音乐——统一在同一额度下使用。极速版订阅还支持指定使用 MiniMax-M2.7-highspeedMiniMax-M2.5-highspeed 模型。 在 API 调用时,通过修改 model 参数即可切换模型:
import anthropic

client = anthropic.Anthropic()

message = client.messages.create(
    model="MiniMax-M2.7",  # 切换为其他模型,如 MiniMax-M2.5
    max_tokens=1000,
    system="You are a helpful assistant.",
    messages=[
        {
            "role": "user",
            "content": [
                {
                    "type": "text",
                    "text": "Hi, how are you?"
                }
            ]
        }
    ]
)
所有模型共享套餐额度,计费方式相同。

极速版订阅是什么?跟标准版有什么区别?

极速版订阅是 Token Plan 新推出的高速订阅方案,支持直接指定使用 MiniMax-M2.7-highspeed 模型。 MiniMax-M2.7-highspeedMiniMax-M2.7 的区别:
  • 效果相同:MiniMax-M2.7-highspeedMiniMax-M2.7 的模型能力和输出质量一致
  • 速度大幅提升:MiniMax-M2.7-highspeed 的推理输出速度显著快于 MiniMax-M2.7
如果您对编程工具的响应速度有较高要求,推荐选择极速版订阅。

订阅套餐可以升级吗?

可以。Token Plan 支持在订阅期内随时升级套餐,包括从标准版升级到极速版、或在同一版本内升级到更高级别的套餐。升级时只需支付新旧套餐的差价,新套餐立即生效。

如何查看 Token Plan 用量?

您可以通过以下两种方式查看 Token Plan 用量: 方式一:访问订阅管理页面 访问 订阅管理 > Token Plan 页面查看您的用量情况。 方式二:使用 API 接口查询
curl --location 'https://www.minimaxi.com/v1/api/openplatform/coding_plan/remains' \
--header 'Authorization: Bearer <API Key>' \
--header 'Content-Type: application/json'

”每 5 小时重置” 是如何计算的?

这是一个动态的速率限制。系统会计算您在 5 小时内的请求总用量。您在 5 小时前使用的额度会自动释放。

达到限额上限怎么办?

当您在 5 小时周期内达到请求使用上限时,您可以选择以下几种方式:
  • 升级订阅套餐
    您可以前往 Token Plan 页面升级到更高级别的套餐,获取更多的请求用量。Token Plan 支持随时升级,升级后立即生效。
  • 切换到按量付费(Pay as you go)
    如果您希望不受速率限制,您可以将编程工具中的 API Key 更换为您的从账户管理系统,MiniMax 开放平台普通的 API Key。这样,工具将切换到按实际 token 使用量计费的模式,消耗您的开放平台账户余额。
  • 等待重置
    Token Plan 的限额是基于一个动态的 5 小时窗口。您可以暂停使用,等待窗口滚动,下一个时间的额度将会自动恢复。

Token Plan 的 API Key 和开放平台普通的 API Key 可以混用吗?

不可以。
  • Token Plan API Key:专用于 Token Plan 套餐,按请求数量计费,受 5 小时滚动限额约束,可访问全模态模型。
  • 其他开放平台的 API Key:用于按量付费访问所有 MiniMax 模型,按实际 token 消耗量计费,消耗您的账户余额。

是否可以同时在多个工具中使用我的订阅套餐?

可以,您可以在所有支持的工具中使用同一订阅套餐,但额度是共享的,所有工具的使用会消耗同一套餐额度。

订阅套餐后可以退款吗?

订阅服务一经购买即视为确认,不支持退款。即使您未使用完套餐,费用也无法退回。我们建议您根据使用需求选择合适的订阅套餐和周期。

合并支付的订单如何开票?

开票规则如下:
  • 支付宝直接付款:可以开票
  • 余额支付:可以开票
  • 余额 + 支付宝组合支付:可以开票
  • 代金券抵扣部分:不可开票,仅实际支付的金额可以开具发票
如订单中使用了代金券,开票金额为扣除代金券后的实际支付金额。

文本模型的 TPS(Tokens Per Second)是如何计算的?

TPS 表示模型每秒生成的 token 数量,用于衡量模型的推理输出速度。计算公式为: TPS=输出 token 数量最后一个 token 的生成时间第一个 token 的生成时间\text{TPS} = \frac{\text{输出 token 数量}}{\text{最后一个 token 的生成时间} - \text{第一个 token 的生成时间}} 即从模型输出第一个 token 开始计时,到最后一个 token 输出完成为止,期间生成的 token 总数除以这段时间(秒)。
TPS 在实际使用中可能存在波动,各模型页面标注的 TPS 为参考值。

Token Plan 有哪些使用限制?是否适合生产环境?

Token Plan 面向个人开发者的交互式使用场景,更高的套餐等级提供更高的额度上限,生产环境建议使用pay-as-you-go。 主要限制包括:
  • 速率限制(RPM / TPM):超出后会限流,通常约 1 分钟恢复,高峰期可能动态收紧
  • 周期额度限制:按 5 小时分段和自然周设置上限,周期结束自动重置

如您在订阅服务中遇到任何问题,可扫描底部官方客服二维码,获得支持。