订阅 Token Plan ,即可以超低价格使用 MiniMax 全模态模型!
模型概览
MiniMax 提供多款语言模型,满足不同场景需求。MiniMax-M3 是最新 M 系列语言模型,适用于 Agent 推理、工具调用、代码和长上下文任务;MiniMax-M2.7 与 MiniMax-M2 继续支持已有工作流。支持模型
| 模型名称 | 上下文窗口 | 模型介绍 |
|---|---|---|
| MiniMax-M3 | 1,000,000 | 原生多模态、1M 上下文的 Frontier Coding 模型 |
| MiniMax-M2.7 | 204,800 | 开启模型的自我迭代(输出速度约 60 TPS) |
| MiniMax-M2.7-highspeed | 204,800 | M2.7 极速版:效果不变,更快,更敏捷(输出速度约 100 TPS) |
| MiniMax-M2.5 | 204,800 | 顶尖性能与极致性价比,轻松驾驭复杂任务(输出速度约 60 TPS) |
| MiniMax-M2.5-highspeed | 204,800 | M2.5 极速版:效果不变,更快,更敏捷(输出速度约 100 TPS) |
| MiniMax-M2.1 | 204,800 | 强大多语言编程能力,全面升级编程体验(输出速度约 60 TPS) |
| MiniMax-M2.1-highspeed | 204,800 | M2.1 极速版:效果不变,更快,更敏捷(输出速度约 100 TPS) |
| MiniMax-M2 | 204,800 | 专为高效编码与 Agent 工作流而生 |
| M2-her | 64 K | 专为对话场景设计,支持角色扮演和多轮对话 |
TPS(Tokens Per Second)的计算方式详见常见问题 > 接口相关。
MiniMax M3 核心亮点
1M 上下文
1M 上下文
MiniMax-M3 支持最高 1,000,000 token 上下文,适用于长文档、代码库和多步骤 Agent 会话。
Agent 与代码场景
Agent 与代码场景
MiniMax-M3 面向 Agent 推理、工具调用、代码和结构化任务执行优化。
多模态 Chat 输入
多模态 Chat 输入
OpenAI 兼容 Chat Completions 支持文本、图片和视频输入,可使用
image_url 与 video_url 内容块。更多模型介绍请参考 MiniMax M3。
URL 配置
调用 MiniMax 模型前,请先准备好以下信息:调用示例
MiniMax 同时兼容 Anthropic 和 OpenAI 两种 API 协议格式,下面给出两套等价的非流式样例。需要流式响应时,把请求里的stream 改成 true 即可。
Anthropic 兼容(推荐)
支持 thinking 块、interleaved thinking 等高级特性,是默认推荐路径。OpenAI 兼容
如果你的项目已经接入 OpenAI SDK,把base_url 和 model 换成下方的值即可直接复用,无需迁移到新 SDK。
API 参考
Anthropic API 兼容(推荐)
通过 Anthropic SDK 调用 MiniMax 模型,支持流式输出和 Interleaved Thinking
OpenAI API 兼容
通过 OpenAI SDK 调用 MiniMax 模型
在 AI 编程工具里使用 M3
在 Claude Code、Cursor 等工具中使用 M3
Chat Model
M2-her 对话模型,专为角色扮演、多轮对话等场景设计
联系我们
如果在使用 MiniMax 模型过程中遇到任何问题:- 通过邮箱 Model@minimaxi.com 等官方渠道联系我们的技术支持团队
- 在我们的 Github 仓库提交 Issue