跳转到主要内容
对于Token Plan 用户,不用写一行代码,帮助你的 Agent 拥有 MiniMax 的全部多模态能力:视频生成、语音合成、音乐创作、编程,都可以在 OpenClaw, Claude Code 等AI助手中直接调用。 如果仍想通过 API 直接调用,作为开发者自行集成,另外详见 API 文档

安装 CLI

请将以下提示词复制给你的AI Agent(OpenClaw、Claude Code、Cursor、MaxClaw、AutoClaw、KimiClaw、TRAE、OpenCode等), 它会引导你添加API Key并完成安装:
帮我安装 MiniMax CLI:https://github.com/MiniMax-AI/cli

调用 CLI

文本 · 四言诗输入(Agent指令): 帮我用minimax生成一首关于AI的4言诗输出: 算力无垠,星火相连;
智能如海,梦随光年

视频 · Hailuo 2.3输入(Agent指令): 生成一段视频:夕阳下,一只猫坐在窗边望向远方输出:
音乐 · Music 2.6输入(Agent指令): 生成一首轻快爵士风格的歌曲,主题是夏天的海边输出:
语音 · Speech 2.8输入(Agent指令): 用温柔女声音朗读:欢迎使用 MiniMax Token Plan, 订阅 Token Plan 后,让你的 Agent 拥有全模态能力,生成视频、音乐、语音和图片。输出:
图片 · Image 01输入(Agent指令): 生成一张赛博朋克风格的城市夜景图,16:9 比例输出:生成的文件会保存在当前目录下的 minimax-output/ 文件夹中,推荐在 Agent 结果下直接展示生成内容。

CLI 面板

在命令行输入 mmx,即可打开CLI面板,快速了解 MMX-CLI 的主要功能和用量信息

MMX-CLI 登录成功界面示意图
  • resources: 当前可用的调用资源类型
  • flags: 支持在命令后加的参数/选项
  • 用量信息: 剩余额度与配额概览
  • 帮助入口: 使用方法说明

能力概览

MMX-CLI 在终端内提供统一的命令入口,覆盖文本、图像、视频、语音、音乐、视觉理解与网络检索等能力:
能力说明
文本多轮对话、流式输出、系统提示词、JSON 输出
图像文生图,支持宽高比与批量生成
视频异步视频生成,支持任务查询与下载
语音文字转语音(TTS),支持多音色与流式输出
音乐文生音乐,支持歌词模式与纯音乐模式
视觉图像理解,支持本地文件、URL、文件 ID
搜索内置网络检索

不同模态的用量

对于不同的 token plan 的不同模态的用量,请见:Token Plan