跳转到主要内容

简介

订阅 Token Plan 后,有两种方式调用 MiniMax 多模态能力:
  • 通过 Agent 调用(本文介绍):安装 MiniMax Skills,用自然语言让 Agent 完成视频、音乐、语音、图片的生成,无需手动配置。
  • 通过 API 直接调用:适合开发者自行集成,详见 API 文档
Token Plan 套餐介绍

使用方法

第一步:安装技能并配置密钥

对你的 Agent 说(支持 OpenClaw、Claude Code、Cursor、TRAE、OpenCode、Kilo Code、Cline、Roo Code、Grok CLI、Codex CLI、Droid、Zed、MonkeyCode 等):
帮我安装这个 skill:https://github.com/MiniMax-AI/skills
激活 minimax-multimodal-toolkit 技能。
我的 MiniMax API Key 是 sk-cp-xxxxx,使用中国大陆服务(或:全球 Global 服务)。
Agent 会自动选择对应的 API 节点:
地区API 节点
中国大陆https://api.minimaxi.com
全球(Global)https://api.minimax.io

第二步:生成内容

直接描述你想要的结果: 视频 · Hailuo 2.3
生成一段视频:夕阳下,一只猫坐在窗边望向远方
音乐 · Music 2.5
生成一首轻快爵士风格的歌曲,主题是夏天的海边
语音 · Speech 2.8
用温柔女声音朗读:欢迎使用 MiniMax Token Plan, 订阅 Token Plan 后,让你的 Agent 拥有全模态能力,生成视频、音乐、语音和图片。
图片 · Image 01
生成一张赛博朋克风格的城市夜景图,16:9 比例
生成的文件保存在当前目录的 minimax-output/ 文件夹中。
Skills 库还包含前端开发、全栈开发、PPT/PDF 生成等其他技能,同样可以让 Agent 按需安装。