6月19日,MiniMax发布其通用智能体产品——MiniMax Agent。
上海稀宇科技透露,MiniMax Agent不仅能编写包含复杂组件和跳转逻辑的网页、网页游戏,更与众不同的是,还能通过模拟用户操作进行全面的自动化测试,确保交付的成果稳定、无bug。
得益于MiniMax自研的强大的多模态大模型,MiniMax Agent能“阅读”长文本和文件,还能“观看”视频、“聆听”音频、“欣赏”图片。在此基础上,它内置了图像、音频、视频的生成能力。
MiniMax Agent内置了稀宇科技自研MCP,以强化其多模态输出能力。同时,它也集成了Google Maps、Github/Gitlab、Slack、Figma等业界常用的工具。
在产品逻辑上,MiniMax Agent内部并非单一的“大脑”,而是一个由“总调度Agent”和多个“执行Agent”构成的分层协作团队。总调度Agent负责理解用户的整体意图,并将其拆解为一系列子任务;而执行Agent则专注于完成具体的任务,例如编码、设计、研究等。目前,该框架已经能够支持7个智能体的协同工作,确保了在执行复杂任务时的高效与条理。