> 技术文档 > 【GitHub开源AI精选】Salesforce开源项目MAS-Zero:零监督下的多智能体系统设计框架

【GitHub开源AI精选】Salesforce开源项目MAS-Zero:零监督下的多智能体系统设计框架


系列篇章💥

No. 文章 1 【GitHub开源AI精选】LLM 驱动的影视解说工具:Narrato AI 一站式高效创作实践 2 【GitHub开源AI精选】德国比勒费尔德大学TryOffDiff——高保真服装重建的虚拟试穿技术新突破 3 【GitHub开源AI精选】哈工大(深圳)& 清华力作 FilmAgent:剧本自动生成 + 镜头智能规划,开启 AI 电影制作新时代 4 【GitHub开源AI精选】Lumina - Image 2.0 文生图模型,以小参数量实现高分辨率多图生成新突破 5 【GitHub开源AI精选】探索 Mobile-Agent:X-PLUG 推出的创新型移动智能操作代理 6 【GitHub开源AI精选】吴恩达团队开源VisionAgent:用自然语言开启计算机视觉新时代 7 【GitHub开源AI精选】Oumi:一站式AI开发平台,涵盖训练、评估与部署全流程 8 【GitHub开源AI精选】深入剖析RealtimeSTT:开源实时语音转文本库的强大功能与应用 9 【GitHub开源AI精选】PodAgent:多智能体协作播客生成框架,自动化打造高质量播客,赋能内容创作与品牌传播 10 【GitHub开源AI精选】OpenManus开源AI工具:3小时复刻Manus,39.5k星 11 【GitHub开源AI精选】OpenGlass:大模型赋能的开源方案,25美元打造智能眼镜,支持语音控制+AR叠加 12 【GitHub开源AI精选】AppAgentX:西湖大学发布可自主进化的手机智能体,实现GUI操作的高效与智能 13 【GitHub开源AI精选】Agent-S架构揭秘:低代码+多模态融合的智能体新范式 14 【GitHub开源AI精选】Open-Interface:大模型驱动的计算机“自动驾驶”系统|自然语言操控的自动化工具 15 【GitHub开源AI精选】2025年AI工程师必备!AgentOps五大功能重构智能体开发流程 16 【GitHub开源AI精选】LangManus:社区驱动的多智能体AI自动化框架,开启复杂任务处理新纪元 17 【GitHub开源AI精选】autoMate:AI 驱动的本地自动化助手,用自然语言解锁高效办公,让电脑任务自己动起来 18 【GitHub开源AI精选】Sitcom-Crafter:北航联合港中文等高校打造的剧情驱动3D动作生成系统 19 【GitHub开源AI精选】Local Deep Researcher:本地化部署的AI研究助手,零门槛开启智能研究 20 【GitHub开源AI精选】Browser Use:开源AI自动化工具,让AI像人类一样操控网页 21 【GitHub开源AI精选】LLaVA-Med:微软打造的生物医学领域多模态AI助手,助力医疗智能化 22 【GitHub开源AI精选】RF-DETR:Roboflow 的实时目标检测模型『边缘设备鹰眼』,低至160FPS的工业级检测利器 23 【GitHub开源AI精选】MegaTTS 3:字节跳动开源语音利器,吊打VALL-E,自然度逼近真人录音 24 【GitHub开源AI精选】LocAgent:斯坦福联合耶鲁大学等机构推出的代码问题定位智能体 25 【GitHub开源AI精选】WhisperX:70倍实时语音转录!革命性词级时间戳与多说话人分离技术 26 【GitHub开源AI精选】Crawl4AI:LLM专属极速开源爬虫利器、1秒处理百万级数据 27 【GitHub开源AI精选】Oliva:开源语音RAG助手,一句话秒搜海量数据,多AI协作颠覆传统搜索 28 【GitHub开源AI精选】UFO²:微软开源的 Windows 桌面 Agent 操作系统,开启智能自动化新时代 29 【GitHub开源AI精选】ebook2audiobook:AI驱动的电子书转有声书利器,支持1107种语言+语音克隆 30 【GitHub开源AI精选】WebThinker:赋能大型推理模型的自主科研新范式 31 【GitHub开源AI精选】ZeroSearch:阿里巴巴开源的大模型搜索引擎框架,无需真实搜索引擎交互 32 【GitHub开源AI精选】Toolkami:极简AI Agent框架,七种工具实现高效轻量化开发 33 【GitHub开源AI精选】Docext:NanoNets 打造的文档提取利器,本地化、高效能、免费开源 34 【GitHub开源AI精选】SketchVideo:手残党福音!草图秒变大片,快手黑科技让创作效率飙升300% 35 【GitHub开源AI精选】NLWeb:微软开源的自然语言交互利器,让网站秒变智能AI应用 36 【GitHub开源AI精选】ScrapeGraphAI:基于LLM的智能爬虫,多页面爬取、语音生成,开启数据提取新纪元 37 【GitHub开源AI精选】FaceShot:同济大学联合上海 AI Lab 推出的无需训练肖像动画生成框架 38 【GitHub开源AI精选】Minion Agent:开源界的“全能王”,深度研究、自动规划全搞定 39 【GitHub开源AI精选】AgenticSeek:开源本地通用AI Agent,打造自主执行任务的智能助手 40 【GitHub开源AI精选】Morphik:开源多模态检索增强生成工具,助力AI应用开发 41 【GitHub开源AI精选】TEN VAD:高性能实时语音活动检测系统,助力AI对话系统高效交互 42 【GitHub开源AI精选】Google AI Edge Gallery:谷歌赋能的离线AI模型探索利器 43 【GitHub开源AI精选】PandasAI:一键开启数据对话时代,非技术用户也能轻松上手 44 【GitHub开源AI精选】ContentV:字节跳动开源的高效文生视频模型框架,助力AI视频生成技术突破 45 【GitHub开源AI精选】VRAG-RL:阿里通义推出的多模态RAG推理框架,助力视觉信息理解与生成 46 【GitHub开源AI精选】MultiTalk:中山大学与美团联合打造的音频驱动多人对话视频生成框架 47 【GitHub开源AI精选】Salesforce开源项目MAS-Zero:零监督下的多智能体系统设计框架

目录

  • 系列篇章💥
  • 前言
  • 一、项目概述
  • 二、技术原理
  • 三、主要功能
  • 四、性能表现
  • 五、应用场景
  • 六、快速使用
    • (一)环境搭建
    • (二)运行MAS-Zero
  • 七、结语
  • 八、项目地址

前言

在人工智能领域,多智能体系统(MAS)作为一种强大的工具,能够通过多个智能体的协作解决复杂问题。然而,传统的MAS设计依赖于人工设计智能体角色和通信协议,这不仅效率低下,还难以适应新任务。Salesforce最新推出的MAS-Zero框架,以其零监督的自动设计能力,为这一领域带来了突破性的进展。
【GitHub开源AI精选】Salesforce开源项目MAS-Zero:零监督下的多智能体系统设计框架

一、项目概述

MAS-Zero是Salesforce推出的一个创新的多智能体系统(MAS)设计框架,能够在无需人类监督的情况下自动设计和优化MAS。它基于元级设计,在推理时动态生成、评估和改进MAS配置,通过自验证机制从候选解决方案中选择最优结果。这一框架在数学推理、高级问答和代码生成等多个领域表现出色,且完全不依赖外部监督信号,展现了强大的自进化能力和灵活性。
【GitHub开源AI精选】Salesforce开源项目MAS-Zero:零监督下的多智能体系统设计框架

二、技术原理

(一)元迭代(Meta-Iterations)

  1. 任务分解与MAS生成:MAS-Zero将复杂问题分解为多个子任务,并为每个子任务生成对应的MAS实现。它将MAS设计视为代码生成问题,通过元代理动态调整任务分解和MAS配置。
  2. 元级反馈:评估生成的MAS设计的可解性和完整性,基于中间输出判断当前MAS是否能有效解决问题,并生成反馈指导后续迭代改进。

(二)自验证(Self-Verification)

在多次元迭代后,从所有候选解决方案中选择最合适的结果,通过对比不同迭代产生的答案,结合验证策略确定最终输出。

(三)基于LLM的元代理

MAS-Zero使用大型语言模型(LLM)作为元代理,负责任务分解、生成MAS代码、反馈生成及结果验证。元代理在推理过程中不断学习和进化,逐步优化MAS设计。

(四)自我监督学习

整个过程不依赖外部验证集或人类监督,仅通过系统自身的执行结果和反馈信号进行自我监督学习,从而提高系统的性能和适应性。

三、主要功能

(一)自动设计多智能体系统(MAS)
MAS-Zero无需人类手动设计智能体角色和通信协议,能够根据具体问题自动生成适合的MAS结构,显著提高系统对新任务的适应性和性能。

(二)动态适应问题
在推理阶段,针对每个问题实例进行动态的智能体组合和问题分解,使MAS更好地应对复杂多变的任务。

(三)无需验证集监督
不依赖于预先标注的验证集调整和优化MAS配置,降低了对数据的需求,提高了系统的灵活性和实用性。

(四)性能优化
基于元级设计和自验证机制,不断迭代改进MAS设计,提升系统在复杂任务上的准确率和效率,同时保持成本效益。

(五)自进化能力
在推理过程中,基于自我反馈和评估自动学习和进化,逐步优化MAS的设计和性能,无需外部监督信号。

四、性能表现

MAS-Zero在多个基准测试中表现出色,包括数学推理(AIME24)、研究生水平问答(GPQA)和代码生成(SWE-Bench)。它在这些领域中均优于手动设计的MAS和现有的自动MAS方法,平均准确率提升了7.44%。
【GitHub开源AI精选】Salesforce开源项目MAS-Zero:零监督下的多智能体系统设计框架

MAS-Zero在性能和成本之间达到了新的平衡。它在保持高性能的同时,显著降低了成本,成为当前最有效的自动MAS设计方法之一。

五、应用场景

(一)复杂问题求解
在数学、科学计算等地方,将复杂问题分解为多个子任务,提高求解效率和准确性。

(二)自然语言处理
用于高级问答系统和文本生成编辑,生成高质量的自然语言处理结果。

(三)软件工程
在代码生成、优化和软件测试中,将任务分解为多个子任务,提高软件开发和测试的效率与质量。

(四)医疗健康
应用于疾病诊断和治疗方案制定,提高医疗决策的准确性和个性化水平。

(五)教育领域
用于个性化学习和智能辅导,根据学生需求分解学习任务,提供定制化的学习路径和辅导内容,提升学习效果。

六、快速使用

(一)环境搭建

  1. 创建并激活Python环境:
conda create -n mas_zero python=3.12 && conda activate mas_zero
  1. 安装必要的Python包:
pip install anthropic openai backoff togetherpip install -r requirements.txtpip install datasets jinja2pip install -e human-eval

(二)运行MAS-Zero

  1. 配置API密钥:
export OPENAI_API_KEY={YourKey}export TOGETHER_API_KEY={YourKey}
  1. 执行搜索任务:
python main_question.py --dataset workflow_search/aime24 --option plan --meta_model gpt-4o_chatgpt --node_model gpt-4o_chatgpt --verifier_model gpt-4o_chatgpt --blocks COT COT_SC Reflexion LLM_debate --use_oracle_verifier --defer_verifier --n_generation 5
  1. 执行验证任务:
python main_judge.py --dataset aime24 --judge_method self --baseline workflow_search --model gpt-4o_chatgpt --min_sample 0 --max_sample 30 --max_response_per_sample 9

七、结语

MAS-Zero作为Salesforce推出的多智能体系统设计框架,以其零监督的自动设计能力和强大的自进化能力,为复杂任务的解决提供了全新的思路。它不仅在多个领域表现出色,还通过动态适应和自验证机制,显著提高了系统的灵活性和性能。随着技术的不断发展,MAS-Zero有望在更多领域发挥重要作用。

八、项目地址

  • 项目官网:https://mas-design.github.io/
  • GitHub仓库:https://github.com/SalesforceAIResearch/MAS-Zero
  • arXiv技术论文:https://arxiv.org/pdf/2505.14996

【GitHub开源AI精选】Salesforce开源项目MAS-Zero:零监督下的多智能体系统设计框架

🎯🔖更多专栏系列文章:AI大模型提示工程完全指南AI大模型探索之路(零基础入门)AI大模型预训练微调进阶AI大模型开源精选实践AI大模型RAG应用探索实践🔥🔥🔥 其他专栏可以查看博客主页📑

😎 作者介绍:资深程序老猿,从业10年+、互联网系统架构师,目前专注于AIGC的探索(CSDN博客之星|AIGC领域优质创作者)
📖专属社群:欢迎关注【小兵的AI视界】公众号或扫描下方👇二维码,回复‘入群’ 即刻上车,获取邀请链接。
💘领取三大专属福利:1️⃣免费赠送AI+编程📚500本,2️⃣AI技术教程副业资料1套,3️⃣DeepSeek资料教程1套🔥(限前500人)
如果文章内容对您有所触动,别忘了点赞、⭐关注,收藏!加入我们,一起携手同行AI的探索之旅,开启智能时代的大门!