【GitHub开源AI精选】Salesforce开源项目MAS-Zero：零监督下的多智能体系统设计框架

最新推荐文章于 2025-08-20 22:49:45 发布

原创最新推荐文章于 2025-08-20 22:49:45 发布 · 978 阅读

38 ·

CC 4.0 BY-SA版权

文章标签：

#开源 #人工智能 #AIGC #github

GitHub开源AI项目精选专栏收录该内容

175 篇文章

订阅专栏

系列篇章💥

No.	文章
1	【GitHub开源AI精选】LLM 驱动的影视解说工具：Narrato AI 一站式高效创作实践
2	【GitHub开源AI精选】德国比勒费尔德大学TryOffDiff——高保真服装重建的虚拟试穿技术新突破
3	【GitHub开源AI精选】哈工大（深圳）& 清华力作 FilmAgent：剧本自动生成 + 镜头智能规划，开启 AI 电影制作新时代
4	【GitHub开源AI精选】Lumina - Image 2.0 文生图模型，以小参数量实现高分辨率多图生成新突破
5	【GitHub开源AI精选】探索 Mobile-Agent：X-PLUG 推出的创新型移动智能操作代理
6	【GitHub开源AI精选】吴恩达团队开源VisionAgent：用自然语言开启计算机视觉新时代
7	【GitHub开源AI精选】Oumi：一站式AI开发平台，涵盖训练、评估与部署全流程
8	【GitHub开源AI精选】深入剖析RealtimeSTT：开源实时语音转文本库的强大功能与应用
9	【GitHub开源AI精选】PodAgent：多智能体协作播客生成框架，自动化打造高质量播客，赋能内容创作与品牌传播
10	【GitHub开源AI精选】OpenManus开源AI工具：3小时复刻Manus，39.5k星
11	【GitHub开源AI精选】OpenGlass：大模型赋能的开源方案，25美元打造智能眼镜，支持语音控制+AR叠加
12	【GitHub开源AI精选】AppAgentX：西湖大学发布可自主进化的手机智能体，实现GUI操作的高效与智能
13	【GitHub开源AI精选】Agent-S架构揭秘：低代码+多模态融合的智能体新范式
14	【GitHub开源AI精选】Open-Interface：大模型驱动的计算机“自动驾驶”系统｜自然语言操控的自动化工具
15	【GitHub开源AI精选】2025年AI工程师必备！AgentOps五大功能重构智能体开发流程
16	【GitHub开源AI精选】LangManus：社区驱动的多智能体AI自动化框架，开启复杂任务处理新纪元
17	【GitHub开源AI精选】autoMate：AI 驱动的本地自动化助手，用自然语言解锁高效办公，让电脑任务自己动起来
18	【GitHub开源AI精选】Sitcom-Crafter：北航联合港中文等高校打造的剧情驱动3D动作生成系统
19	【GitHub开源AI精选】Local Deep Researcher：本地化部署的AI研究助手，零门槛开启智能研究
20	【GitHub开源AI精选】Browser Use：开源AI自动化工具，让AI像人类一样操控网页
21	【GitHub开源AI精选】LLaVA-Med：微软打造的生物医学领域多模态AI助手，助力医疗智能化
22	【GitHub开源AI精选】RF-DETR：Roboflow 的实时目标检测模型『边缘设备鹰眼』，低至160FPS的工业级检测利器
23	【GitHub开源AI精选】MegaTTS 3：字节跳动开源语音利器，吊打VALL-E，自然度逼近真人录音
24	【GitHub开源AI精选】LocAgent：斯坦福联合耶鲁大学等机构推出的代码问题定位智能体
25	【GitHub开源AI精选】WhisperX：70倍实时语音转录！革命性词级时间戳与多说话人分离技术
26	【GitHub开源AI精选】Crawl4AI：LLM专属极速开源爬虫利器、1秒处理百万级数据
27	【GitHub开源AI精选】Oliva：开源语音RAG助手，一句话秒搜海量数据，多AI协作颠覆传统搜索
28	【GitHub开源AI精选】UFO²：微软开源的 Windows 桌面 Agent 操作系统，开启智能自动化新时代
29	【GitHub开源AI精选】ebook2audiobook：AI驱动的电子书转有声书利器，支持1107种语言+语音克隆
30	【GitHub开源AI精选】WebThinker：赋能大型推理模型的自主科研新范式
31	【GitHub开源AI精选】ZeroSearch：阿里巴巴开源的大模型搜索引擎框架，无需真实搜索引擎交互
32	【GitHub开源AI精选】Toolkami：极简AI Agent框架，七种工具实现高效轻量化开发
33	【GitHub开源AI精选】Docext：NanoNets 打造的文档提取利器，本地化、高效能、免费开源
34	【GitHub开源AI精选】SketchVideo：手残党福音！草图秒变大片，快手黑科技让创作效率飙升300%
35	【GitHub开源AI精选】NLWeb：微软开源的自然语言交互利器，让网站秒变智能AI应用
36	【GitHub开源AI精选】ScrapeGraphAI：基于LLM的智能爬虫，多页面爬取、语音生成，开启数据提取新纪元
37	【GitHub开源AI精选】FaceShot：同济大学联合上海 AI Lab 推出的无需训练肖像动画生成框架
38	【GitHub开源AI精选】Minion Agent：开源界的“全能王”，深度研究、自动规划全搞定
39	【GitHub开源AI精选】AgenticSeek：开源本地通用AI Agent，打造自主执行任务的智能助手
40	【GitHub开源AI精选】Morphik：开源多模态检索增强生成工具，助力AI应用开发
41	【GitHub开源AI精选】TEN VAD：高性能实时语音活动检测系统，助力AI对话系统高效交互
42	【GitHub开源AI精选】Google AI Edge Gallery：谷歌赋能的离线AI模型探索利器
43	【GitHub开源AI精选】PandasAI：一键开启数据对话时代，非技术用户也能轻松上手
44	【GitHub开源AI精选】ContentV：字节跳动开源的高效文生视频模型框架，助力AI视频生成技术突破
45	【GitHub开源AI精选】VRAG-RL：阿里通义推出的多模态RAG推理框架，助力视觉信息理解与生成
46	【GitHub开源AI精选】MultiTalk：中山大学与美团联合打造的音频驱动多人对话视频生成框架
47	【GitHub开源AI精选】Salesforce开源项目MAS-Zero：零监督下的多智能体系统设计框架

前言

在人工智能领域，多智能体系统（MAS）作为一种强大的工具，能够通过多个智能体的协作解决复杂问题。然而，传统的MAS设计依赖于人工设计智能体角色和通信协议，这不仅效率低下，还难以适应新任务。Salesforce最新推出的MAS-Zero框架，以其零监督的自动设计能力，为这一领域带来了突破性的进展。
在这里插入图片描述

一、项目概述

MAS-Zero是Salesforce推出的一个创新的多智能体系统（MAS）设计框架，能够在无需人类监督的情况下自动设计和优化MAS。它基于元级设计，在推理时动态生成、评估和改进MAS配置，通过自验证机制从候选解决方案中选择最优结果。这一框架在数学推理、高级问答和代码生成等多个领域表现出色，且完全不依赖外部监督信号，展现了强大的自进化能力和灵活性。
在这里插入图片描述

二、技术原理

（一）元迭代（Meta-Iterations）

任务分解与MAS生成：MAS-Zero将复杂问题分解为多个子任务，并为每个子任务生成对应的MAS实现。它将MAS设计视为代码生成问题，通过元代理动态调整任务分解和MAS配置。
元级反馈：评估生成的MAS设计的可解性和完整性，基于中间输出判断当前MAS是否能有效解决问题，并生成反馈指导后续迭代改进。

（二）自验证（Self-Verification）

在多次元迭代后，从所有候选解决方案中选择最合适的结果，通过对比不同迭代产生的答案，结合验证策略确定最终输出。

（三）基于LLM的元代理

MAS-Zero使用大型语言模型（LLM）作为元代理，负责任务分解、生成MAS代码、反馈生成及结果验证。元代理在推理过程中不断学习和进化，逐步优化MAS设计。

（四）自我监督学习

整个过程不依赖外部验证集或人类监督，仅通过系统自身的执行结果和反馈信号进行自我监督学习，从而提高系统的性能和适应性。

三、主要功能

（一）自动设计多智能体系统（MAS）
MAS-Zero无需人类手动设计智能体角色和通信协议，能够根据具体问题自动生成适合的MAS结构，显著提高系统对新任务的适应性和性能。

（二）动态适应问题
在推理阶段，针对每个问题实例进行动态的智能体组合和问题分解，使MAS更好地应对复杂多变的任务。

（三）无需验证集监督
不依赖于预先标注的验证集调整和优化MAS配置，降低了对数据的需求，提高了系统的灵活性和实用性。

（四）性能优化
基于元级设计和自验证机制，不断迭代改进MAS设计，提升系统在复杂任务上的准确率和效率，同时保持成本效益。

（五）自进化能力
在推理过程中，基于自我反馈和评估自动学习和进化，逐步优化MAS的设计和性能，无需外部监督信号。

四、性能表现

MAS-Zero在多个基准测试中表现出色，包括数学推理（AIME24）、研究生水平问答（GPQA）和代码生成（SWE-Bench）。它在这些领域中均优于手动设计的MAS和现有的自动MAS方法，平均准确率提升了7.44%。
在这里插入图片描述

MAS-Zero在性能和成本之间达到了新的平衡。它在保持高性能的同时，显著降低了成本，成为当前最有效的自动MAS设计方法之一。

五、应用场景

（一）复杂问题求解
在数学、科学计算等领域，将复杂问题分解为多个子任务，提高求解效率和准确性。

（二）自然语言处理
用于高级问答系统和文本生成编辑，生成高质量的自然语言处理结果。

（三）软件工程
在代码生成、优化和软件测试中，将任务分解为多个子任务，提高软件开发和测试的效率与质量。

（四）医疗健康
应用于疾病诊断和治疗方案制定，提高医疗决策的准确性和个性化水平。

（五）教育领域
用于个性化学习和智能辅导，根据学生需求分解学习任务，提供定制化的学习路径和辅导内容，提升学习效果。

六、快速使用

（一）环境搭建

创建并激活Python环境：

conda create -n mas_zero python=3.12 && conda activate mas_zero

安装必要的Python包：

pip install anthropic openai backoff together
pip install -r requirements.txt
pip install datasets jinja2
pip install -e human-eval

（二）运行MAS-Zero

配置API密钥：

export OPENAI_API_KEY={YourKey}
export TOGETHER_API_KEY={YourKey}

执行搜索任务：

python main_question.py --dataset workflow_search/aime24 --option plan --meta_model gpt-4o_chatgpt --node_model gpt-4o_chatgpt --verifier_model gpt-4o_chatgpt --blocks COT COT_SC Reflexion LLM_debate --use_oracle_verifier --defer_verifier --n_generation 5

执行验证任务：

python main_judge.py --dataset aime24 --judge_method self --baseline workflow_search --model gpt-4o_chatgpt --min_sample 0 --max_sample 30 --max_response_per_sample 9

七、结语

MAS-Zero作为Salesforce推出的多智能体系统设计框架，以其零监督的自动设计能力和强大的自进化能力，为复杂任务的解决提供了全新的思路。它不仅在多个领域表现出色，还通过动态适应和自验证机制，显著提高了系统的灵活性和性能。随着技术的不断发展，MAS-Zero有望在更多领域发挥重要作用。

八、项目地址

项目官网：https://mas-design.github.io/
GitHub仓库：https://github.com/SalesforceAIResearch/MAS-Zero
arXiv技术论文：https://arxiv.org/pdf/2505.14996

在这里插入图片描述

😎 作者介绍：资深程序老猿，从业10年+、互联网系统架构师，目前专注于AIGC的探索（CSDN博客之星|AIGC领域优质创作者）
📖专属社群：欢迎关注【小兵的AI视界】公众号或扫描下方👇二维码，回复‘入群’ 即刻上车，获取邀请链接。
💘领取三大专属福利：1️⃣免费赠送AI+编程📚500本，2️⃣AI技术教程副业资料1套，3️⃣DeepSeek资料教程1套🔥（限前500人）
如果文章内容对您有所触动，别忘了点赞、⭐关注，收藏！加入我们，一起携手同行AI的探索之旅，开启智能时代的大门！