【GitHub开源AI精选】Salesforce开源项目MAS-Zero:零监督下的多智能体系统设计框架

系列篇章💥

No.文章
1【GitHub开源AI精选】LLM 驱动的影视解说工具:Narrato AI 一站式高效创作实践
2【GitHub开源AI精选】德国比勒费尔德大学TryOffDiff——高保真服装重建的虚拟试穿技术新突破
3【GitHub开源AI精选】哈工大(深圳)& 清华力作 FilmAgent:剧本自动生成 + 镜头智能规划,开启 AI 电影制作新时代
4【GitHub开源AI精选】Lumina - Image 2.0 文生图模型,以小参数量实现高分辨率多图生成新突破
5【GitHub开源AI精选】探索 Mobile-Agent:X-PLUG 推出的创新型移动智能操作代理
6【GitHub开源AI精选】吴恩达团队开源VisionAgent:用自然语言开启计算机视觉新时代
7【GitHub开源AI精选】Oumi:一站式AI开发平台,涵盖训练、评估与部署全流程
8【GitHub开源AI精选】深入剖析RealtimeSTT:开源实时语音转文本库的强大功能与应用
9【GitHub开源AI精选】PodAgent:多智能体协作播客生成框架,自动化打造高质量播客,赋能内容创作与品牌传播
10【GitHub开源AI精选】OpenManus开源AI工具:3小时复刻Manus,39.5k星
11【GitHub开源AI精选】OpenGlass:大模型赋能的开源方案,25美元打造智能眼镜,支持语音控制+AR叠加
12【GitHub开源AI精选】AppAgentX:西湖大学发布可自主进化的手机智能体,实现GUI操作的高效与智能
13【GitHub开源AI精选】Agent-S架构揭秘:低代码+多模态融合的智能体新范式
14【GitHub开源AI精选】Open-Interface:大模型驱动的计算机“自动驾驶”系统|自然语言操控的自动化工具
15【GitHub开源AI精选】2025年AI工程师必备!AgentOps五大功能重构智能体开发流程
16【GitHub开源AI精选】LangManus:社区驱动的多智能体AI自动化框架,开启复杂任务处理新纪元
17【GitHub开源AI精选】autoMate:AI 驱动的本地自动化助手,用自然语言解锁高效办公,让电脑任务自己动起来
18【GitHub开源AI精选】Sitcom-Crafter:北航联合港中文等高校打造的剧情驱动3D动作生成系统
19【GitHub开源AI精选】Local Deep Researcher:本地化部署的AI研究助手,零门槛开启智能研究
20【GitHub开源AI精选】Browser Use:开源AI自动化工具,让AI像人类一样操控网页
21【GitHub开源AI精选】LLaVA-Med:微软打造的生物医学领域多模态AI助手,助力医疗智能化
22【GitHub开源AI精选】RF-DETR:Roboflow 的实时目标检测模型『边缘设备鹰眼』,低至160FPS的工业级检测利器
23【GitHub开源AI精选】MegaTTS 3:字节跳动开源语音利器,吊打VALL-E,自然度逼近真人录音
24【GitHub开源AI精选】LocAgent:斯坦福联合耶鲁大学等机构推出的代码问题定位智能体
25【GitHub开源AI精选】WhisperX:70倍实时语音转录!革命性词级时间戳与多说话人分离技术
26【GitHub开源AI精选】Crawl4AI:LLM专属极速开源爬虫利器、1秒处理百万级数据
27【GitHub开源AI精选】Oliva:开源语音RAG助手,一句话秒搜海量数据,多AI协作颠覆传统搜索
28【GitHub开源AI精选】UFO²:微软开源的 Windows 桌面 Agent 操作系统,开启智能自动化新时代
29【GitHub开源AI精选】ebook2audiobook:AI驱动的电子书转有声书利器,支持1107种语言+语音克隆
30【GitHub开源AI精选】WebThinker:赋能大型推理模型的自主科研新范式
31【GitHub开源AI精选】ZeroSearch:阿里巴巴开源的大模型搜索引擎框架,无需真实搜索引擎交互
32【GitHub开源AI精选】Toolkami:极简AI Agent框架,七种工具实现高效轻量化开发
33【GitHub开源AI精选】Docext:NanoNets 打造的文档提取利器,本地化、高效能、免费开源
34【GitHub开源AI精选】SketchVideo:手残党福音!草图秒变大片,快手黑科技让创作效率飙升300%
35【GitHub开源AI精选】NLWeb:微软开源的自然语言交互利器,让网站秒变智能AI应用
36【GitHub开源AI精选】ScrapeGraphAI:基于LLM的智能爬虫,多页面爬取、语音生成,开启数据提取新纪元
37【GitHub开源AI精选】FaceShot:同济大学联合上海 AI Lab 推出的无需训练肖像动画生成框架
38【GitHub开源AI精选】Minion Agent:开源界的“全能王”,深度研究、自动规划全搞定
39【GitHub开源AI精选】AgenticSeek:开源本地通用AI Agent,打造自主执行任务的智能助手
40【GitHub开源AI精选】Morphik:开源多模态检索增强生成工具,助力AI应用开发
41【GitHub开源AI精选】TEN VAD:高性能实时语音活动检测系统,助力AI对话系统高效交互
42【GitHub开源AI精选】Google AI Edge Gallery:谷歌赋能的离线AI模型探索利器
43【GitHub开源AI精选】PandasAI:一键开启数据对话时代,非技术用户也能轻松上手
44【GitHub开源AI精选】ContentV:字节跳动开源的高效文生视频模型框架,助力AI视频生成技术突破
45【GitHub开源AI精选】VRAG-RL:阿里通义推出的多模态RAG推理框架,助力视觉信息理解与生成
46【GitHub开源AI精选】MultiTalk:中山大学与美团联合打造的音频驱动多人对话视频生成框架
47【GitHub开源AI精选】Salesforce开源项目MAS-Zero:零监督下的多智能体系统设计框架


前言

在人工智能领域,多智能体系统(MAS)作为一种强大的工具,能够通过多个智能体的协作解决复杂问题。然而,传统的MAS设计依赖于人工设计智能体角色和通信协议,这不仅效率低下,还难以适应新任务。Salesforce最新推出的MAS-Zero框架,以其零监督的自动设计能力,为这一领域带来了突破性的进展。
在这里插入图片描述

一、项目概述

MAS-Zero是Salesforce推出的一个创新的多智能体系统(MAS)设计框架,能够在无需人类监督的情况下自动设计和优化MAS。它基于元级设计,在推理时动态生成、评估和改进MAS配置,通过自验证机制从候选解决方案中选择最优结果。这一框架在数学推理、高级问答和代码生成等多个领域表现出色,且完全不依赖外部监督信号,展现了强大的自进化能力和灵活性。
在这里插入图片描述

二、技术原理

(一)元迭代(Meta-Iterations)

  1. 任务分解与MAS生成:MAS-Zero将复杂问题分解为多个子任务,并为每个子任务生成对应的MAS实现。它将MAS设计视为代码生成问题,通过元代理动态调整任务分解和MAS配置。
  2. 元级反馈:评估生成的MAS设计的可解性和完整性,基于中间输出判断当前MAS是否能有效解决问题,并生成反馈指导后续迭代改进。

(二)自验证(Self-Verification)

在多次元迭代后,从所有候选解决方案中选择最合适的结果,通过对比不同迭代产生的答案,结合验证策略确定最终输出。

(三)基于LLM的元代理

MAS-Zero使用大型语言模型(LLM)作为元代理,负责任务分解、生成MAS代码、反馈生成及结果验证。元代理在推理过程中不断学习和进化,逐步优化MAS设计。

(四)自我监督学习

整个过程不依赖外部验证集或人类监督,仅通过系统自身的执行结果和反馈信号进行自我监督学习,从而提高系统的性能和适应性。

三、主要功能

(一)自动设计多智能体系统(MAS)
MAS-Zero无需人类手动设计智能体角色和通信协议,能够根据具体问题自动生成适合的MAS结构,显著提高系统对新任务的适应性和性能。

(二)动态适应问题
在推理阶段,针对每个问题实例进行动态的智能体组合和问题分解,使MAS更好地应对复杂多变的任务。

(三)无需验证集监督
不依赖于预先标注的验证集调整和优化MAS配置,降低了对数据的需求,提高了系统的灵活性和实用性。

(四)性能优化
基于元级设计和自验证机制,不断迭代改进MAS设计,提升系统在复杂任务上的准确率和效率,同时保持成本效益。

(五)自进化能力
在推理过程中,基于自我反馈和评估自动学习和进化,逐步优化MAS的设计和性能,无需外部监督信号。

四、性能表现

MAS-Zero在多个基准测试中表现出色,包括数学推理(AIME24)、研究生水平问答(GPQA)和代码生成(SWE-Bench)。它在这些领域中均优于手动设计的MAS和现有的自动MAS方法,平均准确率提升了7.44%。
在这里插入图片描述

MAS-Zero在性能和成本之间达到了新的平衡。它在保持高性能的同时,显著降低了成本,成为当前最有效的自动MAS设计方法之一。

五、应用场景

(一)复杂问题求解
在数学、科学计算等领域,将复杂问题分解为多个子任务,提高求解效率和准确性。

(二)自然语言处理
用于高级问答系统和文本生成编辑,生成高质量的自然语言处理结果。

(三)软件工程
在代码生成、优化和软件测试中,将任务分解为多个子任务,提高软件开发和测试的效率与质量。

(四)医疗健康
应用于疾病诊断和治疗方案制定,提高医疗决策的准确性和个性化水平。

(五)教育领域
用于个性化学习和智能辅导,根据学生需求分解学习任务,提供定制化的学习路径和辅导内容,提升学习效果。

六、快速使用

(一)环境搭建

  1. 创建并激活Python环境:
conda create -n mas_zero python=3.12 && conda activate mas_zero
  1. 安装必要的Python包:
pip install anthropic openai backoff together
pip install -r requirements.txt
pip install datasets jinja2
pip install -e human-eval

(二)运行MAS-Zero

  1. 配置API密钥:
export OPENAI_API_KEY={YourKey}
export TOGETHER_API_KEY={YourKey}
  1. 执行搜索任务:
python main_question.py --dataset workflow_search/aime24 --option plan --meta_model gpt-4o_chatgpt --node_model gpt-4o_chatgpt --verifier_model gpt-4o_chatgpt --blocks COT COT_SC Reflexion LLM_debate --use_oracle_verifier --defer_verifier --n_generation 5
  1. 执行验证任务:
python main_judge.py --dataset aime24 --judge_method self --baseline workflow_search --model gpt-4o_chatgpt --min_sample 0 --max_sample 30 --max_response_per_sample 9

七、结语

MAS-Zero作为Salesforce推出的多智能体系统设计框架,以其零监督的自动设计能力和强大的自进化能力,为复杂任务的解决提供了全新的思路。它不仅在多个领域表现出色,还通过动态适应和自验证机制,显著提高了系统的灵活性和性能。随着技术的不断发展,MAS-Zero有望在更多领域发挥重要作用。

八、项目地址

  • 项目官网:https://mas-design.github.io/
  • GitHub仓库:https://github.com/SalesforceAIResearch/MAS-Zero
  • arXiv技术论文:https://arxiv.org/pdf/2505.14996

在这里插入图片描述

🎯🔖更多专栏系列文章:AI大模型提示工程完全指南AI大模型探索之路(零基础入门)AI大模型预训练微调进阶AI大模型开源精选实践AI大模型RAG应用探索实践🔥🔥🔥 其他专栏可以查看博客主页📑

😎 作者介绍:资深程序老猿,从业10年+、互联网系统架构师,目前专注于AIGC的探索(CSDN博客之星|AIGC领域优质创作者)
📖专属社群:欢迎关注【小兵的AI视界】公众号或扫描下方👇二维码,回复‘入群’ 即刻上车,获取邀请链接。
💘领取三大专属福利:1️⃣免费赠送AI+编程📚500本,2️⃣AI技术教程副业资料1套,3️⃣DeepSeek资料教程1套🔥(限前500人)
如果文章内容对您有所触动,别忘了点赞、⭐关注,收藏!加入我们,一起携手同行AI的探索之旅,开启智能时代的大门!

评论 24
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

寻道AI小兵

🐳 感谢你的巨浪支持!

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值