Dify “Agent节点” 让工作流学会 “自主推理”，小白零基础收藏这一篇就够了！！

最新推荐文章于 2025-06-16 14:45:32 发布

原创最新推荐文章于 2025-06-16 14:45:32 发布 · 2.1k 阅读

19 ·

CC 4.0 BY-SA版权

文章标签：

#人工智能 #大模型入门 #AI大模型 #大模型学习 #Dify #Agent #模型推理

前言

在以往常见的Dify工作流里面，工具的调用逻辑是预先编排好的，不够灵活，无法适应复杂场景。随着大型语言模型（LLM）推理能力的不断增强，Dify推出Agent节点，利用大模型自主调 用工具。通过集成不同的Agent推理策略，使LLM能在运行时动态选择并执行工具，增强工具调用灵活性。

Agent节点与 Agent策略

Agent节点（执行单元）
工作流的“决策中心”。它分配资源、管理状态，并记录整个推理过程。

Agent策略（决策逻辑）

Agent策略，是一个可插拔的推理算法模块（可以具象为提示词），定义了如何使用工具以及如何解决问题，它是嵌入Agent节点来产生作用的。

目前Dify市场上有四种Agent策略插件，见下图：

Agent节点类似LLM节点，它处理特定任务，并将最终响应返回给下一个节点。Agent节点和Agent策略这种解耦设计就像将汽车的发动机与控制系统分开一样——开发人员可以在不影响整体架构的情况下升级“动力系统”。

在工作流中，Agent节点为多步工具推理实现了自主思考。一个最小的 Agent策略至少需要定义如何使用LLM API以及如何调用工具。

Agent Node 功能示意图 Agent节点功能示意图

Dify官方Agent策略插件介绍

Dify Agent策略插件

是Dify官方推出的，如下是它的安装方法：

Dify Agent策略插件提供了两种推理策略Function Calling和ReAct，下面进行简单对比：

1. Function Calling
Function Calling将用户命令映射到特定的函数或工具。LLM 识别用户的意图，决定调用哪个函数，并提取所需的参数。这是一种直接调用外部能力的简单机制，它的优点有：

精确：直接调用适合定义任务的正确工具，避免复杂的推理。
易于外部集成：将外部 API 和工具集成到可调用的函数中。
结构化输出：提供结构化的Function Calling信息，便于处理。

2. ReAct（推理 + 行动）
ReAct 在LLM推理和采取行动之间交替进行。LLM分析当前状态和目标，选择并使用一个工具，然后利用工具的输出进行下一步的思考和行动。这个循环会一直重复，直到问题得到解决，它的优点有：

• 利用外部信息：有效使用外部工具来收集模型单独无法处理的任务所需的信息。
• 可解释的推理：推理和行动步骤交织在一起，允许一定程度上跟踪Agent 的过程。
• 广泛适用性：适用于需要外部知识或特定行动的任务，例如问答、信息检索和任务执行。

Dify发布了策略开发的开放标准，

开发人员可以基于此标准进行各种其他策略开发：

（1）使用 CLI 工具快速创建策略插件

（2）自定义配置表单和可视化组件

（3）集成前沿的学术算法，例如：树状思维例如链式思维（CoT）、树状思维（ToT）、图状思维（GoT）、柱状思维（BoT）、语义内核（semantic kernels）等。

Agent节点配置方法简介

拖放式设置
只需从工具面板拖动一个 Agent节点，并通过三个步骤进行配置：
• 选择推理策略
• 链接工具/模型
• 设置提示模板
推理执行日志
Dify 的强大功能之一是其内置的日志机制，它会创建一个类似树状结构的代理思维过程。这种结构使您能够：

可视化代理的执行路径，以便调试复杂的多步推理
- 实时查看：
  - 总时间和令牌使用量
  - 每轮推理
  - 工具调用轨迹

Agent策略开发简介

定义 Agent 策略涉及指定语言模型将如何：

处理用户查询
选择正确的工具
使用正确的参数运行这些工具
处理结果
决定何时完成任务

开发者指南示意图

Dify提供了一个标准化开发工具包，其中包括策略配置组件库（例如模型选择器/工具编辑器）、结构化日志接口以及沙盒测试环境。

具体来说，策略定义涵盖了其身份和元数据、所需参数（模型、工具、查询等）、参数类型和约束以及源代码的位置。

代理的执行分为三个主要阶段：初始化、迭代循环和最终响应。在初始化阶段，系统设置所有必要的参数、工具和上下文。然后，在迭代循环中，系统根据当前上下文准备提示，并使用有关可用工具的信息调用 LLM。它解析 LLM 的响应，以确定是否需要工具调用，或者是否已经得出最终答案。如果需要工具调用，系统将执行该工具，并将其输出更新到上下文中。此循环会一直持续，直到任务完成或达到预设的迭代限制。最后，在最后一个阶段，系统返回最终答案或结果。

例如，一个 function_calling.yaml 文件可能如下所示：

parameters:
  -name:model
    type:model-selector
    scope:tool-call&llm
-name:tools
    type:array[tools]
-name:max_iterations
    type:number
    default:5
extra:
python:
    source: function_calling.py

采用于这种声明式架构，配置策略变得和填表一样简单，同时支持：

动态参数验证（类型/范围/依赖关系）
自动多语言标签渲染

详见https://docs.dify.ai/zh-hans/plugins/quick-start/develop-plugins/agent-strategy-plugin。

迭代计划

Dify计划进一步对Agent节点进行迭代，添加更多对开发人员友好的组件，例如：

知识库集成
Chatflow 中的内存支持
错误处理和重试
更多官方 Agent 策略

未来展望示意图

最后

为什么要学AI大模型

当下，⼈⼯智能市场迎来了爆发期，并逐渐进⼊以⼈⼯通⽤智能（AGI）为主导的新时代。企业纷纷官宣“ AI+ ”战略，为新兴技术⼈才创造丰富的就业机会，⼈才缺⼝将达 400 万！

DeepSeek问世以来，生成式AI和大模型技术爆发式增长，让很多岗位重新成了炙手可热的新星，岗位薪资远超很多后端岗位，在程序员中稳居前列。

在这里插入图片描述

与此同时AI与各行各业深度融合，飞速发展，成为炙手可热的新风口，企业非常需要了解AI、懂AI、会用AI的员工，纷纷开出高薪招聘AI大模型相关岗位。
在这里插入图片描述
最近很多程序员朋友都已经学习或者准备学习 AI 大模型，后台也经常会有小伙伴咨询学习路线和学习资料，我特别拜托北京清华大学学士和美国加州理工学院博士学位的鲁为民老师给大家这里给大家准备了一份涵盖了AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频 全系列的学习资料，这些学习资料不仅深入浅出，而且非常实用，让大家系统而高效地掌握AI大模型的各个知识点。