1.AI大模型四阶技术总览_ai 大模型四阶技术总览-CSDN博客

本文链接：https://blog.csdn.net/YPeng_Gao/article/details/139554307

本文深度解读AI发展的四轮浪潮，包括弱人工智能、机器学习、深度学习和大语言模型。重点介绍了AI大模型的四阶技术——提示工程、智能体、微调和预训练。提到了Prompt Engineering的最佳实践，如角色设定和问题拆解。此外，讨论了AI Agents的基础——ReAct范式，以及基于LangChain的智能体生态系统。同时，阐述了大模型微调的必要性和技术路线，如全量微调、参数高效微调等。最后，探讨了预训练技术的成本和挑战，以及未来的发展趋势。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

AI大模型四阶技术总览

深度解读 AI 发展四轮浪潮

• 技术浪潮：弱人工智能、机器学习、深度学习、大语言模型
• 应用浪潮：高校共识、硅谷创新、中美博弈
• 把握浪潮：AI 大模型助力超级个体和小团队

AI 大模型四阶技术总览

• 提示工程（Prompt Engineering）
• AI智能体（Agents）
• 大模型微调（Fine-tuning）
• 预训练技术（Pre-training）

技术对比

请添加图片描述

提示工程（Prompt Engineering）

Prompt : 大模型时代的沟通话术

请添加图片描述

基于GPT 的Prompt 技巧最佳实践

• 角色设定：擅于使用 System 给GPT设定角色和任务，如“哲学大师”；
• 指令注入：在 System 中注入常驻任务指令，如“主题创作”；
• 问题拆解：将复杂问题拆解成的子问题，分步骤执行，如：Debug 和多任务；
• 分层设计：创作长篇内容，分层提问，先概览再章节，最后补充细节，如：小说生成；
• 编程思维：将prompt当做编程语言，主动设计变量、模板和正文，如：评估模型输出质量；
• Few-Shot：基于样例的prompt设计，规范推理路径和输出样式，如：构造训练数据；

使用 LangChain 和 OpenAI API 自动化构造 Prompt
请添加图片描述

AI Agents（智能体）

AI Agents 基础：ReAct 范式

请添加图片描述

LangChain Agent: 构建复杂应用的代理系统

请添加图片描述

LangChain Agents 设计原理

Agents 的核心思想是使用LLM来决策一系列要执行的动作，以完成目标。

在链式结构（Chains）中，一系列动作执行是硬编码的（ SequentialChain 和 RouterChain 也仅实现了面向过程）。
在代理（Agents）中，语言模型被用作推理引擎，以确定应该采取哪些动作以及执行顺序。

请添加图片描述

LangChain Agents Ecosystem

规划（Planning）
• 提示（Prompt）：

LLM 多角色赋能
给予充分的上下文（例：从 Memory 获取）
学习策略（例：思维链 CoT）
• 代理（Agent）：决策下一步做什么
记忆（Memory）
• 短期（Short-term）：内存
• 长期（Long-term）：向量数据库
工具（Tools）
• 百花齐放的外部可调用服务

请添加图片描述

智能代理分类：
• 行动代理（Action agents）：旨在决定行动序列（工具使用）（例如OpenAI Funciton Call，ReAct）。
• 模拟代理（Simulation agents）：通常设计用于角色扮演，在模拟环境中进行（例如生成式智能体，CAMEL）
• 自主智能体（Autonomous agent）：旨在独立执行以实现长期目标（例如Auto-GPT， BabyAGI）。

基于 LangChain 的 RAG 应用设计

请添加图片描述