AI大模型职业发展必备,快速提升职场稀缺算法落地技能,冲击AI高薪岗位。本课手把手带你拆解大模型原理、算法与训练调优(覆盖DeepSeek全新技术生态、Transformer、MoE、GRPO、预训练、微调(Fine-tuning)等),通过20+案例、2大企业级落地项目(政务系统、公文生成),从开发到微调全流程实战,助你快速掌握预训练、微调、部署、融合RAG、Agent的全链路核心技术,提升大模型算法开发与落地能力,增强职场竞争力。
从大模型原理、预训练和后训练、软件框架、落地实战与部署,融入RAG、Agent应用等技能,循序渐进的构建大模型全栈技术和视野
深入理解Transformer架构、混合专家系统(MoE)及DeepSeek独有的稀疏注意力优化,理解FP8混合精度训练、INT4量化推理等工业级技术;掌握核心前沿技术与原理。
深入万亿Token数据工程,结合DeepSpeed-Megatron等大模型训练框架;深度实战GRPO等强化学习算法,提升大模型训练和应用技术能力。
通过政务智能助理Agent、公文写作长文本生成等工业级项目,从开发到微调实战,掌握RAG增强检索与Agentic开发范式,学习模型安全沙箱机制与复杂业务系统部署;培养解决业务痛点的能力。
本项目结合大语言模型(LLM)与企业级Agent架构,专为政务场景优化设计,同时适配类似需求。系统突破性地支持十万字级长文档解析, 精准提取政策法规等复杂文本的核心信息,通过语义分析自动生成结构化摘要,构建知识库,解决传统政务系统长文本处理中的信息遗漏问题。集成多功能Function Call引擎,实现多场景智能调度。
· 项目框架搭建
· Prompts设计
· 文档检索、排序
· Agent助理构造
· 知识库构造与搭建
· 业务问题分析与分解
· 模型评估方法
· Bad case分析与调优
· 模型量化与分布式推理原理
· 大语言模型Function Call能力构建
· 训练数据构造方法
· 长文档分析、切分与理解
针对各种办公场景中的高频公文场景开发的智能化写作系统,深度融合公文规范与生成式AI技术,实现万字级长公文的结构化自动创作。突破传统写作工具局限,通过多级目录智能编排技术解决长文本逻辑紊乱、上下文矛盾、关联性不强的问题。
· 项目框架搭建与Prompts设计
· 长文本写作方案设计
· 参考写作方案设计
· 长文本数据构造
· 文本生成模型训练方法
· 多级目录训练数据构建
· 生成式场景效果评估方法
· 模型量化与分布式推理原理
· 一键部署脚本与资源调度运维
1. 输入标题 2. 内容概要与参考文献 3. 大纲生成与修改 4. 长文档生成
如无法下载使用图片另存为
下载海报选课、学习遇到问题?
扫码添加指导老师 1V1 帮助你!
添加后老师会第一时间解决你的问题