朝阳区靓仔_James-CSDN博客

原创从DeepSeek 的爆火看 AI，应用的新范式和大模型从业者的未来

鲁为民博士清华学士，加州理工学院博士中国人工智能最高奖“吴文俊人工智能科学技术奖”2023年获得者刘井平博士华东理工大学副教授复旦大学博士多项研究成果在美团、淘宝、蚂蚁金服、华为等公司进行落地胡箐金智维首席科学家前Meta 旗下LLaMA大模型初创团队核心成员之一前微软技术部门负责人，Exchange online、Azure AI 等产品线研发负责人20年的AI技术研发与应用经验时间：2月22日星期六面向受众：大模型及AI技术人员和爱好者和企业技术主管等。

2025-02-21 16:00:14 587

原创 20250905_195055_万字剖析多Agent系统：智能海报项目拆解

AI领域比较火的几个词，我们先大概走马灯一下：

2025-09-05 19:58:05 494

原创别让噪音毁了你的RAG！从OCR纠错到知识库清洗，企业级降噪方案全公开（收藏级）

RAG文档处理的原则是找出有效数据，剔除无效数据，而不是为了大而全整一堆没用的数据。

2025-09-04 20:05:40 691

原创 LangGraph实战秘籍：工作流与智能体区别全解析，零基础也能轻松掌握！

本教程将探讨智能体系统常见的几种模式。在描述这些系统时，区分“工作流”和“智能体 (Agent)” 会很有帮助。

2025-09-03 19:47:38 846

原创 2025年AI Agent必学技术！A-Mem智能记忆系统实战指南：从环境整合到任务处理，一篇吃透！

尽管大语言模型（LLM）智能体能够有效利用外部工具处理复杂的现实世界任务，但它们需要记忆系统来利用历史经验。当前的记忆系统虽能实现基本的存储和检索功能，但缺乏完善的记忆组织方式 —— 尽管近年来已有研究尝试整合图数据库。此外，这些系统的固定操作和结构限制了其在不同任务中的适应性。为解决这一局限，本文提出了一种新型的面向大语言模型智能体的智能记忆系统，该系统能够以智能体驱动的方式动态组织记忆。遵循卡片盒笔记法（Zettelkasten）的基本原理，我们设计的记忆系统通过动态索引和链接构建相互关联的知识网络。当

2025-09-02 19:58:09 973

原创收藏这篇就够了！LLM智能体代码生成实战手册，小白也能玩转AI开发！

想象一下，未来编写软件不再需要逐行敲代码，而是像对一位超级智能的“数字员工”描述需求，它就能自动分析、设计、编码、测试，最终交付可运行的软件。这并非科幻，而是“基于大语言模型（LLM）的代码生成代理”正在带来的革命。传统的代码生成技术，无论是早期的程序合成（依赖难以编写的严格形式化规约），还是数据驱动的深度学习模型（常生成有语法/语义错误、功能有限的片段），都难以独立完成复杂的软件开发任务。LLM的出现（如Codex、CodeLlama、DeepSeek-Coder）带来了曙光，它们通过海量代码数据预训练，

2025-09-01 19:45:15 753

原创 20250830_221322_打破幻觉！Qwen最新OCR让印章、表格、公式识别准确率飙升

基于推理增强框架的视觉语言模型（VLM）以端到端的方式处理文本、表格和公式识别等任务已经取得了非常大的成就，但是仍然存在生成幻觉（hallucinations）的问题，即生成与输入图像不一致的内容，并且在特定领域的 OCR 任务上不如专门训练的专家模型有效。

2025-08-30 22:14:35 633

原创必看！Langraph Agent视觉网页浏览实战教程，从零到一轻松掌握！

这篇文章给大家讲一个好玩的东西——WebVoyager ，它是一个具备视觉功能的网页浏览智能体，能够控制鼠标和键盘来自动执行网页操作任务。这个智能体通过查看带有标注的浏览器截图来工作，然后选择下一步要执行的操作。WebVoyager 通过对网页截图进行自动标注生成带编号的可交互元素边界框，然后由多模态大语言模型基于视觉信息进行推理决策，最终通过模拟鼠标点击、键盘输入、页面滚动等操作来自动完成复杂的网页浏览和信息检索任务。接下来我们就通过langraph来完成这个agent的构建。

2025-08-29 19:49:02 627

原创 AI产品经理必备！一张图吃透大模型产品架构，大厂都在偷偷学

一张好的架构图，能让老板看到价值，让技术看到实现路径，让业务看到落地场景

2025-08-28 19:47:24 1008

原创字节跳动大模型算法工程师面试秘籍大公开！从准备到offer，一篇搞定社招全流程

今天分享的是字节跳动的大模型算法工程师社招面经。背景：C9本硕，大厂2年经验，二面挂

2025-08-27 19:47:29 696

原创 Agentic RAG完全指南：LangGraph+Qwen实战教程，一篇掌握智能知识增强！

检索增强生成（RAG）彻底改变了AI系统访问和利用外部知识进行推理的模式。然而，随着应用场景复杂性的不断提升，传统RAG方法的局限性也日益凸显。如今，RAG正从单一的线性流程，进化为能够根据查询复杂度和上下文，动态调整检索与生成策略的智能自适应系统。

2025-08-26 19:48:12 698

原创 AI智能体提示词全攻略：从入门到精通，解锁「全维度框架」的核心秘籍，收藏这一篇就够了！

全维度智能体提示词框架(Comprehensive Agent Prompting Framework, 简称CAP Framework)说明：在阅读这篇文章之前，对AI智能体不熟悉朋友建议先了解[AI 智能体]相关的概念。以便更好的掌握全维度智能体提示词框架(CAP)，既知道为什么要这么设计提示词的问题，又为设计提示词垫定更加坚实的理论基础。

2025-08-25 19:31:28 880

原创大模型之后看Agent！2025年最火应用方向，零基础也能秒懂

如果你错过了2012年的微信公众号，也错过了2015年的短视频，那么一定不要错过2025年的AI Agent（智能体）。

2025-08-22 22:06:31 845

原创收藏级！从零搭建分层知识增强RAG，代码+原理全拆解

现有基于知识图谱(KG)的检索增强生成(RAG)方法在处理领域特定任务时存在两大关键挑战：

2025-08-21 19:56:46 607

原创从零玩转AI智能体！LLM+RAG意图识别全攻略，手把手教你实战落地

在构建AI智能体的征途中，精准的**意图识别（Intent Detection）**是决定成败的第一道关卡。它负责将用户自由形式的输入（Query）映射到系统预定义的具体任务上，例如“查询天气”、“预订机票”或“播放音乐”。随后的**槽位抽取（Slot Filling）**则从输入中提取执行任务所需的关键参数，如“北京”、“明天”或“周杰伦”。

2025-08-20 19:35:52 613

原创企业级AI机器人构建秘籍：LangGraph+Qwen2.5私有化部署完全手册

最近学习langgraph，试试了官方的项目，基于agent的方式构建一个机器人，挺好玩的，分享给大家。

2025-08-19 19:42:29 714

原创文科生逆袭AI赛道，3个月从零基础到月入3万，我终于吃上了时代红利！

今年四月春招期间，一些互联网公司释出了“AI人文训练师”的岗位，要求应聘者受过文史哲、艺术等学科的专业训练，负责“AI的文学与艺术表达训练”、“提升AI的多元智能水平”和“构建生动的human-AI交互体验”。招聘平台上显示，正职月薪可达3-5万元。

2025-08-18 20:26:09 892

原创智能体Agent完全指南：从核心架构到业务落地的终极教程，一篇吃透！

智能体（Agent）** 是指能够**感知环境**、**进行决策**并**采取行动**以实现某种目标的系统。

2025-08-16 11:15:07 779

原创 AI Agent快速入门教程（超详细），从零到精通AI Agent，收藏这一篇就够了！

AI Agent的崛起不仅仅是技术上的突破，更是对软件开发理念的一次深刻变革。

2025-08-15 13:52:07 764

原创收藏这篇就够了！多模态大模型从入门到精通：5分钟看懂与文本模型的本质区别，响应提速90%的实战秘籍！

什么是多模态大语言模型**？多模态大语言模型是能够处理多种类型输入的大语言模型，其中每个 “模态” 指的是一种特定类型的数据，如文本（就像传统大语言模型那样）、声音、图像、视频等。为简单起见，我们将主要关注图像模态以及文本输入。

2025-08-14 20:03:34 881

原创零基础也能玩转AI大模型！RAG智能问答系统搭建秘籍，收藏这篇就够了！

在微信公众号与大模型平台之间建立连接，实现微信公众号对话场景中与 RAG 的问答交互。

2025-08-13 19:44:30 974

原创 LangChain快速入门教程（超详细），从零到精通AI大模型，收藏这一篇就够了！

简单说LangChain就是一个用于开发由大型语言模型（llm）支持的应用程序的框架。

2025-08-12 19:55:46 984

原创一文掌握工作流与Agent：选型决策+高效实施双攻略，收藏这一篇就够了！

"Agent"有多种定义方式。部分客户将其视为完全自主系统，能在较长时间内独立运行，使用各种工具完成复杂任务。也有人用此术语描述更固定的、预定义的工作流。Anthropic将这些变体归类为**类Agent系统**，但在**工作流**和**智能体**间做了重要区分：

2025-08-11 19:43:01 1075

原创首篇AI大模型全攻略：零基础掌握核心技术，从入门到精通的终极指南

在指尖就能触达世界的今天，在线互联网早已深度重塑了我们的生活图景——从随时获取的全球资讯、即时送达的电商购物，到无缝连接的社交互动。

2025-08-08 20:58:24 1039

原创从大模型到智能体，这份成长指南请收藏

当 DeepSeek、MCP、Agent 这些名字像潮水般涌入你的视野，是不是既期待又有些迷茫？别慌，这正是你已经迈入智能体元年的信号！

2025-08-07 19:44:00 812

原创一文学习2025年大模型应用落地白皮书：企业AI转型行动指南

在数字经济时代，企业数字化转型已成为全球竞争的核心议题。根据国际数据公司（IDC）的预测，到2025年，全球将有超过90%的企业采用某种形式的AI技术。这一趋势的背后，是技术革新、市场需求变化以及政策推动的多重因素共同作用的结果。企业数字化转型不仅涉及技术层面的升级，更需要通过“数据+算力+算法”的深度融合，实现资源优化配置与业务模式创新。

2025-08-06 20:24:36 1068

原创大模型赋能企业数字化转型

随着人工智能(AI)技术的兴起，大模型成为从信息化走向数智化的重要驱动力。虽然基于大算力支持和超大规模语言数据作为训练样本的大模型技术能够支持自动文摘、机器翻译等基础通用任务，但在医疗、金融等专业领域中，由于缺乏行业知识，无法满足定制化、精细化和行业化的需求。

2025-08-05 20:44:34 1064

原创大白话聊AI：同事跳槽涨薪一倍的具身智能行业到底是什么？（大模型篇）

刷朋友圈的时候，看到隔壁组的同事从我厂大跳槽到了某大厂，做具身智能方向的工作，待遇直接翻番，我的哈喇子情不自禁地直流下来：“哇靠，为什么这具身智能到底是什么鬼东西？我能不能跳槽过去也来个涨薪100%？”有钱能使鬼推磨，在“钱动力”的推动下，周五下班回家就啪啪打开电脑，从朋友那里薅来一堆具身智能行业报告，闭关24小时，总算研究了个七七八八，然后特激动地想要给朋友们分享我的成果，请朋友们耐心读下去，看自己有没有机会也能蹭上具身智能的风口，搞到百万年薪，或者当一回巴菲特，价值投资一个具身智能的好企业。

2025-08-04 19:42:44 732

原创【实战干货】AI大模型工程应用于车联网场景的实战总结

本文介绍了图像生成技术在AIGC领域的发展历程、关键技术和当前趋势，以及这些技术如何应用于新能源汽车行业的车联网服务中。

2025-08-01 18:56:33 712

原创 AI大模型时代要掌握哪核心技术

现在的风口是ai大模型，ai应用，ai开发，web领域已经过去，ai llm大模型加持各领域如硬件，电子，机械，自动化等，将让ai llm具备手和脚的能力，强大的大脑作为这些领域的核心，而它们的核心底层就是数学，算法，编译原理，数据结构等，ai大模型将促进生产端超高速发展，消费端由人来消费完全跟不上速度，生产和消费已经构成矛盾，生产端服务端已经是ai大模型时代，消费端跟不上已经是事实，失业只会越来越严重。

2025-07-31 19:40:17 634

原创当家电拥抱大模型

AI热潮之下，头部家电品牌竞相发力“AI+家电”模式，一方面加强自主研发，布局AI大模型赛道，另一方面积极接入DeepSeek等开源大模型，加速AI赋能下的家电智能化进程。

2025-07-30 19:42:34 634

原创 2025年小结：从大模型算法工程师面试官的角度，聊聊今年就业情况

2022年11月，OpenAI 的 ChatGPT 横空出世，AI 行业出现了前所未有的重新洗牌局面。

2025-07-29 19:55:11 570

原创从“人”开始，AI 大模型高效转型指南

本文将讲述莱拉（Leila）的故事。她是一位 AI 领军人物，成功克服了诸多与人相关的挑战，最终引领公司走上了 AI 落地的正确道路。我们将围绕以下要点展开讨论：

2025-07-26 10:29:50 904

原创大模型在垂直行业领域的迁移应用入门基础教程（非常详细），大模型入门到精通，收藏这一篇就够了！

大模型的训练需要大量的资金投入，只有少数大型企业才有可能推出与ChatGPT竞争的大模型。中小规模的企业只能选择低成本的垂直领域迁移技术，通过结合领域数据在开源基座模型上进行微调，并结合提示词工程，这可能是平衡垂直领域迁移效果与成本的最佳技术选型。本文从整体上介绍了主流的大模型在垂直领域迁移应用的技术方案！

2025-07-25 16:54:07 752

原创阿里开源最新Qwen模型，开源圈的新王，超K2~

近期，阿里开源了两个最新Qwen模型：Qwen3-235B-A22B-Instruct-2507，Qwen3-Coder-480B-A35B-Instruct，热度很高！效果上，超过DeepSeek V3和Kimi K2，以及闭源Claude4。妥妥的开源圈新王，卷起来。

2025-07-24 19:52:32 722

原创多模态视觉语言模型FILA入门基础教程（非常详细），多模态视觉语言模型FILA入门到精通，收藏这一篇就够了！

上图是四种在图片切图上的操作：如动态分辨率仅涉及裁剪图像并将其输入CLIP-ViT、mini-gemini在最后层将低分辨率的CLIP-ViT特征与高分辨率辅助分支进行交互，主要使用交叉注意力机制，c则采用通道级串联。本文介绍的方法使用一个模块将低分辨率和高分辨率进行融合实现交互，下面来看看如何实现。

2025-07-23 15:07:06 600

原创最强统一智能体，ChatGPT Agent入门基础教程（非常详细），ChatGPT Agent入门到精通，收藏这一篇就够了！

ChatGPT Agent，是2025年7月OpenAI发布的统一智能体，具备自主思考和行动的能力，通过整合 Operator + Deep Research + ChatGPT 本体，用户只需描述任务，ChatGPT Agent 就能自主判断所需工具，自动访问网页、提取信息、运行代码、生成 PPT 或表格等，并可在执行过程中实时展示相应步骤、接受临时中断和修改指令。

2025-07-22 19:38:43 854

原创大模型落地分层技术体系LLM＜RAG＜AI Agent＜Training

AI领域每隔一段时间都有新的概念和技术出来：年初DeepSeek火热带动深度推理模型，五一前阿里推出的Qwen3就升级为混合推理模型；3月份manus展示号称全球首款通用型智能体，到现在OpenAI和阿里也都有类似的通用Agent；Anthropic去年11月提出MCP标准，今年逐渐得到各大厂商的认可以后，Google今年4月份又提出A2A协议；Google去年底推出的DeepResearch研究报告，现在OpenAI和阿里也都有类似产品；还有之前的提示词工程，7月初大佬Andrej Karpathy提出上

2025-07-21 19:41:20 611

原创万字长文！从零开始构建你的第一个 ReAct Agent

其实对于 **AI Agent** 的介绍已经非常非常多了，简单来说，AI Agent 是一种具备“感知-思考-行动”能力的智能体，它能接收任务，自动推理并调用外部工具完成复杂流程。而在众多 Agent 架构中，**ReAct 框架（Reasoning + Acting）是一种非常经典的思维方式——它让大语言模型一边推理**（用 Thought 表达思考过程），一边**行动**（用 Action 执行操作），并根据返回结果（Observation）继续决策，直到给出最终的答案。

2025-07-18 21:47:04 874

原创基于 LangChain 6步构建企业级 AI 智能体应用

AI 智能体应用在企业场景中落地越来越多了，本文通过**从挑选企业业务场景开始，构建最小可行性产品（MVP），再到测试 AI 智能体应用的质量和安全性，最后到生产中的部署运维等全方位带你基于 LangChain 6步构建一个 AI 智能体应用

2025-07-17 19:46:46 951

空空如也

空空如也