神州数码云基地-CSDN博客

原创 AGI｜一篇小白都能看懂的RAG入门介绍！

随着近几年AIGC的发展，不仅是大模型自身在不断优化，相关支持应用也在不断涌现。本文的主角便是这些技术中较为引人注目的RAG(Retrieval-Augmented Generation)——检索增强生成技术。LLM虽然已经在通识领域展现出了惊人的能力，但要落实到真正具体的问题解决，特别是针对专业领域，企业领域的一些具体的，私人的数据生成解决方案，仅仅依靠LLM还是远远不够的。

2024-02-20 11:22:14 4594 2

原创 AIGC｜LangChain新手入门指南，5分钟速读版！

你可以用langchain做一个属于自己的人工智能应用~

2023-11-27 10:07:49 2608

原创 AI时代的技术底座-向量数据库：一文讲清，建议收藏

向量数据库的前世今生，原理及应用场景合集

2023-11-20 09:59:42 4114 3

原创人工智能｜万字长文！一文带你弄懂AI技术及大模型演进的前世今生

一部大模型的历史演化进程

2023-08-21 09:54:41 2923

原创 AI越线了吗？从现实争议看日常开发中的伦理边界

近年来，AI在推荐系统、自动驾驶、搜索引擎等领域快速普及，深刻改变着我们的生活，却也在训练与决策环节暴露出偏见、隐私泄露与责任推诿等伦理隐患。本文将结合真实案例，解析开发与应用中的伦理边界，厘清AI“能做”与“可以做”的分界。

2025-07-16 14:00:27 498

原创《怎样做成大事》｜成功率仅0.5%？给项目管理者的一剂良方

《怎样做成大事》由世界知名项目管理专家、牛津大学教授傅以斌携手加德纳撰写。作者通过全球多个超大型项目的失败与成功案例，系统剖析了影响项目成败的关键因素。本期文章将带您了解一下，为什么只有0.5%的大项目能按预期交付，以及如何借鉴其中的方法论，避开职场中那些看不见的“坑”。

2025-07-11 10:55:54 851

原创 AGI｜Auto Hyperlink上线：鼠标点到哪，知识秒懂！

本文介绍了一个名为AutoHyperlink的开源项目，该项目能自动为网页文本添加超链接，点击可显示简介并跳转百科搜索。项目已开源，适用于技术文档和AI应用场景，旨在提升专业内容阅读体验。

2025-07-09 16:00:53 281

原创 AGI｜Browser Use —— AI代理浏览器

Browser Use 是一款专为大语言模型（LLM）设计的智能浏览器工具，旨在让 AI Agent 能够像人类一样自然地浏览和操作网页。它支持多标签页管理、视觉识别、内容提取，并能记录和重复执行特定动作。

2025-07-02 14:13:05 1057

原创 AGI｜RAG进化论：从青铜到王者，一文看懂 RAG 全家族

从RAG到Advanced RAG，详解RAG家族演变

2025-06-25 10:10:23 892

想象一下，知识图谱就像一张巨大的蜘蛛网，只不过网上挂的不是露珠，而是无数个知识点，比如"苹果""牛顿""万有引力""iPhone"……每个知识点（实体）之间用线（关系）连接起来，线上还贴着标签，比如"牛顿→发现→万有引力""苹果→是→水果"或者"小米→生产→小米su7"。类比于乐高积木：每个积木块代表一个事物（比如"雷军","水"），积木之间的接口形状不同，只有匹配的关系才能拼在一起（比如"雷军→喝→水"能拼，"雷军→喝→汽车"就拼不上）。

2025-06-12 10:15:59 805

原创 AGI｜基于FastMCP 2.0的MCP Server快速搭建指南

FastMCP是一个基于模型上下文协议(MCP)的开发框架，支持开发者快速构建与LLM交互的服务。通过工具(Tool)、资源(Resources)、提示(Prompt)和服务组合(ServerComposition)等核心概念，FastMCP实现了功能解耦和模块化开发。文章详细介绍了如何搭建单MCPServer和多Server组合的复杂应用，并以电商平台为例展示了服务组合的实际应用。该框架支持静态和动态资源、参数化提示模板，以及服务挂载和导入等组合方式，为AI应用开发提供了标准化的通信解决方案。最后探

2025-06-04 13:36:11 1235

原创斯坦福发布《2025年人工智能指数报告》：12大趋势总结AI发展

斯坦福大学以人为本人工智能研究所（Stanford HAI）发布了《2025 年人工智能指数报告》，本篇文章为大家带来了报告中提到了12个要点。

2025-05-27 11:27:53 1365

原创 AGI｜开源框架-Mem0解决AI长期记忆问题，让AI记住你的一切

Mem0技术通过构建智能记忆中枢，彻底改变了AI的"健忘症"问题。它实现了：1）长期存储用户个性化数据；2）动态更新交互记录；3）跨应用共享记忆。在教育领域，它能标记易错点并按节奏推送内容；医疗健康方面，可长期跟踪用药记录；游戏中则让NPC记住玩家历史选择。Mem0采用"记忆管理+RAG"协同架构，支持用户自定义记忆层次，并能自动提炼语义、降低过期信息权重。这项技术正在推动AI从工具向伙伴的转变，但也引发隐私保护等新思考。（148字）

2025-05-27 10:05:20 809

原创 AGI｜详解Google A2A协议，谁才是Agent的未来标准？

随着 Agent技术热度持续攀升，MCP与A2A等协议轮番登场，作为关键通信框架被推向科技前沿，引发了行业对"谁将主导智能体通信标准"的深度讨论。本篇文章带来A2A协议的介绍，以及它与MCP各自的优势又是什么。

2025-05-26 11:27:13 1067

原创 AGI｜爆火的MCP背后，为何被称作 AI 模型的“万能适配器”？

作为可能重塑AI生态的关键协议，MCP究竟是什么？其协议架构设计暗藏哪些创新突破？在实践中又面临哪些挑战？本次系列推文将从理论原理到实践操作，带您多角度了解MCP协议及使用方法。

2025-05-26 09:52:38 752

原创 AGI｜智能体总忘事？Letta框架如何让AI告别“金鱼记忆“？

letta是一个开源的AI智能体框架，它提供了agent、memory、model、tool等一系列的api和开发工具，方便开发人员构建一个有状态的agent，能够在长期对话中保持记忆和上下文。

2025-05-09 17:50:18 728

原创 AGI｜详解IPEX-LLM 与 OpenVino，嵌入生成的终极效率优化

OpenVINO是 Intel 推出的深度学习推理优化工具，主要用于在 Intel 硬件（CPU、GPU、VPU、FPGA、NPU）上高效运行 AI 推理任务。它能够优化和加速来自 TensorFlow、PyTorch、ONNX、PaddlePaddle 等框架训练的模型，提供高效的推理性能、低延迟以及跨平台兼容性。支持的硬件平台OpenVINO 适用于多种 Intel 硬件，支持异构计算CPU（Intel Xeon, Core, Atom 等）GPU（如 Intel Movidius）

2025-05-09 17:40:42 810

原创 AGI｜用好AI工具，你不得不知道的基本知识！

对于现阶段的 AI 工具来说，他们已经足够智能到理解我们自然语言的输入，也就是说你在使用 AI 工具时，即使将它当做一位同事自然地输入问题，他也能够基本理解你的意思并且回答你的问题。以文本生成领域为例，像 ChatGPT 、Deepseek、豆包等等我们常见的 AI 应用都是基于大语言模型所建立的 C 端产品，他们通过对海量文本数据的学习，能够理解语言的语法、语义和语境，从而生成连贯、自然且富有逻辑的文本。，如何在保持创造力的同时减少幻觉，是所有 AI 厂商面临的一个亟待解决的难题。

2025-04-27 13:47:11 568

原创 AGI｜AutoGen入门食用手册，搭建你的智能体流水线

AutoGen 是一个开源编程框架，用于构建AI代理并促进多个代理之间的合作以解决任务。它具有强大的可定制和可对话的代理，这些代理通过自动化的聊天将 LLM（大语言模型）、工具和人类集成在一起。通过自动化多个LLM代理之间的聊天，开发人员可以轻松地让他们自主或根据人工反馈共同执行任务，包括需要通过代码使用工具的任务。上图中，AutoGen使用多智能体对话实现了复杂的基于LLM的工作流。（左）AutoGen代理可以定制，可以基于LLM、工具、人员，甚至是它们的组合。

2025-04-11 17:38:19 933

原创 AGI｜AI驱动的前端代码生成和代码推荐

AI驱动生成前端代码的优势提高效率：AI可以自动生成复杂的UI组件或模板代码，减少开发者手动编写的时间。通过自动化生成，开发者能够集中精力于更有创意和技术挑战性的部分。提升代码质量：AI驱动的代码生成工具通常会基于大量的开源代码库进行训练，因此能够遵循最佳实践，减少代码中的潜在漏洞或性能瓶颈。缩短开发周期：通过自动化生成和即时的代码补全，开发者可以在更短的时间内完成项目，从而更快地推向市场。

2025-03-31 10:40:40 814

原创 AGI｜DeepSeek R1训练原理拆解：如何用GRPO革新传统训练

一起探索DeepSeek R1的训练原理及流程

2025-03-07 10:03:22 1291

原创 AI护照战争：全球技术签证如何重塑程序员国籍？

一场隐形的人才争夺战

2025-02-26 14:16:54 1275

原创 AGI｜从单机到集群，Milvus迁移完整复盘

数据不能丢，权限不能乱，业务不能停！

2025-02-21 15:47:40 1143

原创 AGI｜手把手教你搭建国际化Agent应用，打破语言壁垒！

用【神州问学】AI平台构建一个国际化环境下的Agent应用demo

2025-02-17 10:59:06 414

原创趋势洞察！IDC、Gartner、Forbes等权威机构解读2025年AI发展趋势

2025年，人工智能迈入深度应用和技术成熟的新阶段。以生成式AI、代理型AI、多模态模型为代表的技术，正从实验室走向实际应用，驱动产业变革与效率提升。AI技术不再仅仅是工具，而是行业创新、决策支持与生产力提升的核心引擎。科技大厂与创业者将在应用场景中竞相探索，以构建从技术到产品的完整闭环。尽管机遇与挑战并存，但我们需要以开放和负责任的态度拥抱AI技术。唯有深刻理解趋势、积极创新，企业才能在AI浪潮中占据主动，成为引领未来的重要力量。

2025-01-16 17:12:05 4370

原创 AGI｜祖传代码遇上 AI 智能体：企业技术债务怎么解决？

困扰众多企业已久的“技术债务”，那些能够正常运行的“祖传代码”在AI 智能体时代迎来了新的解决办法

2025-01-16 17:01:24 718

原创 AGI｜如何基于开源软件搭建属于你的私域知识库

本篇是基于AI的开源应用项目来对AIGC领域的技术做整体性的了解，包括业务、技术栈、技术名词等等。目的是快速学习相关的基本知识，为此找到一些可了解的开源应用，可以先本地部署跑起来理解大致的方向。

2025-01-09 11:14:49 795

原创开放获取｜2025年度800+页原创AI技术合集全新发布！

在年末之际，通明湖云和信创研究院-云基地第4本技术合集终于与大家见面了。正是你们的支持与鼓励，让我们在技术探索的道路上不断前行。如果各位读者觉得我们的持续编写与输出是有意义的，那么请将这些技术合集分享给更多有相同兴趣、积极向上的同事和朋友们。最后，新的一年希望能与大家继续携手前行，共同探索技术的无限可能。

2025-01-06 14:11:16 877

原创技术合集｜AI Agent 如何重塑工作的未来

本次技术合集凝聚了云基地成员们在过去一年的所思、所想、所为，精选了90+篇文章，内容涵盖人工智能理论研究、技术实战、数据库、云原生以及传统开发等多领域的研究与实践。

2024-12-25 10:55:57 1142

原创《认知觉醒》｜学会这三点，别让“伪自律”骗了你

明明知道，但是却做不到”“明明知道，如果这样做或者那样做了，事情会变得更好，但是却不愿意坚持下去”人生的道路上，许多人或许已经走在了通往终点的轨道上，但我们依然可以选择在任何时刻觉醒，开始改变。无论你是已步入职场、在社会中打拼的成年人，还是在学业中迷茫的年轻人；真正的成长始于自我觉察和行动。过去的困惑、过去的犹豫、过去的失败，都可以成为我们前进的动力。从现在开始，不再为自己设限，重新审视并选择那些符合自己真正目标的行为。或许，认知的觉醒并非一蹴而就，但只要行动起来，转变的力量将远远超过你想象。

2024-12-25 10:50:46 1119

原创云原生｜一文了解HAMi：云原生角度实现GPU颗粒度划分

例如：原生 libvgpu.so 在进行内存分配时，只有在 GPU 内存真的用完的时候才会提示 CUDA OOM，但是对于 HAMi 实现的 libvgpu.so 来说，检测到 Pod 中使用的内存超过了 Resource 中的申请量就直接返回 OOM，从而实现资源的一个限制。同时该 Pod 申请的部分资源也会标记为已使用，不会再分配给其他 Pod。于是，小A顺利的完成了客户的需求，2个模型分别占用了2张显卡，但是其中的一张显卡只占用了20G显存，客户要求充分利用资源，再部署一个模型，占满这张显卡。

2024-12-17 14:27:21 1252

原创如何设计一个好的微服务

微服务指的是一种应用架构，一系列独立的服务通过轻量级API来进行通信。单体应用中随着功能的增加，版本的迭代，代码库会越变越大。尽管工程师努力地想要模块化每个功能模块，以达成优雅的工程化，事实上模块之间的界限变得模糊不清，代码的维护和Bug的修复会变得相当复杂。微服务将一个巨大的单体应用拆分成若干个较小的服务，它们之间通过某种通信协议交互，最终组成整个系统服务。比较理想的情况下，微服务通过分布式部署，这意味着开发人员可以并行开发多个微服务，进而压缩开发所需时间。

2024-12-11 14:07:04 674 1

原创 AGI｜在测试活动中如何利用AI寻找测试点？

随着人工智能技术的迅猛发展，AI在软件测试领域的应用也越来越广泛。特别是在生成测试点方面，AI可以帮助测试工程师更高效地发现潜在问题，提高测试覆盖率和质量。本文将从提示词的角度出发，详细介绍如何利用AI生成高效、全面的测试点。

2024-12-09 10:21:10 1144

原创云原生｜一键解锁! Kubernetes中如何实现GPU管理

2022年5月13日，英伟达发布了Linux开源GPU内核模块，支持数据中心所用的GPU和消费级显卡，这意味着开发者可以通过代码而观察到内核驱动是如何工作的，同时还可以将NVIDIA驱动直接安装在企业内部的服务器上。处于AI浪潮的大背景下，背后的推手不言而喻，长期以来 NVIDIA 一直以高性能 GPU 和闭源驱动程序而闻名。闭源一直是 Linux 社区和其他开源社区所厌恶的，这场由 Linus 与 NVIDIA 长达十年的冲突在开源内核模块后似乎画上了句号。

2024-11-27 11:38:52 1012

原创云原生｜探秘开源分布式框架 Ceph，对比云原生存储

存储一直是系统中最重要的部分，在云计算推动的当下，一方面平台需要用户创造的数字资产作为信息壁垒，另一方面平台也有责任和义务保全用户托管的信息。随着平台的用户数激增，对存储系统的要求也越来越高。一个高扩展，高性能，高可用的分布式存储系统是系统稳定的重要基石，存储系统中大致可分为三部分：块存储，对象存储，文件存储。在主流的分布式存储中 HDFS 可以作为文件存储的代表；Swift 作为对象存储的代表；Ceph 同时提供了块，文件，对象三种存储方式，于是被称为统一存储。二、Ceph。

2024-11-20 11:20:11 810

原创数据库｜更强的RAG：向量数据库和知识图谱的结合

实践结合向量数据库与知识图谱，利用知识图谱呈现数据关系，从而提升大语言模型的准确性。

2024-11-15 10:58:05 1350

原创 AGI｜使用神州问学-多云版，轻松创建你的第一个工作流！

一个编排并运行成功的工作流并不意味着结束，想要这个工作流能够在AI应用中被调用，还需要做好工作流的配置，配置用于机器识别/模型理解的API调用名称和描述，选定入参方式补充入参描述后方可完成。支持对编排完成后的工作流进行运行调试，输入“开始”节点配置的入参，可对工作流全流程进行运行，逐步追踪每个节点的运行状态、输入/输出和数据信息，具备全链路的数据跟踪，让你轻松定位节点异常，用于反复调试工作流节点中的配置信息。节点是工作流中的关键构成，通过不同功能的节点，可以执行工作流的一系列操作。下面就来依次了解一下吧！

2024-11-13 10:44:48 996

原创数据库｜开源向量数据库性能对比: Milvus, Chroma, Qdrant

为应对公司在大规模文本、图像等非结构化数据处理上的业务增长需求，笔者着手调研当前流行的开源向量数据库。

2024-11-06 09:57:52 2241

原创 AGI｜探索跨模态大模型:桥接视觉与语言的前沿技术

首先，在包含脏数据的数据集（网上爬取的数据+人工标注的数据）上进行预训练，然后在ITC和ITM任务、LM任务上分别微调，分别得到1个图文匹配的检测模型，1个caption的生成模型。当我们谈到“跨模态大模型”时，例如视觉-语言大模型，指的是那些可以同时处理和理解图片（视觉）和文字（语言）信息的模型。有兴趣的伙伴可以挑选感兴趣的模型对应的文献进行深入学习，这里值得一提的是，阿里的Qwen-VL是一个多语言的跨模态大模型，支持中文和英文，并且在训练的时候允许输入多个图像，提高其理解视觉上下文的能力。

2024-11-06 09:54:10 890

原创 AGI｜智能体大比拼，BFCL检测工具调用能力——

而GLM-4-9B-Chat就更有意思了，一方面是生成了错误的工具名称，错误类型为simple_function_checker:wrong_func_name，检查原因发现，在绝大多数情况下模型生成的工具名称，与原工具名称仅有一个字符之差，例如对本该调用的math.factorial工具，响应成了math_factorial，这表明模型的指令遵循能力有待提升，与Qwen2-7B-Instruct形成了鲜明的对比。工具调用指的是智能体通过运用外部工具和资源，增强自身处理问题的能力，从而实现更为复杂的任务。

2024-10-30 14:11:55 1065

空空如也

空空如也