- 博客(439)
- 收藏
- 关注

原创 AGI|一篇小白都能看懂的RAG入门介绍!
随着近几年AIGC的发展,不仅是大模型自身在不断优化,相关支持应用也在不断涌现。本文的主角便是这些技术中较为引人注目的RAG(Retrieval-Augmented Generation)——检索增强生成技术。LLM虽然已经在通识领域展现出了惊人的能力,但要落实到真正具体的问题解决,特别是针对专业领域,企业领域的一些具体的,私人的数据生成解决方案,仅仅依靠LLM还是远远不够的。
2024-02-20 11:22:14
4594
2
原创 AI越线了吗?从现实争议看日常开发中的伦理边界
近年来,AI在推荐系统、自动驾驶、搜索引擎等领域快速普及,深刻改变着我们的生活,却也在训练与决策环节暴露出偏见、隐私泄露与责任推诿等伦理隐患。本文将结合真实案例,解析开发与应用中的伦理边界,厘清AI“能做”与“可以做”的分界。
2025-07-16 14:00:27
498
原创 《怎样做成大事》|成功率仅0.5%?给项目管理者的一剂良方
《怎样做成大事》由世界知名项目管理专家、牛津大学教授傅以斌携手加德纳撰写。作者通过全球多个超大型项目的失败与成功案例,系统剖析了影响项目成败的关键因素。本期文章将带您了解一下,为什么只有0.5%的大项目能按预期交付,以及如何借鉴其中的方法论,避开职场中那些看不见的“坑”。
2025-07-11 10:55:54
851
原创 AGI|Auto Hyperlink上线:鼠标点到哪,知识秒懂!
本文介绍了一个名为AutoHyperlink的开源项目,该项目能自动为网页文本添加超链接,点击可显示简介并跳转百科搜索。项目已开源,适用于技术文档和AI应用场景,旨在提升专业内容阅读体验。
2025-07-09 16:00:53
281
原创 AGI|Browser Use —— AI代理浏览器
Browser Use 是一款专为大语言模型(LLM)设计的智能浏览器工具,旨在让 AI Agent 能够像人类一样自然地浏览和操作网页。它支持多标签页管理、视觉识别、内容提取,并能记录和重复执行特定动作。
2025-07-02 14:13:05
1057
原创 AGI| Neo4j 处理模型数据,轻松实现效率翻倍
想象一下,知识图谱就像一张巨大的蜘蛛网,只不过网上挂的不是露珠,而是无数个知识点,比如"苹果""牛顿""万有引力""iPhone"……每个知识点(实体)之间用线(关系)连接起来,线上还贴着标签,比如"牛顿→发现→万有引力""苹果→是→水果"或者"小米→生产→小米su7"。类比于乐高积木:每个积木块代表一个事物(比如"雷军","水"),积木之间的接口形状不同,只有匹配的关系才能拼在一起(比如"雷军→喝→水"能拼,"雷军→喝→汽车"就拼不上)。
2025-06-12 10:15:59
805
原创 AGI|基于FastMCP 2.0的MCP Server快速搭建指南
FastMCP是一个基于模型上下文协议(MCP)的开发框架,支持开发者快速构建与LLM交互的服务。通过工具(Tool)、资源(Resources)、提示(Prompt)和服务组合(ServerComposition)等核心概念,FastMCP实现了功能解耦和模块化开发。文章详细介绍了如何搭建单MCPServer和多Server组合的复杂应用,并以电商平台为例展示了服务组合的实际应用。该框架支持静态和动态资源、参数化提示模板,以及服务挂载和导入等组合方式,为AI应用开发提供了标准化的通信解决方案。最后探
2025-06-04 13:36:11
1235
原创 斯坦福发布《2025年人工智能指数报告》:12大趋势总结AI发展
斯坦福大学以人为本人工智能研究所(Stanford HAI)发布了《2025 年人工智能指数报告》,本篇文章为大家带来了报告中提到了12个要点。
2025-05-27 11:27:53
1365
原创 AGI|开源框架-Mem0解决AI长期记忆问题,让AI记住你的一切
Mem0技术通过构建智能记忆中枢,彻底改变了AI的"健忘症"问题。它实现了:1)长期存储用户个性化数据;2)动态更新交互记录;3)跨应用共享记忆。在教育领域,它能标记易错点并按节奏推送内容;医疗健康方面,可长期跟踪用药记录;游戏中则让NPC记住玩家历史选择。Mem0采用"记忆管理+RAG"协同架构,支持用户自定义记忆层次,并能自动提炼语义、降低过期信息权重。这项技术正在推动AI从工具向伙伴的转变,但也引发隐私保护等新思考。(148字)
2025-05-27 10:05:20
809
原创 AGI|详解Google A2A协议,谁才是Agent的未来标准?
随着 Agent技术热度持续攀升,MCP与A2A等协议轮番登场,作为关键通信框架被推向科技前沿,引发了行业对"谁将主导智能体通信标准"的深度讨论。本篇文章带来A2A协议的介绍,以及它与MCP各自的优势又是什么。
2025-05-26 11:27:13
1067
原创 AGI|爆火的MCP背后,为何被称作 AI 模型的“万能适配器”?
作为可能重塑AI生态的关键协议,MCP究竟是什么?其协议架构设计暗藏哪些创新突破?在实践中又面临哪些挑战?本次系列推文将从理论原理到实践操作,带您多角度了解MCP协议及使用方法。
2025-05-26 09:52:38
752
原创 AGI|智能体总忘事?Letta框架如何让AI告别“金鱼记忆“?
letta是一个开源的AI智能体框架,它提供了agent、memory、model、tool等一系列的api和开发工具,方便开发人员构建一个有状态的agent,能够在长期对话中保持记忆和上下文。
2025-05-09 17:50:18
728
原创 AGI|详解IPEX-LLM 与 OpenVino,嵌入生成的终极效率优化
OpenVINO是 Intel 推出的深度学习推理优化工具,主要用于在 Intel 硬件(CPU、GPU、VPU、FPGA、NPU)上高效运行 AI 推理任务。它能够优化和加速来自 TensorFlow、PyTorch、ONNX、PaddlePaddle 等框架训练的模型,提供高效的推理性能、低延迟以及跨平台兼容性。支持的硬件平台OpenVINO 适用于多种 Intel 硬件,支持异构计算CPU(Intel Xeon, Core, Atom 等)GPU(如 Intel Movidius)
2025-05-09 17:40:42
810
原创 AGI|用好AI工具,你不得不知道的基本知识!
对于现阶段的 AI 工具来说,他们已经足够智能到理解我们自然语言的输入,也就是说你在使用 AI 工具时,即使将它当做一位同事自然地输入问题,他也能够基本理解你的意思并且回答你的问题。以文本生成领域为例,像 ChatGPT 、Deepseek、豆包等等我们常见的 AI 应用都是基于大语言模型所建立的 C 端产品,他们通过对海量文本数据的学习,能够理解语言的语法、语义和语境,从而生成连贯、自然且富有逻辑的文本。,如何在保持创造力的同时减少幻觉,是所有 AI 厂商面临的一个亟待解决的难题。
2025-04-27 13:47:11
568
原创 AGI|AutoGen入门食用手册,搭建你的智能体流水线
AutoGen 是一个开源编程框架,用于构建AI代理并促进多个代理之间的合作以解决任务。它具有强大的可定制和可对话的代理,这些代理通过自动化的聊天将 LLM(大语言模型)、工具和人类集成在一起。通过自动化多个LLM代理之间的聊天,开发人员可以轻松地让他们自主或根据人工反馈共同执行任务,包括需要通过代码使用工具的任务。上图中,AutoGen使用多智能体对话实现了复杂的基于LLM的工作流。(左)AutoGen代理可以定制,可以基于LLM、工具、人员,甚至是它们的组合。
2025-04-11 17:38:19
933
原创 AGI|AI驱动的前端代码生成和代码推荐
AI驱动生成前端代码的优势提高效率:AI可以自动生成复杂的UI组件或模板代码,减少开发者手动编写的时间。通过自动化生成,开发者能够集中精力于更有创意和技术挑战性的部分。提升代码质量:AI驱动的代码生成工具通常会基于大量的开源代码库进行训练,因此能够遵循最佳实践,减少代码中的潜在漏洞或性能瓶颈。缩短开发周期:通过自动化生成和即时的代码补全,开发者可以在更短的时间内完成项目,从而更快地推向市场。
2025-03-31 10:40:40
814
原创 趋势洞察!IDC、Gartner、Forbes等权威机构解读2025年AI发展趋势
2025年,人工智能迈入深度应用和技术成熟的新阶段。以生成式AI、代理型AI、多模态模型为代表的技术,正从实验室走向实际应用,驱动产业变革与效率提升。AI技术不再仅仅是工具,而是行业创新、决策支持与生产力提升的核心引擎。科技大厂与创业者将在应用场景中竞相探索,以构建从技术到产品的完整闭环。尽管机遇与挑战并存,但我们需要以开放和负责任的态度拥抱AI技术。唯有深刻理解趋势、积极创新,企业才能在AI浪潮中占据主动,成为引领未来的重要力量。
2025-01-16 17:12:05
4370
原创 AGI|祖传代码遇上 AI 智能体:企业技术债务怎么解决?
困扰众多企业已久的“技术债务”,那些能够正常运行的“祖传代码”在AI 智能体时代迎来了新的解决办法
2025-01-16 17:01:24
718
原创 AGI|如何基于开源软件搭建属于你的私域知识库
本篇是基于AI的开源应用项目来对AIGC领域的技术做整体性的了解,包括业务、技术栈、技术名词等等。目的是快速学习相关的基本知识,为此找到一些可了解的开源应用,可以先本地部署跑起来理解大致的方向。
2025-01-09 11:14:49
795
原创 开放获取|2025年度800+页原创AI技术合集全新发布!
在年末之际,通明湖云和信创研究院-云基地第4本技术合集终于与大家见面了。正是你们的支持与鼓励,让我们在技术探索的道路上不断前行。如果各位读者觉得我们的持续编写与输出是有意义的,那么请将这些技术合集分享给更多有相同兴趣、积极向上的同事和朋友们。最后,新的一年希望能与大家继续携手前行,共同探索技术的无限可能。
2025-01-06 14:11:16
877
原创 技术合集|AI Agent 如何重塑工作的未来
本次技术合集凝聚了云基地成员们在过去一年的所思、所想、所为,精选了90+篇文章,内容涵盖人工智能理论研究、技术实战、数据库、云原生以及传统开发等多领域的研究与实践。
2024-12-25 10:55:57
1142
原创 《认知觉醒》|学会这三点,别让“伪自律”骗了你
明明知道,但是却做不到”“明明知道,如果这样做或者那样做了,事情会变得更好,但是却不愿意坚持下去”人生的道路上,许多人或许已经走在了通往终点的轨道上,但我们依然可以选择在任何时刻觉醒,开始改变。无论你是已步入职场、在社会中打拼的成年人,还是在学业中迷茫的年轻人;真正的成长始于自我觉察和行动。过去的困惑、过去的犹豫、过去的失败,都可以成为我们前进的动力。从现在开始,不再为自己设限,重新审视并选择那些符合自己真正目标的行为。或许,认知的觉醒并非一蹴而就,但只要行动起来,转变的力量将远远超过你想象。
2024-12-25 10:50:46
1119
原创 云原生|一文了解HAMi:云原生角度实现GPU颗粒度划分
例如:原生 libvgpu.so 在进行内存分配时,只有在 GPU 内存真的用完的时候才会提示 CUDA OOM,但是对于 HAMi 实现的 libvgpu.so 来说,检测到 Pod 中使用的内存超过了 Resource 中的申请量就直接返回 OOM,从而实现资源的一个限制。同时该 Pod 申请的部分资源也会标记为已使用,不会再分配给其他 Pod。于是,小A顺利的完成了客户的需求,2个模型分别占用了2张显卡,但是其中的一张显卡只占用了20G显存,客户要求充分利用资源,再部署一个模型,占满这张显卡。
2024-12-17 14:27:21
1252
原创 如何设计一个好的微服务
微服务指的是一种应用架构,一系列独立的服务通过轻量级API来进行通信。单体应用中随着功能的增加,版本的迭代,代码库会越变越大。尽管工程师努力地想要模块化每个功能模块,以达成优雅的工程化,事实上模块之间的界限变得模糊不清,代码的维护和Bug的修复会变得相当复杂。微服务将一个巨大的单体应用拆分成若干个较小的服务,它们之间通过某种通信协议交互,最终组成整个系统服务。比较理想的情况下,微服务通过分布式部署,这意味着开发人员可以并行开发多个微服务,进而压缩开发所需时间。
2024-12-11 14:07:04
674
1
原创 AGI|在测试活动中如何利用AI寻找测试点?
随着人工智能技术的迅猛发展,AI在软件测试领域的应用也越来越广泛。特别是在生成测试点方面,AI可以帮助测试工程师更高效地发现潜在问题,提高测试覆盖率和质量。本文将从提示词的角度出发,详细介绍如何利用AI生成高效、全面的测试点。
2024-12-09 10:21:10
1144
原创 云原生|一键解锁! Kubernetes中如何实现GPU管理
2022年5月13日,英伟达发布了Linux开源GPU内核模块,支持数据中心所用的GPU和消费级显卡,这意味着开发者可以通过代码而观察到内核驱动是如何工作的,同时还可以将NVIDIA驱动直接安装在企业内部的服务器上。处于AI浪潮的大背景下,背后的推手不言而喻,长期以来 NVIDIA 一直以高性能 GPU 和闭源驱动程序而闻名。闭源一直是 Linux 社区和其他开源社区所厌恶的,这场由 Linus 与 NVIDIA 长达十年的冲突在开源内核模块后似乎画上了句号。
2024-11-27 11:38:52
1012
原创 云原生|探秘开源分布式框架 Ceph,对比云原生存储
存储一直是系统中最重要的部分,在云计算推动的当下,一方面平台需要用户创造的数字资产作为信息壁垒,另一方面平台也有责任和义务保全用户托管的信息。随着平台的用户数激增,对存储系统的要求也越来越高。一个高扩展,高性能,高可用的分布式存储系统是系统稳定的重要基石,存储系统中大致可分为三部分:块存储,对象存储,文件存储。在主流的分布式存储中 HDFS 可以作为文件存储的代表;Swift 作为对象存储的代表;Ceph 同时提供了块,文件,对象三种存储方式,于是被称为统一存储。二、Ceph。
2024-11-20 11:20:11
810
原创 AGI|使用神州问学-多云版,轻松创建你的第一个工作流!
一个编排并运行成功的工作流并不意味着结束,想要这个工作流能够在AI应用中被调用,还需要做好工作流的配置,配置用于机器识别/模型理解的API调用名称和描述,选定入参方式补充入参描述后方可完成。支持对编排完成后的工作流进行运行调试,输入“开始”节点配置的入参,可对工作流全流程进行运行,逐步追踪每个节点的运行状态、输入/输出和数据信息,具备全链路的数据跟踪,让你轻松定位节点异常,用于反复调试工作流节点中的配置信息。节点是工作流中的关键构成,通过不同功能的节点,可以执行工作流的一系列操作。下面就来依次了解一下吧!
2024-11-13 10:44:48
996
原创 数据库|开源向量数据库性能对比: Milvus, Chroma, Qdrant
为应对公司在大规模文本、图像等非结构化数据处理上的业务增长需求,笔者着手调研当前流行的开源向量数据库。
2024-11-06 09:57:52
2241
原创 AGI|探索跨模态大模型:桥接视觉与语言的前沿技术
首先,在包含脏数据的数据集(网上爬取的数据+人工标注的数据)上进行预训练,然后在ITC和ITM任务、LM任务上分别微调,分别得到1个图文匹配的检测模型,1个caption的生成模型。当我们谈到“跨模态大模型”时,例如视觉-语言大模型,指的是那些可以同时处理和理解图片(视觉)和文字(语言)信息的模型。有兴趣的伙伴可以挑选感兴趣的模型对应的文献进行深入学习,这里值得一提的是,阿里的Qwen-VL是一个多语言的跨模态大模型,支持中文和英文,并且在训练的时候允许输入多个图像,提高其理解视觉上下文的能力。
2024-11-06 09:54:10
890
原创 AGI|智能体大比拼,BFCL检测工具调用能力——
而GLM-4-9B-Chat就更有意思了,一方面是生成了错误的工具名称,错误类型为simple_function_checker:wrong_func_name,检查原因发现,在绝大多数情况下模型生成的工具名称,与原工具名称仅有一个字符之差,例如对本该调用的math.factorial工具,响应成了math_factorial,这表明模型的指令遵循能力有待提升,与Qwen2-7B-Instruct形成了鲜明的对比。工具调用指的是智能体通过运用外部工具和资源,增强自身处理问题的能力,从而实现更为复杂的任务。
2024-10-30 14:11:55
1065
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人