
AI
文章平均质量分 76
极客李华
CSDN,腾讯云,阿里社区内容合伙人、系统分析师、全网都叫极客李华,交流合作私信+。欢迎技术交流。
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
文档分割提高RAG的常用技巧
摘要:文档分割技巧优化RAG系统 文档分割是提升RAG系统性能的关键环节,主要影响检索效率、精度和生成质量。核心技巧包括:1)固定长度分割法,适用于标准化文档,需优化chunk_size和重叠参数;2)结构化分割法,利用标题等标记保持语义完整;3)递归分割法,分层处理混合内容。实施时需考虑文档特性、语义单元完整性、LLM上下文限制和检索效率平衡,并通过实验确定最佳参数。合理分割可提升生成答案准确性40-60%,需避免切断关键信息或产生冗余。(149字)原创 2025-07-11 17:22:17 · 985 阅读 · 0 评论 -
一个案例演示什么是RAG+Prompt工程
本文通过"算命大师"案例演示了RAG(检索增强生成)技术的应用。RAG结合信息检索与文本生成,首先检索知识库相关内容,再结合用户查询生成回答。案例展示了一个完整实现:使用FAISS向量数据库存储命理知识文档,通过Prompt工程设定AI为"算命大师"角色,最终生成具有神棍风格的个性化解读。代码展示了文档处理、向量化存储和问答交互的全流程,证明RAG能有效扩展大模型能力边界,实现可追溯、个性化的智能应用。原创 2025-07-07 17:51:05 · 184 阅读 · 0 评论 -
大模型应用开发基础-Prompt工程
Prompt工程是优化大语言模型输入指令的技术,旨在提高输出准确性、减少歧义。核心技巧包括:1)明确需求,用动词驱动任务并限定范围;2)角色扮演,指定AI专业身份;3)结构化输出;4)提供示例;5)分步引导。通过精准Prompt设计(如限定字数、指定领域),可避免模型自由发挥,生成更符合预期的结果。例如,模糊Prompt"介绍机器学习"会得到泛泛回答,而优化后的Prompt能输出结构化的专业内容。原创 2025-06-23 17:30:23 · 841 阅读 · 0 评论 -
从小白视角理解什么是MCP
⚠️陷:双Prompt架构虽区分了“身份”与“任务”,互,如同给囚徒递纸条——信息无法突破牢笼。:模型如同,只能复述书本知识,无法感知现实世界动态。---案例:某客服系统依赖200+精细Prompt,模型升级后30%指令失效,修复耗时相当于重开发。此阶段局限本质上源于,直接催生了Agent与工具调用技术的诞生。:通过三组件,赋予大模型动态执行复杂任务的能力,实现“认知-决策-执行”闭环。✅:AI Agent使大模型从“被动应答者”升级为“主动执行者”,首次实现端到端任务闭环。原创 2025-06-06 21:01:21 · 672 阅读 · 0 评论 -
机器学习练手项目-猫狗分类器
猫狗分类器是一个深度学习项目,旨在识别图像中的猫和狗。通过训练神经网络模型,该项目可以从输入的图像中准确地识别出是猫还是狗。这个项目可以应用于许多实际场景,如图像分类、动物识别等。原创 2024-03-15 17:27:59 · 1414 阅读 · 1 评论 -
利用PyTorch实现基于MNIST数据集的手写数字识别
简介:如何使用PyTorch实现基于MNIST数据集的手写数字识别。手写数字识别是计算机视觉领域的经典问题之一,旨在将手写数字图像转换为对应的数字标签。MNIST数据集是一个经典的手写数字数据集,包含了60000张训练图像和10000张测试图像。每张图像的大小为28x28像素,图像内容为0到9的手写数字。我们将使用这个数据集来训练和测试我们的模型。原创 2024-03-10 12:55:41 · 1247 阅读 · 2 评论 -
pytorch中的非线性回归
简介:非线性回归是指因变量(目标输出)与自变量(特征输入)之间的关系不是线性的情况。与线性回归不同,非线性回归中因变量与自变量之间的关系可能是曲线状的,可以是多项式关系、指数关系、对数关系等。在非线性回归中,模型的拟合函数通常不是线性的,因此需要使用其他方法来拟合数据。下面是PyTorch 实现非线性回归,并解释代码中的关键部分。原创 2024-03-10 12:04:50 · 865 阅读 · 0 评论 -
pytorch中的线性回归
简介:线性回归是一种基本的机器学习模型,用于建立输入特征与连续输出之间的关系。它假设输入特征与输出之间的关系是线性的,并且尝试找到最佳的线性拟合,以最小化预测值与真实值之间的差距。原创 2024-03-10 11:54:50 · 1190 阅读 · 0 评论 -
PyTorch 中的自动求导
简介:自动求导是 PyTorch 中的一个核心概念,它使得神经网络的训练过程变得更加高效和简单。在传统的深度学习框架中,如 TensorFlow,开发者需要手动编写神经网络的反向传播算法,来计算损失函数对每个参数的梯度。这种方式繁琐且容易出错。而 PyTorch 的自动求导机制使得这一过程变得更加简单和直观。当你对这些张量进行操作时,PyTorch 将会构建一个计算图来跟踪计算过程。方法来自动计算所有张量的梯度。然后,通过对这些张量进行数学运算,创建了一个新的张量。,这意味着希望追踪这些张量的梯度信息。原创 2024-03-10 11:42:18 · 647 阅读 · 0 评论 -
pytorch中的数据索引
在PyTorch中,数据索引是指在处理张量(Tensor)时访问或操作特定元素的过程。索引在数据处理和深度学习中是非常常见且重要的操作,它允许我们以各种方式访问数据集中的元素,执行数据的切片、提取、过滤等操作。原创 2024-03-10 11:31:01 · 1357 阅读 · 0 评论 -
PyTorch 中的 Tensor:属性、数据生成和基本操作
简介:PyTorch 是一个强大的深度学习框架,它提供了丰富的张量操作,是构建神经网络模型的核心组件之一。本文将会详细讲解 PyTorch 中的 Tensor 属性、数据生成方法以及常用的基本操作运算,帮助读者更好地理解和使用 PyTorch。原创 2024-03-10 08:47:38 · 1229 阅读 · 0 评论 -
pytorch安装教程
简介:本文讲解pytorch安装教程。复制下面的命令到命令窗口。原创 2024-03-09 23:33:06 · 393 阅读 · 0 评论 -
如何快速创建一个Django项目
简介:本文讲解如何快速创建一个Django项目。打开powershell,进行下载。创建Django项目。原创 2024-03-09 15:24:35 · 714 阅读 · 0 评论 -
利用前缀和计算二维矩阵子矩阵的和
二维矩阵在计算机科学中具有重要的地位,它们广泛用于图形处理、数据处理以及算法设计等领域。在处理二维矩阵时,经常需要计算子矩阵的和。例如,给定一个 n * n 的矩阵,我们可能需要计算其中所有i * i子矩阵的和。原创 2024-03-09 14:44:41 · 968 阅读 · 0 评论 -
大模型应用开发-LangChain入门教程
LangChain是一个编程框架,主要用于在应用程序中集成大型语言模型(LLM)。LangChain提供了记忆组件,用于解决大语言模型无状态的问题,使得模型能够保存上次交互的内容,从而能够更好地进行连续的对话或任务处理。此外,LangChain还提供了多种类型的Chain类,用于处理不同的任务。其中,通用Chain类用于控制Chain的调用顺序和是否调用,它们可以用来合并构造其他的Chain。原创 2024-03-08 21:46:56 · 2363 阅读 · 3 评论 -
以波士顿房价预测为例,演示欠拟合问题和解决办法
使用波士顿房价数据集,该数据集包含了一些影响波士顿地区房价的重要特征,如犯罪率、房屋年龄、学生-老师比例等。原创 2024-03-04 22:43:48 · 978 阅读 · 0 评论 -
以波士顿房价预测为例,演示过拟合问题和解决办法
使用Scikit-Learn库中的波士顿房价数据集,该数据集包含了房屋的各种特征以及相应的房价。原创 2024-03-04 22:12:35 · 1162 阅读 · 0 评论 -
线性回归-最小二乘法入门(波士顿房价)
简介:本文讲解,线性回归-最小二乘法入门。首先需要在jupyter中安装对应的环境。原创 2024-03-04 21:05:01 · 1276 阅读 · 0 评论 -
什么是偏拟合和什么是过拟合,解决方法是什么
当训练数据量不足时,模型可能会过度拟合已有的数据,而无法很好地泛化到新的数据上。线性模型无法很好地捕捉数据中的复杂关系,因为它只能拟合直线,无法描述数据中的曲线关系。欠拟合指的是模型无法在训练集上学习数据的趋势,表现为模型过于简单,无法捕获数据的复杂性。在这个案例中,我们尝试使用一个过于简单的线性模型来拟合非线性关系的数据,这导致了欠拟合的问题。可以增加多项式的次数,使用更高阶的多项式特征来拟合数据的非线性关系。可以添加更多的特征,例如原始特征的多项式特征、交叉特征等,以提供更多的信息来拟合数据。原创 2024-03-03 00:12:52 · 937 阅读 · 0 评论 -
为什么在推荐系统中适合使用mongdb存储数据
接着,我们存储了用户ID为1的观看历史数据,包括电影ID和评分。在推荐系统中,用户的个人信息、观看历史和电影数据可能是多层嵌套的结构,使用MongoDB可以方便地存储和查询这些数据。在推荐系统中,用户数量和数据量可能会随着时间的推移而增长,MongoDB的可扩展性和高可用性可以保证系统的稳定性和性能。通过具体的案例和代码示例,我们可以看到MongoDB在存储和查询推荐系统数据方面的便利性和效果。在推荐系统中,MongoDB是一个常用的数据库选择,它提供了许多特性和功能,使其成为推荐系统的理想选择。原创 2023-09-27 08:30:33 · 247 阅读 · 0 评论 -
通过案例理解Apriori算法
Apriori算法是一种经典的关联规则挖掘算法,用于发现数据集中的频繁项集和关联规则。在本文中,我们将结合一个具体的案例和代码详细讲解Apriori算法的原理和实现。原创 2023-09-27 08:25:53 · 376 阅读 · 0 评论 -
Pi AI使用体验
Pi AI作为一个主打高情商的模型,使用体验感上面,确实甩GPT几条街,而且还支持,语音输出,这个声音是可以选择的,这个声音非常的真实不像是机器发出来的,结合浏览器自带的语音识别,可以模拟英语对话。原创 2023-08-24 00:01:53 · 729 阅读 · 0 评论 -
CodeGeeX使用体验
CodeGeeX是一款免费的国产AI编写代码辅助工具。原创 2023-08-23 23:41:52 · 1445 阅读 · 0 评论 -
stable-diffusion-webui教程(AI绘画真人教程)
stable-diffusion-webui教程(AI绘画真人教程)原创 2023-02-24 15:16:13 · 8888 阅读 · 9 评论