自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(71)
  • 收藏
  • 关注

原创 系统性提升大模型回复准确率:从 RAG 到多层 Chunk 策略

使用语言模型将 chunk 总结为一句话再对摘要句进行嵌入,更具泛化能力对模糊问句、含义抽象的问题命中率显著提升方法优势适合场景实现简单,已广泛验证通用问答、文档搜索提升 recall 与多义词覆盖能力多义词、高语义多样性系统上下文保持好,结构感知能力强学术、法规、技术性分层文档增强 query 模糊场景下的召回精度模糊提问、营销 FAQ、客服领域提升大模型回答准确率,不应仅靠生成模型本身的强大,更应构建一整套“让模型看对材料”的信息注入机制。

2025-07-26 16:02:42 616

原创 Rerank 模型的其中两种路径:BERT 相似度与 CoT 推理

CoT(Chain of Thought)本质上是一种推理范式,而非模型结构。它通过让模型逐步展示推理过程,来提升判断的可信度与可解释性。在 rerank 中,CoT 的作用是:对于每个候选文档,让模型用自然语言方式逐步判断它是否能支持 query,最后输出一个评分。Question: 为什么乔治·华盛顿是第一任总统?Candidate Document: 他在1789年就任总统,是美国宪法批准后首位总统。- 宪法生效后设立了总统职位- 乔治·华盛顿是第一位根据宪法当选的总统。

2025-07-26 15:31:17 665

原创 大模型 vs 轻量模型:架构与使用场景对比

大模型擅长“想”,轻量模型擅长“判”。在构建 AI 系统时,最有效的方式往往是协同使用:由轻量模型负责筛选、打分、排序,由大模型负责最终的自然语言生成和用户交互。多模型协作是当前高效智能系统Agent的主流架构之一。

2025-07-26 14:46:13 271

原创 VMware 虚拟机镜像资源网站

2025-04-24 20:41:12 644

原创 [蓝桥杯 2025 省 Python B] 异或和

【代码】[蓝桥杯 2025 省 Python B] 异或和。

2025-04-23 14:10:46 326

原创 [蓝桥杯 2025 省 Python B] 最多次数

解法关键:处理片段切割问题,片段切割后,里面的任何部分都不可再使用。处理片段切割问题,片段切割后,里面的任何部分可再使用。

2025-04-23 14:06:34 323

原创 [蓝桥杯 2025 省 Python B] 园艺

【代码】[蓝桥杯 2025 省 Python B] 园艺。

2025-04-23 14:01:29 126

原创 Socket

是一种操作系统底层的“网络通信能力”FastAPI、Flask、Django、Nginx 都是在底层使用 socket 才能“监听端口”、“响应请求”操作系统给应用层的进程提供了 Socket 接口,你就能用它来连接其他服务器的端口,发送和接收信息。

2025-04-22 15:25:07 291

原创 ArcGIS、ArcMap查看.shp文件时属性表中文乱码

在shapefile文件夹目录上,创建一个同名的.cpg文件,内容"oem"使用ArcGIS再右键打开属性表,正确编码✅。ps 代码不是通用模板,根据你的需求进行调整。Shapefile 的属性数据。是老旧格式,默认不含编码信息。

2025-04-21 14:35:28 527

原创 ArcGIS及其组件抛出 -- “Sorry, this application cannot run under a Virtual Machine.“

产生背景:使用的是“破解版本”或“被套壳过”的非官方 ArcGIS 版本破解版本作者为了防止:被被被通常会加入**“虚拟化环境检测+阻断运行”机制**说明你当前运行 ArcGIS 的系统环境被识别为,而它的内置保护机制拒绝在虚拟机环境下启动(出于反破解、防泄露或授权机制的考虑)

2025-04-19 14:17:17 2549

原创 基于json、list、dict的传参框架

【代码】基于json、list、dict的传参框架。

2025-04-17 10:46:34 186

原创 python中 “with” 关键字的取舍问题

当你使用with打开文件时,with,无论是否发生异常。这意味着你不需要显式地调用f.close()来关闭文件。

2025-04-13 20:23:46 221

原创 “最小绝对差匹配”问题 及其 变种题型

重排不等式:如果两个数组都按同一方向排序(升序 or 降序),配对后乘积(或绝对差)达到极小或极大。# 人话:在A中的最小位置,尽可能对应B中最小的位置;后续位置也如此(贪心)

2025-04-06 16:42:54 249

原创 “二分查找 + (必要时)前缀和” -- 处理 ’有序数组‘ 的区间问题汇总

例题1:P3184 [USACO16DEC] Counting Haybales S - 洛谷题目1:区间和查询(Range Sum Query)题目描述:给定一个已排序的非负整数数组(长度 n),以及 Q 个查询。每个查询给出两个整数 L 和 R(表示数值),要求输出数组中所有落在 [L,R] 内的数的和;如果没有则输出 0。题目描述:给定一个升序排列的数组和 Q个查询。每个查询给定一个整数 X,要求输出数组中大于 X 的元素个数 题目描述:给定一个排序好的数组和 Q 个查询

2025-04-03 21:38:50 492

原创 洛谷【P3184】 Counting Haybales S -- ”二分查找求和区间元素数问题“

【代码】洛谷【P3184】 Counting Haybales S -- ”二分查找求和区间元素数问题“

2025-04-03 19:40:08 208

原创 “前缀和 + 全局偏移量 + 二分查找” 预处理 --> 求解”最大子序列和“题型

原因存在多次遍历的情况容易超时。

2025-04-02 17:07:12 238

原创 迭代器与可迭代对象

直接通过 for 循环使用,因为 for 循环内部会调用其 __iter__() 方法来获取一个迭代器。迭代器是一个对象,它封装了遍历数据的过程。一个可迭代对象是指任何可以返回一个迭代器的对象。循环中遍历一个可迭代对象时,实际上是调用了这个对象的。则是一个“指针”或“工具”,用来逐个取出容器中的数据。这意味着当你对一个可迭代对象使用。时,它返回的是一个能依次产生该对象中所有元素的迭代器。方法,返回一个迭代器,然后不断调用迭代器的。就像一个“容器”,里面装着很多数据。:返回自身,用于支持迭代器协议。

2025-03-29 20:13:21 412

原创 Python针对大规模数据使用”sys模块加速I/O操作“:

常用输出:

2025-03-29 20:01:17 567

原创 Python --- .flush() 强制输出缓冲区的数据(缓冲区未满)

flush()程序开始运行时,打开目标文件,发现内部什么数据都没有,原因是待写入的数据此时正在缓冲区,等待装满才传输写入。

2025-03-29 19:40:00 383

原创 最长上升连续子序列(LCIS)

【代码】最长上升连续子序列(LCIS)

2025-03-26 18:27:22 261

原创 最长连续子序列和的所含元素 -- Kadane算法拓展

【代码】最长连续子序列和的所含元素 -- Kadane算法拓展。

2025-03-25 21:10:01 240

原创 最大连续子序列和(动态规划 -- 经典Kadane算法)

那么我们从 nums[1] 开始重新寻找最长连续子序列,而不是之前的从 nums[0]开始寻找满足条件的连续序列;2、用max(nums[i] , nums[i] + current_max])进行判断是否要更换连续序列的开头(理解关键)1、用nums[0]初始化 current_max 和 global_max。如果采用暴力枚举,面对大规模数据会暴雷。

2025-03-25 20:16:12 498

原创 最大子序列和(禁用相邻元素)

【代码】最大子序列和(禁用相邻元素)

2025-03-25 19:22:57 245

原创 最长公共子序列LCS -- 全面分析版

【代码】最长公共子序列LCS -- 全面分析版。

2025-03-25 16:11:50 193

原创 Luogu P2249 【深基13.例1】查找 --- python 3解法

由于数据很大,建议使用加速读取。

2025-03-23 11:57:00 161

原创 luogu「EZEC-10」打分 --- Python3 解法

注意正确处理”最大值的更新“部分,其实也可以用mod运算圈定增长的范围,我这一步之前没有做好,就换方法了.... 有ac的好方法,欢迎指正。

2025-03-18 21:15:54 479

原创 二分查找 -- 分巧克力

【代码】二分查找 -- 分巧克力。

2025-03-17 16:15:54 297

原创 Python中的GIL(全局解释器锁)对多线程并行性能(单核)的影响:针对不同类型任务的分析

GIL是Python解释器(尤其是CPython实现)中的一个机制,它确保同一时刻只有一个线程在执行Python字节码。这意味着无论系统有多少CPU核心,Python程序中的多个线程也只能在一个核心上运行Python代码。GIL的主要目的是避免多线程在内存访问时出现竞争条件和其他同步问题,但它也带来了性能瓶颈,尤其在多核系统上。GIL对Python中的多线程并行性(单核)有显著影响,尤其在CPU密集型任务中,无法充分利用多核CPU的计算能力。在这种情况下,使用多进程比多线程更为高效。

2025-03-13 20:38:21 886

原创 一键阐述“多线程、多进程、多任务”的场景需求

【代码】一键阐述“多线程、多进程、多任务”的场景需求。

2025-03-13 20:30:59 482

原创 不同相邻春节间的天数 --- (日期枚举问题)--- 时间间隔计算题型

【代码】不同相邻春节间的天数 --- (日期枚举问题)--- 时间间隔计算题型。

2025-03-08 20:11:57 110

原创 顺子问题 --- (日期枚举)-- 字符串处理题型

【代码】顺子问题 --- (日期枚举)-- 字符串处理题型。

2025-03-08 20:09:27 226

原创 完全日期(日期枚举问题)--- 数学性质题型

题目:

2025-03-08 20:06:02 434

原创 二分查找 -- ”单次\多次“搜索旋转数组

【代码】二分查找 -- ”单次\多次“搜索旋转数组。

2025-03-07 19:38:50 296

原创 最长上升子序列LIS(全面分析版)

利用反向思路,迭代求解。

2025-03-05 21:00:11 936

原创 详细解释Github和用户端通过SSH建立连接的过程

上传到 GitHub 或其他服务,这样 GitHub 就能识别你,并允许你通过 SSH 进行操作(例如,推送代码、拉取代码)。)执行命令时,客户端会向 GitHub 发起连接请求。此时,GitHub 会要求你通过 SSH 进行身份验证。当你在 Git 客户端(例如。背后的数学原理需要自行了解。

2025-03-03 21:28:27 450

原创 关于配置SSH keys并上传Github

为什么使用SSH连接方式,其和常见的HTTPS有什么区别?

2025-03-03 20:59:09 437

原创 PowerToys -- “PowerToys Run” 关于快捷方式丢失问题

找到原程序(.exe),右键创建快捷方式,拖入你想放置的地方(一般放在桌面),大部分情况可以解决。

2025-03-03 13:34:09 219

原创 关于常规模式下运行VScode无法正确执行“pwsh”问题

(在vscode中添加 powershell 7 路径)后续工作直接基于 PowerShell7.5.0 输出。打开setting.json。(打开setting)

2025-03-03 10:12:38 469

原创 VScode中Code Runner插件关于是否”Run in terminal“

使用该插件自带的"Run code" 运行场景二的代码 ,发现” 一直持续运行中, 也不弹出输入提示 “ ---- 因为”cannot edit in read-only editor“ --- 所以建议选用在Terminal中输出,而不是在”Output“由于VScode中可以同时处理多种编程语言,自然就有不同的解释器、编译器...,推荐使用Code Runner 插件进行自动化管理,该插件会自动识别文件后缀调用对应的解释器、编译器,减轻手动寻找的繁琐。存在问题 -- ”无法输入“

2025-03-02 20:28:53 622

原创 二分查找变形 -- 搜索具有重复元素的旋转数组

数组中有重复元素时,可能会影响二分查找的效果。ps:输出部分自己修改一下Boolean型就好了。是否相等,我们可以规避这种情况,调整搜索方向。

2025-02-28 18:15:31 314

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除