- 博客(561)
- 资源 (1)
- 收藏
- 关注
原创 【Python】pip安装提速全攻略:让你的包安装飞起来
在Python开发过程中,使用pip安装第三方包是最常见的操作之一。然而,由于网络环境等因素,很多开发者都遇到过pip安装速度慢、超时甚至失败的问题。本文将为你详细介绍多种有效的pip安装提速方法,让你告别漫长的等待。
2025-08-29 15:50:20
345
原创 【Word】用 Python 轻松实现 Word 文档对比并生成可视化 HTML 报告
技术作用读取.docx文件内容difflib计算文本差异(增删改)webbrowser自动打开浏览器预览结果osdatetime文件路径处理与时间戳记录原生 HTML + CSS生成结构清晰、样式现代化的报告页面。
2025-08-28 15:04:27
794
原创 【SQL】深入理解MySQL存储过程:MySQL流程控制语句详解
循环类型特点WHILE先判断条件,再执行(可能一次都不执行)REPEAT先执行一次,再判断是否继续(至少执行一次)LOOP无条件循环,需手动LEAVE退出所有循环都可通过ITERATE(继续)和LEAVE(跳出)控制流程。语句用途是否必须结束条件类似语言中的IF条件分支否if-elseCASE多分支选择否WHILE先判断后执行是whileREPEAT先执行后判断是do-whileLOOP自定义循环手动LEAVEfor(;😉 / goto。
2025-08-26 15:48:15
377
原创 【SQL】深入理解MySQL存储过程:从入门到实战
存储过程是一组预编译的 SQL 语句的集合,存储在数据库服务器端,可以被多次调用。它类似于编程语言中的“函数”或“方法”,可以接收参数、执行逻辑、返回结果。SHOW CREATE PROCEDURE 存储过程名;
2025-08-25 17:49:05
418
原创 【Coze】Windows 环境下使用 Docker 部署 Coze Studio 的详细指南
使用代码编辑器(如 VS Code)打开。在编辑器的右下角,你会看到 CRLF 或 LF 的标识,点击它并选择 LF。保存文件后再重新启动。工作流代码节点如何添加 Python 第三方库在 项目中,代码节点默认内置了两个第三方依赖库。Coze Studio 也支持开发者自行添加其他的 第三方库。详细操作步骤如下:修改配置文件。在脚本与文件中,可找到注释,在这两个文件的第三方库注释下方直接添加依赖库对应的命令即可。例如添加 2.0.0 版本的torch在代码节点内部添加第三方库白名单列表。
2025-08-20 15:22:27
860
原创 【Python】文本相似度计算方法全解析:从理论到实践
在自然语言处理、信息检索和数据清洗等领域,计算文本相似度是一个基础而重要的任务。无论是检测重复文档、拼写纠错,还是推荐系统,都需要准确地衡量两个文本之间的相似程度。本文将深入解析多种文本相似度计算方法,帮助您选择最适合的算法。文本相似度是指两个文本在内容、结构或语义上的相近程度。通常用0到1之间的数值表示,0表示完全不同,1表示完全相同。文本长度: 短文本适合 Dice 系数,长文本适合余弦相似度计算性能: 汉明距离最快,Levenshtein 较慢但精确应用场景。
2025-08-12 17:34:03
2044
原创 【Python】基于Python自动化邮件发送系统:从配置到实现的完整指南
Python:核心编程语言smtplib:Python 内置库,用于连接 SMTP 服务器email.mime:处理邮件内容(文本、HTML、附件)python-dotenv:读取 `.env` 文件中的环境变量os:获取环境变量json:处理结构化数据(如 JSON 格式的邮件正文)通过合理使用 `.env` 配置文件、`smtplib` 及 `email` 模块,我们可以轻松实现单发、群发、带附件的邮件功能。
2025-08-07 15:21:36
877
原创 【Pycharm】Python最好的工具
CodeKey Run(ckey.run)是一个专注于 JetBrains 系列软件及插件自动激活的网站,支持 Windows、Linux 和 Mac 操作系统,几乎涵盖了 JetBrains 全线产品及主流插件。其核心优势在于“一键激活”,无需繁琐配置,适合广大开发者和团队快速部署开发环境。
2025-07-29 10:54:26
280
原创 【Python】基于Python提取图片验证码
1、图片扩大10倍(图片像素比较小的情况)2、去噪,提取图片黑色相关像素3、灰度值4、二值化5、识别图片验证码。
2025-07-10 17:27:37
530
原创 总结Windows定时任务schtasks命令的使用方法
修饰符(可选,用于调整间隔周期)。: 计划类型(如每分钟、每天等)。: 指定间隔分钟数(默认为1)。: 指定间隔小时数(默认为1)。: 要执行的脚本或程序路径。: 任务名称(唯一标识)。: 间隔天数(默认为1)。,默认为当前时间)。: 每分钟运行一次。: 每小时运行一次。: 系统启动时运行。: 用户登录时运行。
2025-06-19 15:20:11
585
原创 【Liblib】基于LiblibAI自定义模型,总结一下Python开发步骤
Liblib AI(哩布哩布 AI)是一个集成了先进人工智能技术和用户友好设计的 AI 图像创作绘画平台和模型分享社区。Liblib是个图像ai平台,有根据文字生成图片,修复图片,图片重绘等多种功能。API试用计划:登录后可领取500试用积分,限时7天免费测试体验。
2025-05-14 18:29:04
2569
原创 【OCR】总结目前流行的主要的OCR工具
扫描件上的污渍、老照片的黄斑、手机翻拍的摩尔纹,这些噪声如同数字时代的“文字迷彩服”。从Tesseract的开源先驱到Gemini 2.5 Pro的多模态突破,OCR技术始终在“识别率-速度-成本”的三角中寻找平衡。从楷书的连笔到黑体的刻板,从古籍的竖排繁体到现代文档的多栏混排,文字形态的复杂性远超想象。当遇到“甲乙丙方”等上下文依赖的表述,或“O/1/I”等形似字符时,再先进的算法也可能误判。正如数字世界的翻译官,OCR的价值不在于完美,而在于让沉默的文字重新开口说话。
2025-04-09 13:47:14
1493
原创 【Python】从 Word 文档中提取图片并生成 PPT
用于读取 Word 文档内容。:用于创建 PowerPoint 幻灯片。Pillow:用于处理图片尺寸和格式。io:用于处理内存中的二进制数据流。遍历指定文件夹中的所有 Word 文件。使用提取 Word 文档中的图片。将提取的图片插入到 PowerPoint 幻灯片中。保存生成的 PPT 文件。通过本文的代码示例,你可以轻松实现从 Word 文档中提取图片并生成 PPT 的自动化流程。这种解决方案不仅提高了工作效率,还减少了人为操作的错误率。
2025-03-26 16:04:34
804
原创 Python中文大写金额转阿拉伯数字
在财务票据中,中文大写金额(如“贰拾捌万壹仟柒佰伍拾伍元壹角玖分”)被广泛使用以防止篡改。但在数据处理时,我们需要将其转换为阿拉伯数字形式。本文将带你一步步解析如何用Python实现这一转换。
2025-03-20 15:35:07
365
原创 【OCR】总结github上开源 OCR 工具:让文字识别更简单
在数字化的时代,光学字符识别(OCR)技术成为了我们处理文档、图像文字信息的得力助手。它能够将图像中的文字信息转换为可编辑和可处理的文本数据,极大地提高了信息处理的效率。今天,我要给大家介绍一些优秀的开源 OCR 工具,它们在不同的场景下各显神通,让我们一起来看看它们的强大之处吧!
2025-03-19 14:00:46
4386
原创 【OCR】使用Umi-OCR进行PDF文档的光学字符识别
Umi-OCR是一款开源的离线OCR工具,支持多种语言的文字识别,特别适用于中文文档。它提供了一个基于HTTP的API接口,使得集成到各种应用中变得更加容易。通过上述步骤,我们能够利用Umi-OCR高效地对PDF文档执行OCR操作,将不可编辑的扫描版PDF转换为结构化的文本信息。这个过程不仅简化了数据录入的工作量,也提高了信息检索的效率。希望这篇文章能帮助您快速上手Umi-OCR,并应用于实际项目中。
2025-03-19 09:55:42
1647
原创 【PDF识别】总结PDF文本内容与表格提取的方法
pdfminer是一个高度可定制的PDF处理库,适用于需要深度自定义提取逻辑的场景。在PDF文本与表格提取的征程中,我们遇到了各种挑战,也探索了多种解决方案。简单文本提取:PyPDF2和fitz是不错的选择,简单易用,适合初学者快速上手。表格与精确文本提取:pdfplumber在处理表格方面表现出色,能够满足对文本和表格精确提取的需求。复杂PDF处理:pdfminer的灵活性使其能够应对复杂的PDF结构,适合需要深度自定义提取逻辑的场景。扫描PDF处理。
2025-03-18 14:26:36
2500
原创 Python数字金额转化为大写形式
1、如何将数字转换成中文大写数字。这需要一个映射表,将数字0-9映射到对应的中文大写数字。同时,还需要处理进位单位,如拾、佰、仟等,以及更大的单位如万、亿。2、处理金额的整数部分和小数部分。整数部分可能需要分解成亿、万、个等部分,每个部分分别转换成中文大写形式。小数部分则直接处理为角和分。在处理过程中,需要考虑一些特殊情况,比如连续的零如何处理,以及如何避免出现重复的零。此外,还需要确保金额的结尾处理正确,比如当分和角都为零时,需要添加“整”。
2025-03-17 15:02:00
606
原创 【DeepSeek】一键把DeepSeek+个人知识库部署在你电脑
AingDesk 是一款由国内团队开发的开源 AI 客户端工具,致力于零门槛实现本地化 AI 部署与管理。通过可视化界面,用户可一键将 DeepSeek、Llama 等上百款主流 AI 模型部署至个人电脑,同时集成个人知识库管理和深度联网搜索功能,实现“本地算力+云端智能”的混合架构。
2025-03-12 13:48:27
1025
原创 【Monica】国内版 Monica AI 助手正式发布,开启免费内测啦!限量内测邀请码
大家期待已久的 Monica 国内版终于来临!这是一款基于满血版模型打造的 AI 助手,它拥有 "智慧大脑" 和深度推理能力,运行速度飞快,能一站式满足你在工作、学习和生活中的各种需求。现在,让我们一起了解这款强大的 AI 助手。传统聊天机器人功能单一,仅能进行简单对话,面对复杂任务和问题往往无能为力。但完全不同,它是一个真正的全能 AI 工具。无论是复杂的学术问题还是日常生活的小困惑,Monica 都能给出精准且贴心的回答。它可以联网搜索实时信息,进行深度思考,提供全面深入的解决方案。
2025-03-07 10:11:03
1700
原创 【Manus】AI 代理人正式上岗-附Manus邀请码限时通道
在AI的世界里,我们早已习惯了它的存在。从简单的聊天机器人到复杂的文案生成器,AI似乎一直是那个“聪明的助手”,但似乎总差那么一点“实用性”。直到ChatGPT的出现,我们才惊呼:“原来AI可以这样!”然而,当Manus横空出世时,我们才发现——AI的潜力远不止于此。
2025-03-06 22:44:26
3008
1
原创 【DeepSeek】总结支持DeepSeek满血版的平台
硅基流动平台上的DeepSeek R1 满血版,虽然比官网稳定,但是比速度变得比官网要慢,于是后续硅基流动又推出了DeepSeek R1 满血版的Pro版,但是Pro版只能用你充值的额度,获赠额度只能用普通的DeepSeek R1 满血版。我个人也用Pro版居多一些。天工AI是上市公司昆仑万维旗下的AI工具,在搜索界面增加了对DeepSeek的支持,使用效果界面跟秘塔AI搜索和360的纳米搜索基本一样,目前也是免费使用,只不过网页版整体看起来有些杂乱,除了自带的图文社区的广告知外,还有不少预设的智能体。
2025-02-26 09:11:10
2042
原创 【DeepSeek】总结本地部署DeepSeek硬件配置清单
非必需(纯 CPU 推理),若 GPU 加速可选 4GB+ 显存(如 GTX 1650)24GB+ 显存(如 A100 40GB 或双卡 RTX 3090)多卡并行(如 2x A100 80GB 或 4x RTX 4090)16GB+ 显存(如 RTX 4090 或 A5000)推荐 8GB+ 显存(如 RTX 3070/4060)推荐 8GB+ 显存(如 RTX 3070/4060)3GB+ 存储空间(模型文件约 1.5-2GB)8GB+(模型文件约 4-5GB)8GB+(模型文件约 4-5GB)
2025-02-24 17:02:24
5952
原创 【DeepSeek】总结10个免费的DeepSeek使用平台
硅基流动是一家AI模型服务商,提供了R1、V3满血版以及DS多尺寸模型,还包括GLM、Qwen、Hunyuan、Yi、FLUX、Llama、SD等知名模型。华为云、阿里云、京东云、腾讯云、火山引擎、华为昇腾社区、联通云、百度智能云等云厂商都已接入DeepSeek,并提供了一定的免费体验额度。选择Siliconflow API后,把硅基流动的API密钥粘贴进去,选择模型deepseek-aiDeepSeek-R1,点保存,然后就可以了。想要体验满血版功能,推荐官网和硅基流动,但需注意可能存在的卡顿问题;
2025-02-20 15:48:16
3809
原创 《王者荣耀》操作技巧与排位赛策略指南
关于《王者荣耀》操作技巧、排位赛策略以及匹配机制相关内容整理成的完整文档。这份文档涵盖了英雄操作技巧提升、排位赛策略、匹配机制解析以及实战建议,适合玩家系统学习和参考。观看回放每场比赛结束后,观看回放,总结自己的操作失误和亮点。分析团队配合问题,找出需要改进的地方。调整策略根据对局中的问题,调整英雄选择、装备搭配或战术思路。总结经验教训,避免在后续对局中重复同样的错误。
2025-02-20 10:06:05
2042
原创 【OCR】基于深度学习的验证码识别模型训练的方法
数据预处理:将验证码文本标签转换为独热编码向量。:将独热编码向量转换回文本标签。:从指定目录加载图片数据,并将RGB图片转换为灰度图片,同时从文件名中提取标签。模型定义:定义了一个卷积神经网络(CNN)模型,用于定长验证码的识别。模型包含多层卷积、池化和全连接层,最终输出验证码的预测结果。训练过程train函数:加载训练和验证数据,初始化模型,使用回调函数(如)监控训练过程,并保存最佳模型。预测功能Predictor类:加载训练好的模型,提供单张图片或远程图片的预测功能。
2025-02-18 09:49:24
1189
原创 【OCR】总结Python中图片与pdf识别文本的方法
性能强大,适合复杂场景的文字识别。:封装了多个 OCR 引擎(如 Tesseract、Cuneiform 等),提供了统一的接口。:Tesseract 的 Python 封装,支持多种语言,使用简单,适合传统 OCR 任务。注意:根据你的具体需求(如语言支持、应用场景、性能要求等),可以选择最适合的 OCR 库。:易于使用,支持多种语言(包括中文、英文等),基于深度学习技术,适合初学者和快速集成。:专注于文档分析和表格识别,能够提取文档中的结构化信息,适合处理复杂布局的文档。
2025-02-14 16:41:06
3347
1
原创 【ima】DeepSeek-R1模型实时调用,去除服务器繁忙等待烦恼
近日,腾讯旗下智能工作台 ima.copilot(简称 ima)在技术层面进行了重要升级,悄悄地接入了 DeepSeek-R1 模型。用户将 ima 更新至最新版本后,在使用搜、读、写和知识库等功能时,可以选择腾讯混元大模型或 DeepSeek-R1 模型,从而获得更丰富的使用体验。
2025-02-14 09:58:17
1587
原创 【Python】基于Tesseract OCR的文本识别方法及代码示例
什么是 OCROCR,即,是光学字符识别的简称。它是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程。简言之,OCR技术可以将纸质文档中的文字转换成为黑白点阵的图像文件,并通过识别软件将图像中的文字转换成文本格式,供文字处理软件进一步编辑加工。OCR技术基于图像处理和模型识别技术,其应用场景非常广泛,包括文档数字化、数据提取、自动翻译、安全监控、智能客服等,还可以应用于医疗、金融、教育等领域。衡量一个OCR。
2025-02-13 17:02:28
2245
原创 总结谷歌浏览器取消更新的方法
依次展开「任务计划程序库」 > 「GoogleSystem」 > 「GoogleUpdater」。点击「停止」按钮,并将「启动类型」设置为「禁用」。在弹出的窗口中切换到「服务」选项卡。快捷键打开「运行」对话框,输入。点击「应用」并关闭「服务」管理器。快捷键打开「运行」对话框,输入。快捷键打开「运行」对话框,输入。快捷键打开「运行」对话框,输入。并回车,打开「系统配置」工具。并回车,打开「任务计划程序」。并回车,打开「服务」管理器。将该列表中的所有任务计划禁用。并回车,打开注册表编辑器。
2025-02-13 16:15:30
2702
原创 国产开源 AI DeepSeek 学习手册推荐
这份手册深入解析了国产开源 AI DeepSeek 的强大功能,无论是 AI 领域的初学者,还是想要进一步提升技能的学习者,都能从中受益匪浅,轻松开启从入门到精通 AI的 学习之旅,掌握 AI 的高效应用方法,让你在 AI 世界中如鱼得水。为了让有需要的朋友们能够方便地获取这份宝贵的学习资源,我已经将其完整资料打包上传到了网盘。希望大家都能通过这份手册,更好地了解和使用 DeepSeek,开启 AI 学习与应用的新篇章!网盘链接:https://pan.quark.cn/s/c7ac371a8af0。
2025-02-11 14:49:58
283
原创 PymuPDF4llm提取pdf文件文字、表格与图片
PymuPDF4llm 的文本提取功能非常简单易用。只需使用pip install pymupdf4llm进行安装,然后通过import pymupdf4llm导入库,就可以使用md_text = pymupdf4llm.to_markdown("input.pdf")语句轻松地从 PDF 文件中提取文本,并以 Markdown 格式呈现。例如,如果有一个包含大量文字的学术论文 PDF,PymuPDF4llm 可以快速准确地提取其中的文本内容,为后续的研究和分析提供便利。
2024-11-07 17:25:33
2881
原创 UiPath调用Python脚本的完整示例
a、添加python作用域b、加载python脚本c、调用python方法d、获取python对象e、显示Python结果的消息对话框。
2024-11-01 14:38:15
1047
原创 Python中两个float值相对比
在Python中,由于浮点数的表示通常是近似的,直接使用等号(==)来比较两个浮点数是否相等可能会导致意外的结果。这是因为浮点数在计算机中的存储方式可能导致微小的误差。因此,比较两个浮点数是否“相等”时,通常需要定义一个“容差”(tolerance)或“精度”(precision),来判断两个数是否在可接受的误差范围内相等。如果你不想使用num2 = 0.3# 使用自定义函数比较print(are_close) # 输出: True。
2024-10-16 14:19:00
713
原创 Linux中安装tesserocr遇到的那些坑
是正确的,并且是你的Tesseract OCR语言数据文件所在的目录。如果一切正常,你将看到Tesseract的版本信息。: 打开终端,并根据你的Linux发行版,选择编辑。环境变量添加到系统环境变量中,设置其值为。是你需要安装的语言代码,例如英语是。: 为了让更改立即生效,你需要重新加载。: 你可以通过在终端运行以下命令来检查。先安装Tesseract OCR。linux命令安装,提示失败。再安装tesserocr。再运行程序,便正常了。,或者为当前用户编辑。确认保存更改,最后按。
2024-10-15 10:24:25
743
原创 Linux系统中安装KenLM步骤及注意事项
如果您希望在不使用sudo的情况下运行KenLM的二进制文件,您可能需要将KenLM的安装目录添加到您的PATH环境变量中。您可以通过运行KenLM的二进制文件来验证安装是否成功。您可以使用系统的包管理器来安装这些依赖项。如果您的系统中安装了GCC,那么通常也会安装。)被成功检测到并工作正常,但CMake需要C++编译器来编译KenLM中的C++代码。注意:路径和命令可能因您的系统配置和KenLM的版本而有所不同。解压源代码后,进入KenLM的源代码目录,并创建一个构建目录。您可以从KenLM的官方网站(
2024-10-11 15:54:45
795
原创 JioNLP:一款实用的中文NLP预处理工具包
JioNLP是一个面向NLP开发者的工具包,提供了常见的中文文本预处理、解析等功能,使用简单、高效准确、无需配置,可极大加快NLP项目的开发进度。代码开源,使用MIT协议功能丰富,涵盖多个NLP预处理需求使用简单,无需复杂配置即可调用准确高效,算法经过精心设计和性能优化文档完善,提供详细使用说明JioNLP为NLP开发者提供了实用的预处理解析工具,有效减轻了开发负担,值得去了解和使用。
2024-10-08 14:00:05
1282
文件搜索利器 Everything v1.5.0
2024-11-29
文字转语音合成工具 VPot v2411 单文件版( 支持win 7 - 11 )
2024-11-29
一键AI抠图更换背景Digiarty.AIArty.Image.Matting.v2.0
2024-11-29
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人