AIGC_北苏-CSDN博客

原创提示词工程实战指南：5大技巧大幅提升LLM输出质量

本文结合OpenAI API实战案例，详解如何通过系统化提示词设计优化大型语言模型（LLM）输出效果。包含少样本学习、结构化指令、思维链推理等核心技巧，附完整代码示例。

2025-09-02 17:07:33 847

本文探讨了如何提升Qwen3-4B大模型在信息抽取任务中的处理速度。文章分析了影响速度的两个关键因素：pydantic模型复杂度和模型自身的"思考深度"，并提出了三种优化方案：部署量化模型、拆分pydantic模型实现并发调用、以及结合正则表达式预处理。通过对比测试不同量化版本的模型（FP16、NF4单量化和混合量化），发现FP16版本在速度和质量上表现最佳。文章还详细介绍了使用vLLM和llama.cpp框架部署量化模型的方法，指出llama.cpp部署的GGUF量化模型处理速度可达4

2025-08-28 16:39:22 924

原创 Langchain如何让大模型结构化输出指定的字段信息

本文探讨了如何实现文件信息智能抽取功能，主要解决四个核心问题：1）多格式文件转文本（已通过Umi-OCR和MarkItDown解决）；2）使用LangChain框架实现结构化输出；3）提示词优化；4）效果排查与优化。重点介绍了四种结构化输出方法（Pydantic类、JSON Schema、StructuredOutputParser和PydanticOutputParser），并通过性能对比建议：模型支持结构化时首选Pydantic方法，否则选择PydanticOutputParser。文章还提供了复杂嵌套

2025-08-20 15:34:05 814

原创 Umi-OCR，完美解决企业OCR的核心痛点！！！【史上最全（万字）安装加测评】

Umi-OCR的实际安装加测评报告，可以很好的解决企业在实际ocr处理中的问题，比如：资源有限的情况下，如何进行本地OCR识别。

2025-08-13 16:11:02 825

原创本地使用uv管理的python项目怎么部署到服务器？

linux安装UV，服务器没法连接外网安装uv。

2025-08-05 15:25:31 790

原创 Fastapi文件上传那些事？

本文探讨了AI应用中处理用户上传文件的方案设计。通过FastAPI接口接收文件，区分纯文本文件（需处理编码格式）和结构化文件（如DOCX/XLSX），使用临时文件存储并自定义MultiFormatProcessor类提取文本。关键点包括：1）使用chardet检测TXT等文件的编码格式；2）DOCX/XLSX等结构化文件内置XML编码声明无需额外处理；3）设计ChatFile类验证文件属性并调用处理类。最终将文本转换为MD格式或langchain文档块，为后续AI处理提供结构化输入。

2025-08-04 17:01:50 983

原创 MarkItDown如何接入AI系统提供服务？

文章摘要：本文介绍了开源工具MarkItDown的使用方法，它能将各类文件转换为Markdown格式。作者详细记录了Windows安装过程（需Python3.10+，使用uv管理虚拟环境）和服务器部署步骤，测试了文本、PDF、Excel等文件转换效果。结果显示工具能有效处理文本类文件，但对图片类PDF和PPT支持有限。该工具特别适合需要将文档转换为LLM友好格式的开发场景。安装时建议根据需求选择依赖项，开发环境推荐使用uvadd记录依赖。

2025-07-30 14:44:40 916

原创让UV管理一切！！！

一、遇到的问题自己在做AI开发的时候，先用的conda来管理虚拟环境，然后使用pip freeze > reqiurments来打包相关依赖。优点，conda环境可以让不同的项目有单独的虚拟环境，不会干扰每个项目，还可以多个项目共享一个conda环境。缺点：1.项目一旦大的话，python最麻烦的就是环境依赖，本来自己安装的核心依赖就30个，但是每个库又依赖别的子库，这样下来就有几百上千个依赖，非常麻烦。2.如果只删除主依赖，比如fastapi。但是它的其他子依赖不会被删除。

2025-07-24 15:47:13 953

原创云服务Ubantu24安装Redis,windows可视化数据库

redis的安装，密码设置，远程连接

2025-06-25 11:35:18 496

原创 Ubantu本地部署dify，接入本地部署的langchain程序API服务。

本文通过Ubantu部署模型和向量模型可以很好的实现dify和langchain的结合

2025-06-24 16:25:12 817

原创 Ollama本地部署gte-base-zh向量模型嵌入langchian框架

Ollama本地部署向量模型嵌入langchian0.3框架使用

2025-06-23 10:32:40 989

原创 python使用SQLAlchemy 库操作本地的mysql数据库

python使用SQLAlchemy 库操作本地的mysql数据库

2025-06-11 16:38:39 1282

原创 FastAPI 的原理和使用

FastAPI介绍

2025-06-11 09:45:13 844

原创 GPU架构对大模型推理部署到底有什么影响？

gpu架构对模型推理部署的影响

2025-06-10 16:17:47 1248

原创 Ubuntu 安装 Mysql 数据库

Ubantu下载mysql数据库

2025-06-09 11:33:43 1047

原创 DrissionPage爬虫包实战分享

DrissionPage的介绍和使用，实战爬虫项目。

2025-06-04 16:23:04 1793 2

原创 Dify案例实战之智能体应用构建（二）

本文详细介绍了dify构建飞书机器人应用和rag应用的过程

2025-05-28 18:26:51 1284

原创 Dify案例实战之智能体应用构建（一）

使用dfiy构建agent、workflow

2025-05-28 15:13:56 3482

原创 Windows安装Docker部署dify，接入阿里云api-key进行rag测试

基于windows10专业版安装docker部署dify，链接阿里云平台进行测试

2025-05-27 16:39:33 1483 2

原创 VLLM框架部署Qwen大模型，应该选择哪个qwen3系列的大模型和什么硬件配置？

本文讲述了不同Qwen3大模型的区别，还有对应的硬件选择。

2025-05-26 17:02:19 1649

原创云服务器Ubuntu系统安装Docker教程和失败原因

我们直接复制https://download.docker.com/linux/ubuntu/gpg到浏览器会自己下载这个文件。所以只能用直接安装好的docker云服务器，不能在docker容器里面安装docker服务。新建/etc/apt//keyrings/docker.asc文件，把内容粘贴进去，保存退出。# 如果网络不好，这个文件可以手动下载，然后改为docker.asc即可。# 以便后续可以通过APT包管理器安装docker的相关软件包。因为云服务器本身就是容器，所以需要宿主机操作。

2025-05-26 14:26:18 685

原创如何计算VLLM本地部署Qwen3-4B的GPU最小配置应该是多少？多人并发访问本地大模型的GPU配置应该怎么分配？

本文解决了很多VLLM的实际部署的硬件配置问题。

2025-05-23 18:54:47 1156 2

原创超详细VLLM框架部署qwen3-4B加混合推理探索！！！

本文详细地使用VLLM框架本地部署qwen3-4B模型，混合推理如何关闭，open-webui框架的使用。

2025-05-23 15:36:02 2946

原创手把手教你使用云服务器和部署相关环境！！！

本文介绍了如何通过蓝耘云服务器进行AI模型训练和开发环境的搭建。蓝耘云平台以其高性价比和强大的GPU算力资源，为AI客户和科研工作者提供了高效的算力云服务。文章详细说明了从注册蓝耘云服务、安装VScode和Python环境、配置SSH插件、连接蓝耘服务器到设置Anaconda环境的全过程。特别强调了使用Anaconda环境的重要性，以避免项目间的依赖冲突，并提供了具体的安装和配置步骤。

2025-05-22 15:10:17 823

原创蓝耘Ubantu服务器测试最新 PP-StructureV3 教程

【全网最新最详细的测试ppstructureV3】-----------通过云服务器部署测试ppstructureV3项目。

2025-05-21 18:25:58 2055 1

原创蓝耘服务器部署ppocr-gpu项目

使用云服务器部署和测试ppocr-gpu的效果

2025-05-21 11:35:12 1210

原创阿里云服务器Ubuntu的git clone失败问题解决方案

这里我们要科学上网访问github，然后把生成的ssh密钥设置好,登录GitHub → Settings → SSH and GPG keys → 粘贴公钥并保存。若配置了多个GitHub账户，需在 ~/.ssh/config 中为每个账户指定不同的 Host 别名和对应的私钥。日志中应显示 Offering public key: ~/.ssh/id_rsa，确认密钥被正确加载。3. 修改SSH配置文件以使用443端口。1. 确认SSH密钥是否存在并正确配置。4. 测试连接并调试。

2025-05-20 17:46:53 1088 2

原创云服务器Ubuntu成功本地部署ppocr-gpu项目

本文详细介绍了在云服务器上安装和配置PaddleOCR GPU版本的步骤。首先，选择Anaconda3创建虚拟环境，并安装PaddlePaddle-GPU及相关依赖。重点在于根据系统支持的CUDA版本选择合适的PaddlePaddle-GPU版本，并通过conda安装，避免版本冲突。安装完成后，通过配置环境变量确保CUDA包的正确加载。最后，安装PaddleOCR库并进行测试，展示了如何使用PaddleOCR进行文字识别。整个过程强调了版本兼容性和环境配置的重要性，为在云服务器上部署PaddleOCR提供了

2025-05-20 15:52:16 1473

空空如也

空空如也