人工智能学习笔记_诸神缄默不语的博客-CSDN博客

人工智能学习笔记

关注

文章平均质量分 87

博主在人工智能领域的学习笔记

关注数：文章数：271 文章阅读量：1076631 文章收藏量：7362

作者: 诸神缄默不语

浙大AI硕士毕业生，研究方向主要是自然语言处理和图神经网络。目前在传统企业做研发岗。

展开

专栏收录文章

Re 83 读论文：DeepSeek-R1：2025年初最强大模型的推理时候

DeepSeek-R1论文阅读笔记

原创 2025-07-02 10:57:49 · 915 阅读 · 0 评论
Re 82：读论文：qwen 3

Qwen3论文阅读笔记

原创 2025-06-21 16:22:11 · 1173 阅读 · 0 评论
Re 81 读论文：AlphaEvolve: A Gemini-powered coding agent for designing advanced algorithms

论文阅读笔记：《AlphaEvolve: A coding agent for scientific and algorithmic discovery》

原创 2025-05-24 11:33:22 · 1031 阅读 · 0 评论
RAG检索增强生成（持续更新ing...）

本文系统性介绍RAG

原创 2025-05-18 13:58:02 · 374 阅读 · 0 评论
langchain.text_splitter：用RecursiveCharacterTextSplitter而不是CharacterTextSplitter，解决chunk过长的问题

langchain.text_splitter：用RecursiveCharacterTextSplitter而不是CharacterTextSplitter，解决chunk过长的问题

原创 2025-03-03 14:28:13 · 633 阅读 · 0 评论
LangChain v0.3 langchain.chat_models.init_chat_model调用现成大模型接口进行智能问答教程

LangChain v0.3 langchain.chat_models.init_chat_model调用现成大模型接口进行智能问答教程

原创 2025-02-21 11:31:51 · 694 阅读 · 0 评论
LangChain v0.1调用OpenAI接口进行智能问答教程

LangChain v0.1调用OpenAI接口进行智能问答教程

原创 2025-02-21 09:19:51 · 868 阅读 · 0 评论
深度学习中的Checkpoint是什么？

深度学习中的Checkpoint是什么？

原创 2025-02-09 12:22:31 · 1765 阅读 · 0 评论
阿里大模型：Qwen2.5

本文介绍Qwen2.5模型

原创 2025-02-09 10:39:39 · 1557 阅读 · 0 评论
Re 80 读论文：DeepSeek-V3：2025年初最强大模型（几天前还是的）

DeepSeek-V3论文阅读笔记

原创 2025-02-08 09:51:30 · 1701 阅读 · 0 评论
Re 79 读论文：RoPE RoFormer: Enhanced Transformer with Rotary Position Embedding

RoPE论文阅读笔记

原创 2025-02-07 10:11:53 · 984 阅读 · 0 评论
混合专家模型（MoE）详解

混合专家模型（MoE）详解

原创 2025-01-17 11:03:24 · 2350 阅读 · 0 评论
Re78 读论文：GPT-4 Technical Report

论文阅读笔记：GPT-4 Technical Report

原创 2025-01-15 16:12:00 · 1144 阅读 · 0 评论
Re77 读论文：LoRA: Low-Rank Adaptation of Large Language Models

论文阅读笔记：《LoRA: Low-Rank Adaptation of Large Language Models》

原创 2025-01-06 14:49:15 · 2414 阅读 · 0 评论
如何使用大语言模型进行事件抽取与关系抽取

本文介绍如何使用大语言模型进行事件抽取与关系抽取

原创 2024-12-31 14:52:09 · 1345 阅读 · 0 评论
Re76 读论文：新兴技术的多指标量化识别研究——基于向量表征方法的探索

《新兴技术的多指标量化识别研究——基于向量表征方法的探索》阅读笔记

原创 2024-12-04 15:17:21 · 479 阅读 · 0 评论
如何调用百度文心一言API实现智能问答

本文介绍如何调用百度文心一言API实现智能问答

原创 2024-11-30 13:14:55 · 2292 阅读 · 1 评论
Lora里面说大模型参数是over-parametrized（过参数的），什么是over-parametrized？（另附相关概念：double descent和bias-variance trade

Lora里面说大模型参数是over-parametrized（过参数的），什么是over-parametrized？（另附相关概念：double descent和bias-variance trade

原创 2024-11-20 14:27:47 · 1877 阅读 · 0 评论
游程编码（Run-Length Encoding, RLE）在图像分割中的应用

本文介绍游程编码（Run-Length Encoding, RLE）在图像分割中的应用

原创 2024-11-15 18:01:00 · 609 阅读 · 0 评论
RGBA图像格式详解

RGBA代表红（Red）、绿（Green）、蓝（Blue）和透明度（Alpha）。它是在RGB颜色模型的基础上增加了一个透明度通道，使得图像可以表现出半透明效果。红色（R）：表示红色的强度，取值范围为0-255。绿色（G）：表示绿色的强度，取值范围为0-255。蓝色（B）：表示蓝色的强度，取值范围为0-255。透明度（A）：表示图像的透明度，取值范围为0-255。其中，0表示完全透明，255表示完全不透明。

原创 2024-11-15 17:46:40 · 2105 阅读 · 0 评论
PIL包在Python图像处理中的应用

本文介绍PIL包在Python图像处理中的应用

原创 2024-11-15 17:43:34 · 566 阅读 · 0 评论
Python 3中的OpenCV（cv2）：图像处理的强大工具

本文介绍cv2包

原创 2024-11-15 14:58:11 · 1418 阅读 · 0 评论
torchvision库在进行图片转换操作中报antialias参数没有显式设置会导致不同图片后端中的值不统一的警告信息

处理torchvision库的警告信息：UserWarning: The default value of the antialias parameter of all the resizing transforms (Resize(), RandomResizedCrop(), etc.) will change from None to True in v0.17, in order to be consistent across the PIL and Tensor backends. To supp

原创 2024-11-15 14:28:03 · 931 阅读 · 0 评论
如何在Win10系统本地部署语音转文字模型FunASR

本文介绍如何在Win10系统本地部署语音转文字模型FunASR

原创 2024-11-11 22:49:26 · 3390 阅读 · 2 评论
提示工程指南笔记

《提示工程指南》笔记

原创 2024-11-05 15:16:08 · 1321 阅读 · 0 评论
Re75 读论文：Toolformer: Language Models Can Teach Themselves to Use Tools

论文阅读笔记：Toolformer: Language Models Can Teach Themselves to Use Tools

原创 2024-10-16 16:45:41 · 1272 阅读 · 0 评论
Re74 读论文：DataGemma Knowing When to Ask - Bridging Large Language Models and Data

DataGemma技术报告阅读笔记

原创 2024-09-26 11:20:12 · 763 阅读 · 0 评论
DataGemma：谷歌大模型

本文介绍DataGemma：谷歌大模型

原创 2024-09-24 19:10:59 · 454 阅读 · 0 评论
Meta KDD Cup 2024 CRAG: Comphrehensive RAG Benchmark参赛指南（写了一半跑去改大论文了所以没正式参赛）

Meta KDD Cup 2024 CRAG: Comphrehensive RAG Benchmark参赛指南（写了一半跑去改大论文了所以没正式参赛）

原创 2024-07-20 16:39:09 · 1106 阅读 · 0 评论
香农信息量/自信息、信息熵、相对熵/KL散度/信息散度、交叉熵

香农信息量/自信息、信息熵、相对熵/KL散度/信息散度、交叉熵

原创 2024-05-25 18:29:12 · 1511 阅读 · 0 评论
Re72：读论文 XLM Cross-lingual Language Model Pretraining

XLM论文阅读笔记

原创 2024-05-25 15:48:50 · 550 阅读 · 0 评论
Application Development using Large Language Models笔记

Application Development using Large Language Models笔记

原创 2024-05-17 10:29:36 · 950 阅读 · 0 评论
Re71：读论文 Sequence to Sequence Learning with Neural Networks

《Sequence to Sequence Learning with Neural Networks》论文阅读笔记

原创 2024-05-02 17:22:24 · 977 阅读 · 0 评论
机器翻译常用指标BLEU

本文介绍机器翻译常用指标BLEU

原创 2024-05-02 14:41:22 · 2162 阅读 · 0 评论
Re70：读论文 T5 Exploring the Limits of Transfer Learning with a Unified Text-to-Text Transformer

T5论文阅读笔记

原创 2024-05-01 20:02:31 · 1481 阅读 · 0 评论
Re69：读论文 LaMDA: Language Models for Dialog Applications

《LaMDA: Language Models for Dialog Applications》论文阅读笔记

原创 2024-04-29 14:57:22 · 1381 阅读 · 0 评论
Re68：读论文 instruction tuning FLAN Finetuned Language Models Are Zero-Shot Learners

《Finetuned Language Models Are Zero-Shot Learners》论文阅读笔记

原创 2024-04-23 15:54:18 · 1318 阅读 · 0 评论
完全小白如何用Windows电脑运行人生中的第一个Bert文本分类代码（更简单版）

BERT文本分类入门代码

原创 2024-04-22 14:17:11 · 1330 阅读 · 0 评论
文字转语音TTS工具，开源可本地或云端部署：GPT-SoVITS

本文介绍文字转语音工具：GPT-SoVITS

原创 2024-04-15 17:13:25 · 5189 阅读 · 1 评论
Re67：读论文 Don‘t Trust ChatGPT when Your Question is not in English: A Study of Multilingual Abilities

《Don‘t Trust ChatGPT when Your Question is not in English: A Study of Multilingual Abilities》论文阅读笔记

原创 2024-04-14 16:50:47 · 803 阅读 · 0 评论

人工智能学习笔记

作者: 诸神缄默不语

Re 83 读论文：DeepSeek-R1：2025年初最强大模型的推理时候

Re 82：读论文：qwen 3

Re 81 读论文：AlphaEvolve: A Gemini-powered coding agent for designing advanced algorithms

RAG检索增强生成（持续更新ing...）

langchain.text_splitter：用RecursiveCharacterTextSplitter而不是CharacterTextSplitter，解决chunk过长的问题

LangChain v0.3 langchain.chat_models.init_chat_model调用现成大模型接口进行智能问答教程

LangChain v0.1调用OpenAI接口进行智能问答教程

深度学习中的Checkpoint是什么？

阿里大模型：Qwen2.5

Re 80 读论文：DeepSeek-V3：2025年初最强大模型（几天前还是的）

Re 79 读论文：RoPE RoFormer: Enhanced Transformer with Rotary Position Embedding

混合专家模型（MoE）详解

Re78 读论文：GPT-4 Technical Report

Re77 读论文：LoRA: Low-Rank Adaptation of Large Language Models

如何使用大语言模型进行事件抽取与关系抽取

Re76 读论文：新兴技术的多指标量化识别研究——基于向量表征方法的探索

如何调用百度文心一言API实现智能问答

Lora里面说大模型参数是over-parametrized（过参数的），什么是over-parametrized？（另附相关概念：double descent和bias-variance trade

游程编码（Run-Length Encoding, RLE）在图像分割中的应用

RGBA图像格式详解

PIL包在Python图像处理中的应用

Python 3中的OpenCV（cv2）：图像处理的强大工具

torchvision库在进行图片转换操作中报antialias参数没有显式设置会导致不同图片后端中的值不统一的警告信息

如何在Win10系统本地部署语音转文字模型FunASR

提示工程指南 笔记

Re75 读论文：Toolformer: Language Models Can Teach Themselves to Use Tools

Re74 读论文：DataGemma Knowing When to Ask - Bridging Large Language Models and Data

DataGemma：谷歌大模型

Meta KDD Cup 2024 CRAG: Comphrehensive RAG Benchmark参赛指南（写了一半跑去改大论文了所以没正式参赛）

香农信息量/自信息、信息熵、相对熵/KL散度/信息散度、交叉熵

Re72：读论文 XLM Cross-lingual Language Model Pretraining

Application Development using Large Language Models笔记

Re71：读论文 Sequence to Sequence Learning with Neural Networks

机器翻译常用指标BLEU

Re70：读论文 T5 Exploring the Limits of Transfer Learning with a Unified Text-to-Text Transformer

Re69：读论文 LaMDA: Language Models for Dialog Applications

Re68：读论文 instruction tuning FLAN Finetuned Language Models Are Zero-Shot Learners

完全小白如何用Windows电脑运行人生中的第一个Bert文本分类代码（更简单版）

文字转语音TTS工具，开源可本地或云端部署：GPT-SoVITS

Re67：读论文 Don‘t Trust ChatGPT when Your Question is not in English: A Study of Multilingual Abilities

提示工程指南笔记