
人工智能学习笔记
文章平均质量分 87
博主在人工智能领域的学习笔记
诸神缄默不语
浙大AI硕士毕业生,研究方向主要是自然语言处理和图神经网络。目前在传统企业做研发岗。
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
Re 83 读论文:DeepSeek-R1:2025年初最强大模型的推理时候
DeepSeek-R1论文阅读笔记原创 2025-07-02 10:57:49 · 915 阅读 · 0 评论 -
Re 82:读论文:qwen 3
Qwen3论文阅读笔记原创 2025-06-21 16:22:11 · 1173 阅读 · 0 评论 -
Re 81 读论文:AlphaEvolve: A Gemini-powered coding agent for designing advanced algorithms
论文阅读笔记:《AlphaEvolve: A coding agent for scientific and algorithmic discovery》原创 2025-05-24 11:33:22 · 1031 阅读 · 0 评论 -
RAG检索增强生成(持续更新ing...)
本文系统性介绍RAG原创 2025-05-18 13:58:02 · 374 阅读 · 0 评论 -
langchain.text_splitter:用RecursiveCharacterTextSplitter而不是CharacterTextSplitter,解决chunk过长的问题
langchain.text_splitter:用RecursiveCharacterTextSplitter而不是CharacterTextSplitter,解决chunk过长的问题原创 2025-03-03 14:28:13 · 633 阅读 · 0 评论 -
LangChain v0.3 langchain.chat_models.init_chat_model调用现成大模型接口进行智能问答教程
LangChain v0.3 langchain.chat_models.init_chat_model调用现成大模型接口进行智能问答教程原创 2025-02-21 11:31:51 · 694 阅读 · 0 评论 -
LangChain v0.1调用OpenAI接口进行智能问答教程
LangChain v0.1调用OpenAI接口进行智能问答教程原创 2025-02-21 09:19:51 · 868 阅读 · 0 评论 -
深度学习中的Checkpoint是什么?
深度学习中的Checkpoint是什么?原创 2025-02-09 12:22:31 · 1765 阅读 · 0 评论 -
阿里大模型:Qwen2.5
本文介绍Qwen2.5模型原创 2025-02-09 10:39:39 · 1557 阅读 · 0 评论 -
Re 80 读论文:DeepSeek-V3:2025年初最强大模型(几天前还是的)
DeepSeek-V3论文阅读笔记原创 2025-02-08 09:51:30 · 1701 阅读 · 0 评论 -
Re 79 读论文:RoPE RoFormer: Enhanced Transformer with Rotary Position Embedding
RoPE论文阅读笔记原创 2025-02-07 10:11:53 · 984 阅读 · 0 评论 -
混合专家模型(MoE)详解
混合专家模型(MoE)详解原创 2025-01-17 11:03:24 · 2350 阅读 · 0 评论 -
Re78 读论文:GPT-4 Technical Report
论文阅读笔记:GPT-4 Technical Report原创 2025-01-15 16:12:00 · 1144 阅读 · 0 评论 -
Re77 读论文:LoRA: Low-Rank Adaptation of Large Language Models
论文阅读笔记:《LoRA: Low-Rank Adaptation of Large Language Models》原创 2025-01-06 14:49:15 · 2414 阅读 · 0 评论 -
如何使用大语言模型进行事件抽取与关系抽取
本文介绍如何使用大语言模型进行事件抽取与关系抽取原创 2024-12-31 14:52:09 · 1345 阅读 · 0 评论 -
Re76 读论文:新兴技术的多指标量化识别研究——基于向量表征方法的探索
《新兴技术的多指标量化识别研究——基于向量表征方法的探索》阅读笔记原创 2024-12-04 15:17:21 · 479 阅读 · 0 评论 -
如何调用百度文心一言API实现智能问答
本文介绍如何调用百度文心一言API实现智能问答原创 2024-11-30 13:14:55 · 2292 阅读 · 1 评论 -
Lora里面说大模型参数是over-parametrized(过参数的),什么是over-parametrized?(另附相关概念:double descent和bias-variance trade
Lora里面说大模型参数是over-parametrized(过参数的),什么是over-parametrized?(另附相关概念:double descent和bias-variance trade原创 2024-11-20 14:27:47 · 1877 阅读 · 0 评论 -
游程编码(Run-Length Encoding, RLE)在图像分割中的应用
本文介绍游程编码(Run-Length Encoding, RLE)在图像分割中的应用原创 2024-11-15 18:01:00 · 609 阅读 · 0 评论 -
RGBA图像格式详解
RGBA代表红(Red)、绿(Green)、蓝(Blue)和透明度(Alpha)。它是在RGB颜色模型的基础上增加了一个透明度通道,使得图像可以表现出半透明效果。红色(R):表示红色的强度,取值范围为0-255。绿色(G):表示绿色的强度,取值范围为0-255。蓝色(B):表示蓝色的强度,取值范围为0-255。透明度(A):表示图像的透明度,取值范围为0-255。其中,0表示完全透明,255表示完全不透明。原创 2024-11-15 17:46:40 · 2105 阅读 · 0 评论 -
PIL包在Python图像处理中的应用
本文介绍PIL包在Python图像处理中的应用原创 2024-11-15 17:43:34 · 566 阅读 · 0 评论 -
Python 3中的OpenCV(cv2):图像处理的强大工具
本文介绍cv2包原创 2024-11-15 14:58:11 · 1418 阅读 · 0 评论 -
torchvision库在进行图片转换操作中报antialias参数没有显式设置会导致不同图片后端中的值不统一的警告信息
处理torchvision库的警告信息:UserWarning: The default value of the antialias parameter of all the resizing transforms (Resize(), RandomResizedCrop(), etc.) will change from None to True in v0.17, in order to be consistent across the PIL and Tensor backends. To supp原创 2024-11-15 14:28:03 · 931 阅读 · 0 评论 -
如何在Win10系统本地部署语音转文字模型FunASR
本文介绍如何在Win10系统本地部署语音转文字模型FunASR原创 2024-11-11 22:49:26 · 3390 阅读 · 2 评论 -
提示工程指南 笔记
《提示工程指南》笔记原创 2024-11-05 15:16:08 · 1321 阅读 · 0 评论 -
Re75 读论文:Toolformer: Language Models Can Teach Themselves to Use Tools
论文阅读笔记:Toolformer: Language Models Can Teach Themselves to Use Tools原创 2024-10-16 16:45:41 · 1272 阅读 · 0 评论 -
Re74 读论文:DataGemma Knowing When to Ask - Bridging Large Language Models and Data
DataGemma技术报告阅读笔记原创 2024-09-26 11:20:12 · 763 阅读 · 0 评论 -
DataGemma:谷歌大模型
本文介绍DataGemma:谷歌大模型原创 2024-09-24 19:10:59 · 454 阅读 · 0 评论 -
Meta KDD Cup 2024 CRAG: Comphrehensive RAG Benchmark参赛指南(写了一半跑去改大论文了所以没正式参赛)
Meta KDD Cup 2024 CRAG: Comphrehensive RAG Benchmark参赛指南(写了一半跑去改大论文了所以没正式参赛)原创 2024-07-20 16:39:09 · 1106 阅读 · 0 评论 -
香农信息量/自信息、信息熵、相对熵/KL散度/信息散度、交叉熵
香农信息量/自信息、信息熵、相对熵/KL散度/信息散度、交叉熵原创 2024-05-25 18:29:12 · 1511 阅读 · 0 评论 -
Re72:读论文 XLM Cross-lingual Language Model Pretraining
XLM论文阅读笔记原创 2024-05-25 15:48:50 · 550 阅读 · 0 评论 -
Application Development using Large Language Models笔记
Application Development using Large Language Models笔记原创 2024-05-17 10:29:36 · 950 阅读 · 0 评论 -
Re71:读论文 Sequence to Sequence Learning with Neural Networks
《Sequence to Sequence Learning with Neural Networks》论文阅读笔记原创 2024-05-02 17:22:24 · 977 阅读 · 0 评论 -
机器翻译常用指标BLEU
本文介绍机器翻译常用指标BLEU原创 2024-05-02 14:41:22 · 2162 阅读 · 0 评论 -
Re70:读论文 T5 Exploring the Limits of Transfer Learning with a Unified Text-to-Text Transformer
T5论文阅读笔记原创 2024-05-01 20:02:31 · 1481 阅读 · 0 评论 -
Re69:读论文 LaMDA: Language Models for Dialog Applications
《LaMDA: Language Models for Dialog Applications》论文阅读笔记原创 2024-04-29 14:57:22 · 1381 阅读 · 0 评论 -
Re68:读论文 instruction tuning FLAN Finetuned Language Models Are Zero-Shot Learners
《Finetuned Language Models Are Zero-Shot Learners》论文阅读笔记原创 2024-04-23 15:54:18 · 1318 阅读 · 0 评论 -
完全小白如何用Windows电脑运行人生中的第一个Bert文本分类代码(更简单版)
BERT文本分类入门代码原创 2024-04-22 14:17:11 · 1330 阅读 · 0 评论 -
文字转语音TTS工具,开源可本地或云端部署:GPT-SoVITS
本文介绍文字转语音工具:GPT-SoVITS原创 2024-04-15 17:13:25 · 5189 阅读 · 1 评论 -
Re67:读论文 Don‘t Trust ChatGPT when Your Question is not in English: A Study of Multilingual Abilities
《Don‘t Trust ChatGPT when Your Question is not in English: A Study of Multilingual Abilities》论文阅读笔记原创 2024-04-14 16:50:47 · 803 阅读 · 0 评论