
AI人工智能教程
文章平均质量分 96
本教程涉及文生图、文生视频、LLM等领域,将打造从0到1学习AI模型之路,其中包括热门ChatGPT、DeepSeek等模型教程
Tasfa
www.tasfa.cn
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
【AI系列】从零开始学习大模型GPT (2)- Build a Large Language Model (From Scratch)
Attention机制是一种在深度学习中广泛应用的技术,特别是在自然语言处理(NLP)和计算机视觉等领域。它的核心思想是让模型在处理输入数据时,能够有选择地关注某些重要部分,而不是对所有部分一视同仁。这种机制可以显著提高模型的性能和效率。Attention机制通过让模型有选择地关注输入数据的不同部分,提高了模型的性能和效率。它已经成为现代深度学习模型,尤其是自然语言处理领域中的一个关键组件。原创 2025-02-12 18:07:00 · 1532 阅读 · 0 评论 -
【AI系列】从零开始学习大模型GPT (1)- Build a Large Language Model (From Scratch)
LLMs代表了深度学习技术的-一种特定应用,利用其处理和生成类人文本的能力。深度学习是机器学习的一个专门分支,侧重于使用多层神经网络。机器学习和深度学习是旨在实现算法的领域,使计算机能够从数据中学习并执行通常需要人类智能的任务。原始Transformer架构的简化描述,这是一种用于语言翻译的深度学习模型。编码器:处理输入文本并生成文本的嵌入表示(在不同维度上捕捉许多不同因素的数值表示)解码器:可以使用这些嵌入表示逐字生成翻译后的文本。原创 2024-12-26 15:48:33 · 1181 阅读 · 0 评论