
Codebase
QT-Smile
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
怎样寻找一篇论文的代码
怎样寻找一篇论文的代码原创 2023-03-11 17:09:07 · 1765 阅读 · 0 评论 -
Transformer代码讲解(最最最最......详细)
Transformer代码讲解(最最最最…详细)整个代码主要分为两部分去讲解:一、完整代码二、部分代码剖析1、主函数if name == ‘main’:2、 从整体网路结构来看,分为三个部分:编码层,解码层,输出层3、Encoder 部分包含三个部分:词向量embedding,位置编码部分,注意力层及后续的前馈神经网络4、PositionalEncoding 代码实现5、get_attn_pad_mask6、EncoderLayer :包含两个部分,多头注意力机制和前馈神经网络7、Mul原创 2021-12-12 21:07:14 · 15938 阅读 · 3 评论 -
代码实现transformer
代码实现transformer1.下面这整个属于一个样本。所以batch_size = 12.3.4.为了加快模型的处理速度,我们在训练的时候,一般都会把batch_size设置为大于1的数,但又会引入一个问题,当我们同时处理几个句子时(这里我们把矩阵的一行看做一个句子,而且有多少行,batch_size就设置为几。)有些句子的长度是不一样的,所以我们这里人为设定了一个最大长度。当句子的长度超过最大长度时,我们就需要把超过长度的字删去。此时有些句子的长度是小于最大长度的,而一个矩阵需要把它的原创 2021-12-11 11:23:33 · 1305 阅读 · 0 评论 -
code01_创建一个二维列表
kernels_all = list() for i in range(4096): kernels_all.append([]) for j in range(4): kernels_all[i].append(1)原创 2021-12-08 12:56:39 · 289 阅读 · 0 评论