机器翻译基础与模型之一：基于RNN的模型

原创

已于 2024-11-20 18:29:18 修改 · 1.4k 阅读

·

7

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#机器翻译 #自然语言处理

于 2024-11-19 17:41:40 首次发布

一、机器翻译发展历程

基于规则的-->基于实例的-->基于统计方法的-->基于神经网络的

传统统计机器翻译把词序列看作离散空间里的由多个特征函数描述的点，类似
于 n-gram 语言模型，这类模型对数据稀疏问题非常敏感。神经机器翻译把文字序列表示为实数向量，一方面避免了特征工程繁重的工作，另一方面使得系统可以对文字序列的“表示”进行学习。

神经网络模型在机器翻译上的实践发展：

CNN/RNN：存在梯度消失问题

LSTM：seq2seq学习的方法，缓解了梯度消失/爆炸问题，通过遗忘门的设计让网络选择性的记忆信息，缓解了序列中长距离依赖的问题。但句子越长损失的信息越多，模型无法对输入和输出序列的对齐进行建模，不能有效保证翻译质量。

注意力机制：可以有效地处理长句子的翻译，而且注意力的中间结果具有一定的可解释性。但模型计算量很大。

GNMT系统：google发布的基于多层RNN的方法。

Transformer：完全摒弃了RNN和CNN，仅通过多头注意力机制和前馈神经网络的框架。解决了长距离依赖的问题，训练速度快，翻译效果更好。

二、基于RNN的模型

2.1 编码器-解码器

2.1.1 框架结构

编码器将输入的文字序列通过某种转换变为一种新的“表示”形式。解码器把这种“表示”重新转换为输出的文字序列。其中的核心问题是表示学习。

最低0.47元/天解锁文章

新学期VIP享超值加赠

博客等级

码龄8年

187
原创

1011
点赞

3122
收藏

3001
粉丝

关注

私信

热门文章

分类专栏

展开全部收起

上一篇：: 读书笔记《Lean In 向前一步》

下一篇：: 机器翻译基础与模型之二：基于CNN的模型

最新评论

学习TensorFlow的过程和经验总结
EXI-小洲: 《TensorFlow2人工智能实践》【北京大学】Tensorflow2.0：https://www.bilibili.com/video/BV1B7411L7Qt
学习TensorFlow的过程和经验总结
EXI-小洲: 【北京大学】Tensorflow2.0：https://www.bilibili.com/video/BV1B7411L7Qt
Scala使用flatMap来实现UDTF的功能效果
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)使用更多的站内链接；(2)增加条理清晰的目录；(3)增加除了各种控件外，文章正文的字数。
Bert中文文本分类
随风而逝_似我飘零: 文章写得很好，代码有几处有几点优化建议，仅供参考[code=python] class MyDataset(Dataset): def __init__(self, texts, labels, max_length): self.all_text = texts self.all_label = labels self.max_len = max_length self.tokenizer = BertTokenizer.from_pretrained(parsers().bert_pred) def __getitem__(self, index): # 根据tokenizer生成文本中每个token的位置编码和掩码信息 result = self.tokenizer.encode_plus(text=self.all_text[index], max_length=self.max_len, padding='max_length', truncation=True, return_tensors='pt') # 标签信息 label = int(self.all_label[index]) # 将所有信息都转化为tensor处理 token_ids = result.input_ids mask = result.attention_mask label = torch.tensor(label) return (token_ids, mask), label def __len__(self): # 得到文本的长度 return len(self.all_text) [/code] --- [code=python] def train(): # 加载参数 args = parsers() device = "cuda:0" if torch.cuda.is_a [/code]
在使用nohup命令后台训练pytorch模型时，关闭ssh窗口导致的训练任务失败解决方法
框架Z: 请问已经nohup后台挂载了，为什么还会关闭窗口就退出

大家在看

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。