BERT（从理论到实践）: Bidirectional Encoder Representations from Transformers【1】

最新推荐文章于 2025-05-10 14:32:38 发布

白马负金羁

最新推荐文章于 2025-05-10 14:32:38 发布

阅读量1.4k

点赞数 29

CC 4.0 BY-SA版权

分类专栏：自然语言处理信息检索文章标签： bert 人工智能深度学习 Keras 自然语言处理

本文链接：https://blog.csdn.net/baimafujinji/article/details/135337389

自然语言处理信息检索专栏收录该内容

35 篇文章 ¥19.90 ¥99.00

订阅专栏

超级会员免费看

BERT是Google提出的预训练模型，基于Transformer的Encoder，用于自然语言处理。通过Masked Language Model和Next Sentence Prediction任务，BERT在大量未标记数据上进行训练，能捕捉单词的上下文信息和句子间的关系。预训练后，模型再针对特定任务进行Fine-tuning，提高准确率和效率。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

预训练模型：A pre-trained model is a saved network that was previously trained on a large dataset, typically on a large-scale image-classification task. You either use the pretrained model as is or use transfer learning to customize this model to a given task.

BERT是Google提出的一个基于Transformer的自然语言处理领域的预训练模型。它之所以被称为这个名字，一方面它是Bidirectional Encoder Representations from Transformers首字母的缩写。另一方面，还是为了致敬之前的一个模型ELMO。《Sesame Street》是由美国芝麻街工作室制作的一档儿童教育电视节目，其中的两个卡通人物分别是ELMO和BERT，如下图所示。