【NLP】新闻主题分类任务
前言
学习目标
-
了解有关新闻主题分类和有关数据.
-
掌握使用浅层网络构建新闻主题分类器的实现过程.
-
关于新闻主题分类任务:
- 以一段新闻报道中的文本描述内容为输入, 使用模型帮助我们判断它最有可能属于哪一种类型的新闻, 这是典型的文本分类问题, 我们这里假定每种类型是互斥的, 即文本描述有且只有一种类型.
新闻主题分类数据:
- 通过torchtext获取数据:
# 导入相关的torch工具包
import torch
import torchtext
# 导入torchtext.datasets中的文本分类任务
from torchtext.datasets import text_clas