一、实现目标
我们有一些关于庆余年的豆瓣评论,它闪存储在txt文件中,我们要读取这些评论,并进行了中文分词,最后制作了一张词云图,如下。
二、实现步骤
打开txt文件,可以看到内容是一些关于庆余年的评论,它们由句子组成。我们先要读取这些句子,然后将语句拆分成中文词语,再统计各个词语出现的次数,最后再生成词云图。
2.1 读取数据
使用with open()打开文件,由于文件内从较大,需要逐行读取里面的评论。
# 以只读的方式打开"豆瓣评论_庆余庆.txt",里面存放的是关于"庆余庆 第二季的评论"
wi