【Python学习】网络爬虫-制作词云图

一、实现目标

        我们有一些关于庆余年的豆瓣评论,它闪存储在txt文件中,我们要读取这些评论,并进行了中文分词,最后制作了一张词云图,如下。

二、实现步骤

        打开txt文件,可以看到内容是一些关于庆余年的评论,它们由句子组成。我们先要读取这些句子,然后将语句拆分成中文词语,再统计各个词语出现的次数,最后再生成词云图。

2.1 读取数据

        使用with open()打开文件,由于文件内从较大,需要逐行读取里面的评论。

# 以只读的方式打开"豆瓣评论_庆余庆.txt",里面存放的是关于"庆余庆 第二季的评论"
wi
PyCharm 是一个集成开发环境,可以用来编写 Python 代码。要制作词云图,可以使用 Python库 WordCloud,以下是使用 PyCharm 制作词云图的步骤: 1. 安装 WordCloud 库。在 PyCharm 中打开终端窗口,输入以下命令安装: ``` pip install wordcloud ``` 2. 准备文本数据。可以从文件中读取文本,或者直接在代码中定义字符串变量。 3. 编写 Python 代码。以下是一个简单的示例代码,可以生成一个词云图: ```python import wordcloud import jieba # 读取文本数据 with open('text.txt', 'r', encoding='utf-8') as f: text = f.read() # 使用 jieba 分词 words = jieba.cut(text) # 拼接分词结果为字符串 words_str = ' '.join(words) # 创建对象 wc = wordcloud.WordCloud(width=800, height=600, background_color='white') # 生成词云图 wc.generate(words_str) # 保存词云图到文件 wc.to_file('wordcloud.png') ``` 上面的代码中,使用 jieba 库对文本进行分词,然后将分词结果拼接为一个字符串。创建 WordCloud 对象时,可以指定词云图的宽度、高度和背景颜色等参数。调用 generate 方法生成词云图,最后使用 to_file 方法将词云图保存到文件。 4. 运行代码。在 PyCharm 中运行代码,词云图将会生成并保存在指定的文件中。 注意:要使用 jieba 库进行中文分词,需要提前安装并下载其库。可以在终端窗口中输入以下命令: ``` pip install jieba python -m jieba.downloader ``` 第二个命令会下载 jieba库文件。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

西攻城狮北

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值