没有合适的资源?快使用搜索试试~ 我知道了~
资源推荐
资源详情
资源评论























格式:pdf 资源大小:242.0KB 页数:9









Python实现实现Wordcloud生成词云图的示例生成词云图的示例
主要介绍了Python实现Wordcloud生成词云图的示例,文中通过示例代码介绍的非常详细,对大家的学习或者工
作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
wordcloud是Python扩展库中一种将词语用图片表达出来的一种形式,通过词云生成的图片,我们可以更加直观的看出某篇文
章的故事梗概。
首先贴出一张词云图(以哈利波特小说为例):
在生成词云图之前,首先要做一些准备工作
1.安装结巴分词库
pip install jieba
Python中的分词模块有很多,他们的功能也都是大同小异,我们安装的结巴分词 是当前使用的最多的类型。
下面我来简单介绍一下结巴分词的用法
结巴分词的分词模式分为三种:
(1)全模式:把句子中所有的可以成词的词语都扫描出来, 速度快,但是不能解决歧义问题
(2)精确模式:将句子最精确地切开,适合文本分析
(3)搜索引擎模式:在精确模式的基础上,对长词再次切分,提高召回率,适合用于搜索引擎分词
下面用一个简单的例子来看一下三种模式的分词区别:
import jieba
# 全模式:把句子中所有的可以成词的词语都扫描出来, 速度快,但是不能解决歧义问题
text = "哈利波特是一常优秀的文学作品"
seg_list = jieba.cut(text, cut_all=True)
print(u"[全模式]: ", "/ ".join(seg_list))
# 精确模式:将句子最精确地切开,适合文本分析
seg_list = jieba.cut(text, cut_all=False)
print(u"[精确模式]: ", "/ ".join(seg_list))
# 默认是精确模式
seg_list = jieba.cut(text)
print(u"[默认模式]: ", "/ ".join(seg_list))
# 搜索引擎模式:在精确模式的基础上,对长词再次切分,提高召回率,适合用于搜索引擎分词
资源评论


weixin_38643307
- 粉丝: 8
上传资源 快速赚钱
我的内容管理 展开
我的资源 快来上传第一个资源
我的收益
登录查看自己的收益我的积分 登录查看自己的积分
我的C币 登录后查看C币余额
我的收藏
我的下载
下载帮助


最新资源
- 基于微课的翻转课堂在中职计算机教学中的应用与创新.docx
- 电力系统潮流分析计算的MATLAB仿真周明亮01.doc
- 现场签证管理作业指引.doc
- 基于单片机的数控稳压电源毕业设计.doc
- 国家重点研发计划项目答辩评审表格.doc
- 中餐布草送洗程序及标准.pdf
- 小学数学深度学习的实践探索-(4).doc
- 基于Android的2048游戏的设计与实现.doc
- 基于matlab的IIR滤波器的设计文献综述.doc
- 2003沉积学原理试题及答案.doc
- 三菱PLC的三层电梯控制系统设计.docx
- 基于BP神经网络数学算法的智能照明控制应用.docx
- 电力建设工程质量通病典型缺陷防治.doc
- 信息化教学背景下高职教学管理的现状及对策.docx
- d1200-32离心鼓风机试车方案.doc
- 30m预应力工字梁安装方案.doc
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈



安全验证
文档复制为VIP权益,开通VIP直接复制
