第十章 Python第三方库概览

本章节介绍了Python第三方库的获取和安装方法,包括pip工具、自定义安装和文件安装。重点讲解了pip工具的使用,如安装、卸载、查看已安装库等。此外,还探讨了PyInstaller库用于程序打包,jieba库进行中文分词,以及wordcloud库生成词云的实践应用。通过实例解析《红楼梦》人物出场词云,加深了对这些库的理解。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

第十章 Python第三方库概览

10.1 Python第三方库的获取和安装

Python第三方库依照安装方式灵活性和难易程度有三个方法:pip工具安装、自定义安装和文件安装

10.1.1 pip工具安装

最常用且最高效的Python第三方库安装方式是采用pip工具安装。pip是Python官方提供并维护的在线第三方库安装工具。

使用pip安装第三方库需要联网。语法格式如下:

pip install <拟安装库名>

pip是Python第三方库最主要的安装方式,可以安装超过90%以上的第三方库。然而还有一些第三方库无法暂时用pip安装,此时需要其他的安装方法。

pip工具与操作系统也有关系,在Mac OS X和Linux等操作系统中,pip工具几乎可以安装任何Python第三方库,在Windows操作系统中,有一些第三方库任然需要用其他方式尝试安装。

10.1.2 自定义安装

自定义安装指按照第三方库提供的步骤和方式按照。第三方库都有主页用于维护库的代码和文档。以科学计算用的numpy为例,

开发者维护的官方主页是:https://numpy.org/

10.1.3 文件安装

由于Python某些第三方库仅提供源代码,通过pip下载文件后无法在Windows系统编译安装,会导致第三方库安装失败。在Windows平台下所遇到无法安装第三方库的问题大多属于这类。

为了解决这类第三方库安装问题,美国加州大学尔湾分校提供了一个页面,帮助Python用户获得Windows可直接安装的第三方库文件,链接地址:https://www.lfd.uci.edu/~gohlke/pythonlibs/

10.1.4 pip工具使用

列出常用的子命令,语法格式如下:

pip -h

卸载已安装的第三方库,语法格式如下:

pip uninstall <拟卸载库名>

列出已经安装的第三方库,语法格式如下:

pip list

查看已经安装库的详细信息,语法格式如下:

pip show <拟查询库名>

下载第三方库的安装包,语法格式如下:

pip download <拟下载库名>

联网搜索库名或摘要中关键字,语法格式如下:

pip search <拟查询关键字>
10.2 PyInstaller库概述

PyInstaller是一个十分有用的Python第三方库,它能够在Windows、Linux、Mac OS X等操作系统下将Python源文件打包,变成可直接运行的可执行文件。

通过对源文件打包,Python程序可以在没有安装Python的环境中运行,也可以作为一个独立文件方便传递和管理。

PyInstaller需要在命令行下用pip工具安装,安装命令如下:

pip install PyInstaller
10.3 PyInstaller库与程序打包

使用PyInstaller库对Python源文件打包十分简单,语法格式如下:

PyInstaller <Python源程序文件名>

执行完毕后,源文件所在目录将生成dist和build两个文件夹。其中build目录是PyInstaller存储临时文件的目录,可以安全删除。最终的打包程序在dist内部与源文件同名的目录中。目录中其他文件是可执行文件的动态链接库

可以通过-F参数对Python源文件生成一个独立的可执行文件,语法格式如下:

PyInstaller -F <Python源程序文件名>

执行后在dist目录中出现了文件,没有任何依赖库,执行它即可显示相应效果。

PyInstaller常用参数:

参数 功能
-h,–help 查看帮助
–clean 清理打包过程中的临时文件
-D,–onedir 默认值,生成dist目录
-F,–onefile 在dist文件夹中只生成独立的打包文件
-i<图标文件名.ico> 指定打包程序使用的图标(icon)文件
10.4 jieba库概述

由于中文文本中的单词不是通过空格或者标点符号分割,中文及类似语言存在一个重要的“分词”问题。

jieba(“结巴”)是Python汇总给一个重要的第三方中文分词函数库,能够将一段中文文本分割成中文词语的序列。

jieba库需要通过pip指令安装,安装命令如下:

pip install jieba

jieba库的分词原理是利用一个中文词库,将待分词的内容与分词词库进行比对,通过图结构和动态规划方法找到最大概率的词组。除了分词,jieba还提供增加自定义中文单词的功能。

jieba库支持三种分词模式:

  1. 精确模式,将句子最精确的切开,适合文本分析。
  2. 全模式:把句子中所有可以成词的词语都扫描出来,速度非常快,但是不能解决歧义。
  3. 搜索引擎模式:在精确模式基础上,对长词再次切分,提高召回率,适合用于搜索引擎分词。
10.5 jieba库与中文分词

jieba库常用的分词函数如下:

函数 描述
jieba.lcut(s) 精确模式,返回一个列表
jieba.lcut(s,cut_all=Ture) 全模式,返回一个列表类型
jieba.lcut_for_search(s) 搜索引擎模式,返回一个列表类型
jieba.add_word(w) 向分词词典中增加新词w

搜索引擎模式更倾向于寻找短词语,这种方式具有一定冗余度,但冗余度相比全模式较少。

如果希望对文本准确分成,不产生冗余,只能选择jieba.lcut(s)函数,即精确模式。如果希望对文本分词更准确,不漏掉任何可能的分词结果,请选用全模式。如果没想好怎么用,可以使用搜索引擎模式。

10.6 wordcloud库概述

词云以词语为基本单元,根据其文本中体现的频率设计不同大小以形式视觉上不同效果,形成“关键词云层”或“关键词渲染”,从而使读者只要“一瞥”即可领略文本的主旨。

wordcloud库是专门用于根据文本生成词云的Python第三方库,十分常用且有趣。安装命令如下:

pip install wordcloud

wordcloud库的使用非常简单,以一个字符串为例。其中产生词云只需要一行语句,在第三行,并可以将词云保存为图片。

from wordcloud import WordCloud

txt = "I like python. I'm learning python!"
wordcloud = WordCloud().generate(txt)
wordcloud.to_file("testcloud.png")
<
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

liebe1*1

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值