
数据可视化
文章平均质量分 59
数据可视化
我的Python教程
零基础Python系列教程,喜欢的老铁可以多多点赞!
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
python教程:mdates.date2num示例用法
mdates.date2num() 将 Python 的 datetime 对象转换为 Matplotlib 内部使用的数值格式(浮点数),表示从 0001-01-01 开始的天数(包含时间的小数部分)。整数部分:表示天数(例如 738771 对应 2023-10-01)。小数部分:表示时间(例如 0.5 对应中午 12:00)。原创 2025-04-29 10:22:10 · 395 阅读 · 0 评论 -
Wordcloud+PyQt5写个词云图生成器1.0
WordCloud去掉停用词(fit_words+generate)的2种用法。使用WordCloud模块中repeat参数,做一个关键字重复的词云图。-------------词云图集合-----------------------★★历史博文集合★★----------用Wordcloud+PyQt5写个词云图生成器1.0。通过词频来绘制词云图(jieba+WordCloud)使用wordcloud模块,绘制一个自定义的词云图形状。盘点WordCloud模块,词云图的相关知识点。原创 2024-11-27 12:05:34 · 1037 阅读 · 0 评论 -
jieba.analyse.extract_tags提取权重关键词+显示词云图
allowPOS:仅返回符合此正则表达式的词性(词性标签),默认为空字符串,即不过滤词性。如果设置为 True,则返回的列表将包含元组,每个元组包含关键词和对应的权重。使用WordCloud模块中repeat参数,做一个关键字重复的词云图。-------------词云图集合-----------------------★★历史博文集合★★----------topK:需要返回关键词的个数,默认为 20 个。盘点WordCloud模块,词云图的相关知识点。关于词云图显示异常,出现乱码的解决办法。原创 2024-11-27 11:57:58 · 657 阅读 · 0 评论 -
WordCloud参数的用法:
colormap:字符串或matplotlib colormap类型,默认值为"viridis"。如果设置为1,则一个单词出现两次时,其字体大小为原来的两倍。max_font_size:整数类型或None,默认值为None。font_path:字符串类型,指定字体文件的路径。font_step:整数类型,默认值为1。color_func:可调用对象,默认值为None。background_color:颜色值类型,默认值为"black"。min_font_size:整数类型,默认值为4。原创 2024-11-26 10:06:52 · 1201 阅读 · 0 评论 -
WordCloud去掉停用词(fit_words+generate)的2种用法
2.通过w.fit_words(参数为字典类型)+Counter(参数可以是字符串,也可以是可迭代的对象,返回字典类型)+jieba(参数是字符串,返回是generator类型)。个人觉得使用w.fit_words比W.generate生成词云图,要更直观一点,因为它可以根据词频的大小,在词云图上反应出字体的大小。可以看到原文本(杨过是欧阳锋的义子,他的黯然销魂掌,可以和郭靖的降龙十八掌媲美),文本里面的 是,和,的,它等需要都被去掉了。-------------词云图集合-------------原创 2024-11-26 10:02:32 · 1420 阅读 · 0 评论 -
Wordcloud也能生成一个,带html的词云图文件吗??
1.简单的说一下实现思路:运行下面代码后,会生成一个名为wordcloud.html的文件,供后端使用。这个示例代码通过Python生成词云图,并将图像转换为base64编码嵌入到HTML文件中,从而实现将词云图直接展示在网页上的效果。使用WordCloud模块中repeat参数,做一个关键字重复的词云图。-------------词云图集合-----------------------★★历史博文集合★★----------使用wordcloud模块,绘制一个自定义的词云图形状。原创 2024-11-25 10:59:15 · 655 阅读 · 0 评论 -
Python教程:(Sweetviz)仅三行代码就能实现数据可视化
Sweetviz 能够自动分析数据集的特征和属性,并生成详细的 EDA 报告。用户无需手动编写复杂的代码,只需简单调用 Sweetviz 函数即可生成完整的报告。Sweetviz 生成的报告是交互式的,用户可以通过简单的点击和拖拽来进行探索和导航。Sweetviz是一个用于生成数据集探索性数据分析(EDA)报告的Python库。Sweetviz 提供了多种可视化图表,包括直方图、箱线图、核密度图、散点图等,以帮助用户更直观地理解数据分布和特征之间的关系。确保你已经安装了Sweetviz库。原创 2024-03-31 13:23:45 · 432 阅读 · 0 评论 -
Pillow教程03:图像处理的基本步骤+分离split+合并merge+混合blend+composite遮罩
4.Image.blend():用于将两个图像混合在一起,根据指定的alpha值来决定每个图像在混合结果中的贡献程度。alpha值范围从0(完全第一个图像)到1(完全第二个图像),当取值=0.5时,为两个图像的中合,因此该值的大小决定了两个图像的混合程度。mask是一个遮罩图像,它决定了 image2 在合成图像中的哪些部分应该是可见的,哪些部分应该是透明的。图像混合与透明度调整:使用Image.blend()方法混合两张图像,通过调整alpha值来控制图像的混合程度。加载图像到内存中,准备进行后续处理。原创 2024-03-25 12:21:06 · 2067 阅读 · 0 评论 -
Python教程95:jieba去掉停用词+词频统计+tokenize分词位置的示例用法
4.jieba.tokenize示例用法:返回一个生成器,每次迭代返回一个包含三个元素的元组(word, start, end),其中 word 是分词结果中的一个词,start 和 end 分别是该词在原始句子中的起始和结束位置(基于字符索引)。通用量词:如“一些”、“很多”、“这个”、“那个”等。代词:如“我”、“你”、“他”、“她”、“它”等。连词:如“和”、“与”、“但是”、“而且”等。介词:如“在”、“到”、“从”、“对于”等。助词:如“的”、“了”、“着”、“过”等。原创 2024-03-22 12:59:16 · 3268 阅读 · 0 评论 -
Matplotlib如何显示多张图片(管理多个子图)
两个示例中,subplot 和 subplots 方法都用于创建包含两个子图的图形。subplot 方法通过指定行数、列数和面板编号来添加子图,而 subplots 方法则返回一个包含 Figure 和 Axes 对象的元组,使得操作更加直观和灵活。Matplotlib 可以使用 subplot 或 subplots 方法来创建子图,从而在同一窗口中显示多张图片。subplots 方法返回一个包含 Figure 对象和一组 Axes 对象的元组,可以更方便地操作和管理多个子图。2.使用 subplots。原创 2024-03-19 12:00:48 · 4914 阅读 · 0 评论 -
WordCloud模块中to_image的用法
上述示例中,首先创建了一个WordCloud对象,并使用generate方法生成词云。然后,通过调用to_image方法将词云转换为PIL.Image对象,并使用show方法显示图像。在WordCloud模块中,to_image方法用于将词云转换为PIL.Image对象。执行该方法后,词云将转换为PIL.Image对象,并返回给调用者。原创 2023-09-03 20:40:54 · 220 阅读 · 0 评论 -
WordCloud模块中process_text的用法
此外,process_text函数返回的结果是一个字典,其中包含了分词后的token以及对应出现的次数。如果不需要统计词频,可以只使用分词结果。需要注意的是,process_text函数并不会对文本进行编码解码、去重等操作,如果需要执行这些操作,需要额外编写代码实现。经过process_text处理后,文本被分成了多个token,并统计了每个token出现的次数。函数主要用于对文本进行预处理,包括分词、去除停用词、去除标点符号等操作。经过process_text处理后的文本可以用于生成词云。原创 2023-09-03 20:45:32 · 392 阅读 · 0 评论 -
WordCloud模块中如何筛选出重要的关键词
接下来,我们通过sorted()函数和lambda函数对所有单词按照权重值进行排序,并选择前N个关键词作为重要关键词。基于TextRank算法的关键词筛选:TextRank算法是一种基于图的关键词抽取算法,它通过构建文本的上下文关系图,并计算每个单词的PageRank值来评估其重要性。词频统计:统计每个单词在文本中出现的次数,出现次数越多的单词可能越重要。基于TF-IDF的关键词筛选:使用TF-IDF算法计算每个单词的权重,然后根据权重值对单词进行排序,选择权重值较高的单词作为重要关键词。原创 2023-09-03 20:36:15 · 170 阅读 · 0 评论 -
Python源码05:使用Pyecharts画词云图图
*Pyecharts是一个用于生成 Echarts 图表的 Python 库。Echarts 是一个基于 JavaScript 的数据可视化库,提供了丰富的图表类型和交互功能。**通过 Pyecharts,你可以使用 Python 代码生成各种类型的 Echarts 图表,例如折线图、柱状图、饼图、散点图等。Pyecharts 提供了许多方便的 API 和方法,可以让你轻松地创建和定制自己的图表。Scatter():用于创建散点图。Line():用于创建折线图。Pie():用于创建饼图。原创 2023-08-15 18:50:43 · 2142 阅读 · 0 评论 -
我的Python教程:使用Pyecharts画关系节点图
【代码】我的Python教程:使用Pyecharts画关系节点图。原创 2023-08-08 13:31:33 · 847 阅读 · 0 评论 -
Pandas教程09:DataFrame数据可视化绘制折线图、柱状图、散点图、直方图等
pandas.plot() 是 pandas 库中的一个非常方便的函数,用于绘制各种图形,例如线图、柱状图、散点图等。----------★★历史博文集合★★----------原创 2023-12-07 13:49:32 · 6131 阅读 · 0 评论