l_future_ 2023-01-10 00:01 采纳率: 50%

浏览 47

已结题

textrank算法的共现图是如何生成的

有原文本数据：
程序员(英文Programmer)是从事程序开发、维护的专业人员。一般将程序员分为程序设计人员和程序编码人员，但两者的界限并不非常清楚，特别是在中国。软件从业人员分为初级程序员、高级程序员、系统分析员和项目经理四大类。

数据处理后的结果为：
[程序员, 英文, 程序, 开发, 维护, 专业, 人员, 程序员, 分为, 程序, 设计, 人员, 程序, 编码, 人员, 界限, 特别, 中国, 软件, 人员, 分为, 程序员, 高级, 程序员, 系统, 分析员, 项目, 经理]

使用textrank抽取关键词，滑动窗口设定为5，共现词语为：

之后构建图模型如图所示，想请问大家这个图是如何构建出来的，是使用Python输入生成图的函数吗，具体是怎么实现的。

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
快撑死的鱼 2023-01-16 15:18
关注
回答不易，求求您采纳哦

TextRank算法使用共现图来提取文本中的关键字和摘要。共现图是由文本中的单词和短语构成的图形结构。在构建共现图时，首先将文本分割成单独的单词和短语。然后，为每个单词和短语创建一个节点。接下来，在文本中查找共现关系，即两个单词或短语在文本中出现在一起的关系。如果两个单词或短语共现，则在它们之间连接一条边。最后，使用图形算法（如PageRank）来评估每个节点的重要性，并从中选择关键字和摘要。

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已结题（查看结题原因） 1月17日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 1月10日