l_future_ 2023-01-10 00:01 采纳率: 50%
浏览 47
已结题

textrank算法的共现图是如何生成的

有原文本数据:
程序员(英文Programmer)是从事程序开发、维护的专业人员。一般将程序员分为程序设计人员和程序编码人员,但两者的界限并不非常清楚,特别是在中国。软件从业人员分为初级程序员、高级程序员、系统分析员和项目经理四大类。

数据处理后的结果为:
[程序员, 英文, 程序, 开发, 维护, 专业, 人员, 程序员, 分为, 程序, 设计, 人员, 程序, 编码, 人员, 界限, 特别, 中国, 软件, 人员, 分为, 程序员, 高级, 程序员, 系统, 分析员, 项目, 经理]

使用textrank抽取关键词,滑动窗口设定为5,共现词语为:

img

之后构建图模型如图所示,想请问大家这个图是如何构建出来的,是使用Python输入生成图的函数吗,具体是怎么实现的。

img

  • 写回答

1条回答 默认 最新

  • 快撑死的鱼 2023-01-16 15:18
    关注

    回答不易,求求您采纳哦

    TextRank算法使用共现图来提取文本中的关键字和摘要。共现图是由文本中的单词和短语构成的图形结构。在构建共现图时,首先将文本分割成单独的单词和短语。然后,为每个单词和短语创建一个节点。接下来,在文本中查找共现关系,即两个单词或短语在文本中出现在一起的关系。如果两个单词或短语共现,则在它们之间连接一条边。最后,使用图形算法(如PageRank)来评估每个节点的重要性,并从中选择关键字和摘要。

    评论

报告相同问题?

问题事件

  • 已结题 (查看结题原因) 1月17日
  • 创建了问题 1月10日