n_gram算法词共现矩阵 python实现

甜辣uu

于 2022-07-02 18:36:00 发布

阅读量602

点赞数

CC 4.0 BY-SA版权

分类专栏： python从入门到精通自然语言处理-nlp-NLP 文章标签：算法矩阵 python

本文链接：https://blog.csdn.net/qq_38735017/article/details/125576333

python从入门到精通同时被 2 个专栏收录

166 篇文章 ¥29.90 ¥99.00

订阅专栏

超级会员免费看

自然语言处理-nlp-NLP

89 篇文章 ¥59.90 ¥99.00

订阅专栏

超级会员免费看

本文介绍了如何使用Python实现n_gram算法，通过该算法生成词共现矩阵，以进行文本分析。文中展示了具体的代码实现，帮助读者理解这一过程。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

看下结果：

代码

import pandas as pd
def gx_matrix(vol_li):
    # 整合一下，输入是df列，输出直接是矩阵
    names = locals()
    all_col0 = []   # 用来后续求所有字段的集合
    for row in vol_li:
        all_col0 += row
        for each in row:  # 对每行的元素进行处理，存在该字段字典的话，再进行后续判断，否则创造该字段字典
            try:
                 for each1 in row:  # 对已存在字典，循环该行每个元素，存在则在已有次数上加一，第一次出现创建键值对“字段：1”
                    try:
                           names['dic_' + each][each1] = names['dic_' + each][each1] + 1  # 尝试，一起出现过的话，直接加1