- 原因一
这个词不在你用来做训练word2vec模型的语料库中,可能是测试集中有训练集中没有的,可以尝试合并测试集和训练集来训练
- 原因二
定义模型时,min_count设置大了
min_count (int, optional) – 忽略词频小于此值的单词。
model = word2vec.Word2Vec(sentences, min_count=3)
- 原因三
参数sentences默认是按这种格式
注意是str类型,如果遇见int或者float等请记得转str
[['str1', 'str2'],
['str2', 'str4'],
...
]