
NLP
codestorm04
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
word2vec 中的数学原理详解_codestorm_新浪博客
word2vec 是 Google 于 2013 年开源推出的一个用于获取 word vector 的工具包,它简单、高效,因此引起了很多人的关注。由于 word2vec 的作者 Tomas Mikolov 在两篇相关的论文 [3,4] 中并没有谈及太多算法细节,因而在一定程度上增加了这个工具包的神秘感。相关链接(一)目录和前言(二)预备知识(三)背景知识(四)基于...转载 2018-01-04 13:50:51 · 114 阅读 · 0 评论 -
NDCG、MAP、MRR_codestorm_新浪博客
转自:http://www.cnblogs.com/eyeszjwang/articles/2368087.htmlLearning to Rank for IR的评价指标—MAP,NDCG,MRRMAP(Mean Average Precision):单个主题的平均准确率是每篇相关文档检索出后的准确率的平均值。主集合的平均准确率(MAP)是每个主题的平均准确率的平均值。MAP 是反...转载 2014-05-06 10:29:38 · 158 阅读 · 0 评论 -
TF-IDF与余弦相似性的应用(一):自动提取关键词_codestorm_新浪博客
转自:http://www.ruanyifeng.com/blog/2013/03/tf-idf.html这个标题看上去好像很复杂,其实我要谈的是一个很简单的问题。有一篇很长的文章,我要用计算机提取它的关键词(Automatic Keyphrase extraction),完全不加以人工干预,请问怎样才能正确做到?这个问题涉及到数据挖掘、文本处理、信息检索等很多计算机前沿领域...转载 2014-04-23 20:41:17 · 111 阅读 · 0 评论 -
RNN+Attention+Transformer+Bert
学习资料整理,关于Bert的学习路径需大致按照如下进行理解:1. Vanilla RNN(即最基础的RNN结构) 递归神经网络 训练、推到、实现(网络资料整理) The Unreasonable Effectiveness of Recurrent Neural Networks2. Attention(nlp和图像领域关键模块)注意力机制 ...原创 2019-08-30 15:29:04 · 888 阅读 · 0 评论