
Mahout
XifengHZ
ZJU CS MASTER
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
基于Naive Bayes文本分类算法
琢磨了两天,对于朴素贝叶斯的原理弄得很清楚,可是要做文本分类,看了好多文章知道基于朴素贝叶斯公式,比较出后验概率的最大值来进行分类,后验概率的计算是由先验概率与类条件概率的乘积得出,先验概率和类条件概率要通过训练数据集得出,即为朴素贝叶斯分类模型,将其保存为中间结果,测试文档进行分类时调用这个中间结果得出后验概率。大的思路理解的很清楚,可是中间的细节可以说很重要的部分没弄明白,中间得出的模型怎样和转载 2013-10-08 21:31:40 · 843 阅读 · 0 评论 -
Mahout0.8中Bayes分类器的原理与使用
1、Mahout0.8中Bayes Classifier的使用方法 在Mahout in action一书中,有通过bin/mahout ...命令行对20newsgroups进行Bayes分类的详细阐述,不过书上使用的版本是0.5的,该版本有很多bug,产生莫名其妙的错误。其中主要牵涉到三个命令,prepare20newsgroups,trainclassifier,testclas原创 2013-10-08 21:59:36 · 1593 阅读 · 0 评论 -
Mahout分类算法效果评估指标
mahout中有许多分类器,包括Naive Bayes, Complementary Naive Bayes, Stochastic Gradient Descent, Support Vector Machine, Random Forest等。评估一个分类器(模型)的好坏,需要有一些指标,而在mahout中提供了下列衡量指标:1. %-correct (ConfusionMatr转载 2013-10-09 16:00:46 · 903 阅读 · 0 评论 -
m2eclipse插件地址,mark一下
刚刚下了个eclipse,想装个mvn插件,发现好几个提供的下载地址都失效了,在官网折腾了半天,终于是找到了,记录下。 http://nexus.tesla.io:8081/nexus/content/sites/m2e.extras/这个地址列表,找到了我的安装版本http://nexus.tesla.io:8081/nexus/content/sites/m2e.extras/m2e-1.原创 2013-11-26 21:05:17 · 967 阅读 · 0 评论 -
如何编译Mahout源代码并导入到eclipse中
前提: 1.系统正确安装了maven。 2. eclipse版本采用kepler,该版本自带了maven插件。原因: 为什么要编译源码呢?其实直接用二进制包更省事,只是为了方便读取源码和修改源码。maven操作的一些介绍: 1.下载最新源码。 通过mahout的SVN库来下载Mahout的最新版本,Mahout将被下载到当前目录:svn co原创 2014-01-17 12:34:22 · 2389 阅读 · 0 评论