
Machine Learning
XifengHZ
ZJU CS MASTER
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
Mahout分类算法效果评估指标
mahout中有许多分类器,包括Naive Bayes, Complementary Naive Bayes, Stochastic Gradient Descent, Support Vector Machine, Random Forest等。评估一个分类器(模型)的好坏,需要有一些指标,而在mahout中提供了下列衡量指标: 1. %-correct (ConfusionMatr转载 2013-10-09 16:00:46 · 901 阅读 · 0 评论 -
各种SQL在PIG中实现
我这里以Mysql 5.1.x为例,Pig的版本是0.8 同时我将数据放在了两个文件,存放在/tmp/data_file_1和/tmp/data_file_2中.文件内容如下: tmp_file_1: Txt代码 zhangsan 23 1 lisi 24 1 wangmazi 30 1 meinv 18 0 dam原创 2013-10-27 11:56:13 · 690 阅读 · 0 评论 -
Hadoop手动启动过程
注:不失一般性,我们这里以dfs的启动为例子,mapred的启动道理是一样的。 Dfs的启动脚本实际上是$HADOOP_HOME/bin/start-dfs.sh,start-all.sh也正是通过调用这个脚本来达到启动整个 HDFS的目的。start-dfs.sh会按顺序启动namenode, datanode(s)和secondnamenode,我在这里将一一说明: 1. 启动Name转载 2013-10-27 13:01:25 · 1243 阅读 · 0 评论