- 博客(191)
- 收藏
- 关注
翻译 ggplot2杂记
ggplot2杂记 本文是我在阅读<<ggplot2 Elegant Graphics for Data Analysis (use R)>>时,所做的笔记,所谓好记性不如烂笔头,还是记下来用起来就方便了。1. ggplot2概览 ggplot2作为画图工具的利器,实现了数据到统计图的转换,如下图所示。 Markdown和扩展Markdown简洁的语法代码块高亮图片链接和图片上传La
2016-11-02 21:23:23
1378
转载 python中编码问题
原文链接:http://www.iteye.com/topic/560229一、 预备知识1, 常用字符集分类ASCII及其扩展字符集作用:表语英语及西欧语言。位数:ASCII是用7位表示的,能表示128个字符;其扩展使用8位表示,表示256个字符。范围:ASCII从00到7F,扩展从00到FF。ISO-8859-1字符集作用:
2015-05-09 23:41:49
2794
原创 数据集网址
1. http://projects.iq.harvard.edu/cces/home2. Opinion evolution model of social network based on information entropy
2015-02-03 17:05:07
4933
原创 数据挖掘之部分监督学习
本文的笔记来源于> Bing Liu著监督式学习:算法通过利用每个类别中的已标注数据来生成一个分类函数,需大量已标注数据来保证学习的准确性。【需大量标注,费时费力】部分监督学习(Partially Supervised Learning):(1)已标注和无标注数据中进行学习(Learning from Labeled and Unlabeled Examples) 【LU学习
2015-01-21 15:57:27
5930
原创 awk
本来参考资源:>1. awk命令行短程序通常是直接在命令行上提供,而比较长的程序,则委托-f选项指定。--是特殊选项,指出awk本身已没有更进一步的命令行选项。任何接下来的选项都可被程序使用。-F选项是用来重新定义默认字段分隔字符,且一般惯例将它作为第一个命令行选项。fs参数是一个正则表达式,或是被提供作为下一个参数,字段分隔字符也可设置使用内建变量FS所指定的
2015-01-20 18:14:15
930
原创 数据挖掘之无监督学习篇
本文主要是在看> Bing Liu著 的这本书的笔记1. 基本概念监督学习(Supervised Learning):通过发现数据attributes和类别attributes之间的关联模式,并通过利用这些模式来预测未知数据实例的类别属性。聚类(Clustering):是一种发现数据内在结构的一种技术,处于相同聚类中的数据实例彼此相似,处于不同聚类中的实例则彼此不同。【是一个将数据集
2015-01-20 12:01:12
3945
1
原创 学习资源
1. stanford大学开课(1)主页http://openclassroom.stanford.edu/MainFolder/HomePage.php(2)线性回归http://openclassroom.stanford.edu/MainFolder/DocumentPage.php?course=DeepLearning&doc=exercises/ex2/ex2.ht
2015-01-15 12:34:06
794
原创 python中的pandas包
本文主要参照:http://pandas.pydata.org/pandas-docs/stable/1.
2015-01-12 18:11:11
4840
转载 shell中的特殊符号
原文链接:http://blog.itpub.net/10522540/viewspace-212846/在shell中常用的特殊符号罗列如下:# ; ;; . , / \ 'string'| ! $ ${} $? $$ $* "strin
2015-01-12 11:33:24
690
转载 准确率与召回率
原文链接:http://blog.csdn.net/wangzhiqing3/article/details/9058523在信息检索、分类体系中,有一系列的指标,搞清楚这些指标对于评价检索和分类性能非常重要,因此最近根据网友的博客做了一个汇总。准确率、召回率、F1信息检索、分类、识别、翻译等领域两个最基本指标是召回率(Recall Rate)和准确率(
2015-01-08 09:51:06
1093
原创 Shell脚本实训
1. 向多个user问好,并输出其IPuser信息存储在userInfo.txt中,内容为:fengtian pts/1 2015-01-06 08:47 (192.168.5.179)root pts/0 2015-01-01 14:06 (192.168.5.40)zhangqiang pts/2 2015-01-06 08:4
2015-01-06 15:58:53
1670
转载 shell中各种括号的作用()、(())、[]、[[]]、{}
原文来源:http://blog.csdn.net/taiyang1987912/article/details/395513851. 小括号,圆括号()(1)单小括号 ()①命令组。括号中的命令将会新开一个子shell顺序执行,所以括号中的变量不能够被脚本余下的部分使用。括号中多个命令之间用分号隔开,最后一个命令可以没有分号,各命令和括号之间不必有空格。②命令
2015-01-06 11:40:22
701
原创 Python中的numpy包
本文主要来源参考:http://wiki.scipy.org/Tentative_NumPy_Tutorial1. BasicsNumpy包中array【是ndarray class的】要求有相同的类型,维数被称作axes,axes的number是rank(秩),它与 Standard Python Library中的class array不同【仅能处理一维array】,可处理多维
2015-01-05 16:20:19
9019
转载 交叉验证(Cross Validation)方法思想简介
原文链接:http://blog.csdn.net/chl033/article/details/4671750交叉验证(CrossValidation)方法思想以下简称交叉验证(Cross Validation)为CV.CV是用来验证分类器的性能一种统计分析方法,基本思想是把在某种意义下将原始数据(dataset)进行分组,一部分做为训练集(train set),
2015-01-05 09:40:20
1227
转载 Google网址大全
本文来源:http://www.admin10000.com/document/4615.html镜象:https://s3.amazonaws.com/google./index.htmlhttps://s3-ap-southeast-2.amazonaws.com/google6/index.htmlhttps://s3-us-west-1.amazon
2015-01-04 11:12:59
4518
原创 Linux、Shell实用用的网址
1. Shell for Beginner's guidehttp://www.freeos.com/guides/lsst/
2015-01-02 15:46:53
1067
转载 python常用50个模块
本文来源:http://blog.csdn.net/pfanaya/article/details/7567077Graphical interface wxPython http://wxpython.org Graphical interface pyGtk http://www.pygtk.org Graphical interface pyQT
2015-01-01 23:25:08
808
原创 R与统计分析
本文主要来自>一书1. 基础知识(1)factor重命名################################################################## 将因素型转换重新命名#################################################################factorTest <- facto
2014-12-04 14:53:04
2485
转载 python与自然语言处理
大牛网址:http://www.52nlp.cn/python-%E7%BD%91%E9%A1%B5%E7%88%AC%E8%99%AB-%E6%96%87%E6%9C%AC%E5%A4%84%E7%90%86-%E7%A7%91%E5%AD%A6%E8%AE%A1%E7%AE%97-%E6%9C%BA%E5%99%A8%E5%AD%A6%E4%B9%A0-%E6%95%B0%E6%8D%AE
2014-11-30 13:15:09
1723
转载 Python
本文来源:https://docs.python.org/3/reference/lexical_analysis.htmlhttp://www.cnblogs.com/frydsh/archive/2012/07/15/2592512.html1. Python Language Reference(1)Python的词法分析与语法分析词法分析(Lexical A
2014-11-27 18:10:18
769
转载 单位根检验
本文来源:http://www.docin.com/p-241451370.html
2014-11-20 09:38:02
4068
原创 有用的网址
1. 语言类JS: http://www.lellansin.com/jade-%E6%A8%A1%E6%9D%BF%E5%BC%95%E6%93%8E%E4%BD%BF%E7%94%A8.html
2014-11-07 10:07:39
978
原创 数据挖掘之关联规则
http://fimi.ua.ac.be/fimi03/http://fimi.ua.ac.be/fimi04/
2014-11-06 14:58:27
4847
转载 查看R函数源代码
原文链接:http://wangjinshe33.blog.163.com/blog/static/17558281201371301051757/
2014-10-30 14:52:28
1765
转载 关于在R中使用C程序的一些问题
原文链接:http://www.math.pku.edu.cn/teachers/lidf/docs/statsoft/html/s/dll.html
2014-10-30 11:21:09
3328
原创 Writing R Extensions
1. Creating R packagespackage: a directory of files
2014-10-29 18:17:33
1365
转载 Texting Mining with R
原文链接: http://www.bjt.name/upload/pdf/Text%20Mining%20in%20R.pdf
2014-10-10 12:27:58
1891
原创 R相关的网站
R基础学习:http://jiaoyan.org/r/http://flowingdata.com/牛人们的博客:http://helloxxxxxx.blog.163.com/blog/#m=0&t=1&c=fks_084070092080086071085094094095086087087067085083086074081http://r-ke.in
2014-10-10 09:29:40
6217
转载 数据挖掘之聚类篇
一聚类,顾名思义就是把一组对象划分成若干类,并且每个类里面对象之间的相似度较高,不同类里面对象之间相似度较低或差异明显。与分类不同的是聚类不依靠给定的类别对对象进行划分。
2014-09-10 13:16:05
1712
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人