http://baike.baidu.com/link?url=rkocJKJhSEL0UO-iCqg8n76fhNKotOlC4zj3yGbPgahDRZa2AqNv_7FxUOlk0Cb8Y9wlkJAnVRzq3AsDNZfKUK
皮尔逊相关系数(Pearson correlation coefficient)

http://baike.baidu.com/link?url=Kh6DLe6DJa2xDGrEJ9rllzU_ou6F6uNyOzG8Eg12zFu_eYrbyu7-GuJMPspeNNhdZoBO-YT88rJ0M7GNRWiX8a
斯皮尔曼等级相关(Spearman’s correlation coefficient for ranked data)
斯皮尔曼等级相关(Spearman’s correlation coefficient for ranked data)主要用于解决称名数据和顺序数据相关的问题。适用于两列变量,而且具有等级变量性质具有线性关系的资料。由英国心理学家、统计学家斯皮尔曼根据积差相关的概念推导而来,一些人把斯皮尔曼等级相关看做积差相关的特殊形式。
http://bbs.pinggu.org/thread-479730-1-1.html
1.连续数据,正态分布,线性关系,用pearson相关系数是最恰当,当然用spearman相关系数也可以,
就是效率没有pearson相关系数高。
2.上述任一条件不满足,就用spearman相关系数,不能用pearson相关系数。
3.两个定序测量数据之间也用spearman相关系数,不能用pearson相关系数。
用pearson处理的数据,必须满足一下条件:成对数据、连续、整体是正态分布的。
其实, Spearman 和Pearson相关系数在算法上完全相同. 只是PEARSON相关系数是用原来的数值计算积差相关系数, 而SPEARMAN是用原来数值的秩次计算积差相关系数.
http://blog.csdn.net/wsywl/article/details/5859751
由排行差分集合d计算而得(公式一):
由排行集合x、y计算而得(斯皮尔曼等级相关系数同时也被认为是经过排行的两个随即变量的皮尔逊相关系数,以下实际是计算x、y的皮尔逊相关系数)(公式二):
pointbiserialr:measure the relationship between a binary variable, x, and a continuous variable, y.
http://docs.scipy.org/doc/scipy/reference/generated/scipy.stats.pointbiserialr.html#scipy.stats.pointbiserialr
kendalltau:等级相关系数,适用于两个变量均为有序分类的情况
http://docs.scipy.org/doc/scipy/reference/generated/scipy.stats.kendalltau.html#scipy.stats.kendalltau