1.分类问题(Regression)
在分类问题中,你要预测的变量 𝑦 是离散的值,我们将学习一种叫做逻辑回归 (Logistic Regression) 的算法,这是目前最流行使用最广泛的一种学习算法。顺便说一下,逻辑回归算法是分类算法,我们将它作为分类算法使用。有时候可能因为
这个算法的名字中出现了“回归”使你感到困惑,但逻辑回归算法实际上是一种分类算法,它适用于标签 𝑦 取值离散的情况,如:1 0 0 1。
为什么不用线性回归来解决分类问题 ?
简单来说,因为分类问题的y取值为固定的几个类别,譬如肿瘤分类为0 表示良性、1表示恶性,如果同样用线性回归y = k * x + b来表示,x为肿瘤尺寸,则得出的y范围可能远 > 1,但结果总会落到0和1上,会显得很奇怪。
2.逻辑回归(Logistic Regression)
前面说了,逻辑回归是适用于分类问题的常见算法,这个算法的性质是:它的输出值永远在 0 到 1 之间。
3.假设函数表达式Hypothesis Representation
回到之前的乳腺癌分类上,我希望输出的预测值是介于0~1之间,此时用逻辑回归算法怎么实现呢?
其实,逻辑回归中,可以用Sigmoid函数,来实现在R区间的输入,得到0~1之间的输出Sigmoid函数:
函数图像如下: