编辑
2024-12-16
机器学习
0
请注意,本文编写于 124 天前,最后修改于 120 天前,其中某些信息可能已经过时。

目录

线性二分类
硬阈值线性分类器
感知机
基于Logistic函数的线性分类器

线性二分类

不同于回归问题,线性分类问题的标签是离散的二值

f(x)=±1f(x)=\pm1

希望用一条直线y=w1x+w0y=w_1x+w_0把数据分成两类,称其为决策边界

Sign(w1x+w0)=±1Sign(w_1x+w_0)=\pm1

可以将其推广到多变量的情形,可以如此定义一个超平面

wTx+b=0w^Tx+b=0

一个超平面可以通过一个截距bb和一个法向量ww确定,它也称为权重向量

如果数据集可以被线性分类器分离,则称其为线性可分的

硬阈值线性分类器

回到一维情形,假定有权重,w=(w0,w1)Tw=(w_0,w_1)^T,为了表示方便再定义x=(1,x)Tx=(1,x)^T,那么决策边界就是直线

wTx=0w^Tx=0

定义一个阈值函数

Threshhold(z)={1z00z<0Threshhold(z)= \begin{cases} 1&z\geq0\\ 0&z<0 \end{cases}

学习到的函数是

hw(x)=Threshhold(wTx)h_w(x)=Threshhold(w^Tx)

感知机

感知机是一种硬阈值线性分类器,它可以如图画出

由于使用了硬阈值函数,在权重空间中几乎所有点梯度都为零,因而常规的梯度下降方法失效,需要使用权重更新算法求解

Note

wi=wi+α(yhw(x))xiw_i=w_i+\alpha(y-h_w(x))x_i

每一次更新随机选择一个样例进行学习

基于Logistic函数的线性分类器

硬阈值线性分类器始终做出确定性的判断,不能处理边界上的样本,因而无法应对噪声数据。这可以通过引入软阈值解决

Logistic(z)=11+ezLogistic(z)=\dfrac{1}{1+e^{-z}}

image.png

用Logistic函数代替阈值函数得到

hw(x)=Logistic(wTx)h_w(x)=Logistic(w^Tx)

本文作者:GBwater

本文链接:

版权声明:本博客所有文章除特别声明外,均采用 BY-NC-SA 许可协议。转载请注明出处!