请注意,本文编写于 124 天前,最后修改于 120 天前,其中某些信息可能已经过时。
目录
线性二分类
硬阈值线性分类器
感知机
基于Logistic函数的线性分类器
线性二分类
不同于回归问题,线性分类问题的标签是离散的二值
希望用一条直线y=w1x+w0把数据分成两类,称其为决策边界
Sign(w1x+w0)=±1
可以将其推广到多变量的情形,可以如此定义一个超平面
一个超平面可以通过一个截距b和一个法向量w确定,它也称为权重向量
如果数据集可以被线性分类器分离,则称其为线性可分的
硬阈值线性分类器
回到一维情形,假定有权重,w=(w0,w1)T,为了表示方便再定义x=(1,x)T,那么决策边界就是直线
定义一个阈值函数
Threshhold(z)={10z≥0z<0
学习到的函数是
hw(x)=Threshhold(wTx)
感知机
感知机是一种硬阈值线性分类器,它可以如图画出
由于使用了硬阈值函数,在权重空间中几乎所有点梯度都为零,因而常规的梯度下降方法失效,需要使用权重更新算法求解
Note
wi=wi+α(y−hw(x))xi
每一次更新随机选择一个样例进行学习
基于Logistic函数的线性分类器
硬阈值线性分类器始终做出确定性的判断,不能处理边界上的样本,因而无法应对噪声数据。这可以通过引入软阈值解决
Logistic(z)=1+e−z1

用Logistic函数代替阈值函数得到
hw(x)=Logistic(wTx) 本文作者:GBwater
本文链接:
版权声明:本博客所有文章除特别声明外,均采用 BY-NC-SA
许可协议。转载请注明出处!