支持向量机(4)支持向量回归 & 多分类
SVM 是一个非常优雅的算法,具有完善的数学理论,虽然如今工业界用到的不多,但还是决定花点时间去写篇文章整理一下。
本质:SVM 想要的就是找到各类样本点到超平面的距离最远,也就是找到最大间隔超平面。为了对数据中的噪声有一定的容忍能力。以几何的角度,在丰富的数据理论的基础上,简化了通常的分类和回归问题。
几何意义:找到一个超平面将特征空间的正负样本分开,最大分隔(对噪音有一定的容忍能力);
间隔表示:划分超平面到属于不同标记的最近样本的距离之和;
一、支持向量回归 SVR
https://blog.csdn.net/ch18328071580/article/details/94168411
支持向量在隔代之外
1.1 SVR与一般线性回归的区别
SVR | 线性回归 |
---|---|
数据在间隔带内则不计算损失,当且仅当f(x)与y之间的差距的绝对值大于ϵ才计算损失 | 只要f(x)与y不相等时,就计算损失 |
通过最大化间隔带的宽度与最小化总损失来优化模型 | 通过梯度下降之后求均值来优化模型 |
岭回归:
支持向量回归:我们假设f(x)与y之间最多有一定的偏差,大于偏差才计数损失
再令
二、多分类 SVM
2.1 多分类问题
- 多分类问题拆解成若干个二分类问题,对于每个二分类训练一个分类器。
- one vs one 拆解:K(K-1)/2 个分类器。
- one vs Rest 拆解:K个分类器
2.2 多分类线性SVM
层次支持向量机
回顾二分类
- 多分类线性SVM