ch7 支持向量机¶

1. 背景¶

支持向量机用于解决分类问题。

分类方法：

最大间隔分类器：

对偶问题：

线性不可分问题：

可以定义一个损失函数，对于每一个样例求出损失函数表示是否有损失
常用损失函数：0/1 Loss、Hinge Loss、Exponential Loss、Logistic Loss
在分类函数中引入松弛因子 \(\epsilon\)，如果 \(\epsilon = 0\) 表明该点在边界上；\(0 < \epsilon < 1\) 表明该点在边界内部，分类正确；如果 \(\epsilon > 1\) 表明该点分类错误
边界描述结构风险，错误描述经验风险，我们希望边界足够大，错误足够小

对于线性不可分问题，另一种方法是给样例增加一个维度，将输入空间映射到一个特征空间，使得样例在更高维度上线性可分。

核函数：核函数可以直接计算隐式映射到高维特征空间后的向量内积，而不需要显式地写出映射后的结果，它虽然完成了将特征从低维到高维的转换，但最终却是在低维空间中完成向量内积计算，与高维特征空间中的计算等效（低维计算，高维表现），从而避免了直接在高维空间无法计算的问题。

如何构造核函数：