分类问题的一般描述

更新时间：2025-10-14 理论教育 版权反馈

【摘要】：下面以二维图形为例解释常见的两分类问题。从图6-3中可以看出两类样本分布间隔较大，很容易找到一条直线将两类样本分离，这属于线性可分问题，对应的支持向量机线性可分，模型主要就是求解其最大间隔分类面。

下面以二维图形为例解释常见的两分类问题。首先看以下三种不同的情形。从图6-3中可以看出两类样本分布间隔较大，很容易找到一条直线将两类样本分离，这属于线性可分问题，对应的支持向量机线性可分，模型主要就是求解其最大间隔分类面。

图6-3 线性可分支持向量机

图6-4描述的是线性不可分情形，用一条直线虽不能完全地分离样本集，但大致上仍能把两类样本集分离，此时仍采用线性分类机予以解决，只需在模型中加入对错分样本的惩罚项。

图6-4 线性不可分支持向量机

图6-5则描述了非线性可分的情形，此时用一条直线加以划分两样本集时会产生很大的误差，而若采用曲线（非线性）分类器则可顺利地分离两样本集，这就是非线性可分的问题。通过引入核函数将原先低维空间中非线性可分的样本集映射到高维特征空间中，再在高维空间中采用线性分类器将映射后的样本集加以划分。

图6-5 非线性可分支持向量机

Vapink分别在1995和2026年提出C-SVM算法和v-SVM算法。为了便于比较，下面列出C-SVM算法主要的步骤和方法。

给定训练样本集{（x_i，y_i），i=1，2，…，l}，x_i∈R^d，y_i∈{−1，+1}，对于这样的分类问题，我们首先引进从输入空间Rⁿ到Hilbert空间H的变换：ϕ：Rⁿ→H，x→ϕ（x），然后在Hilbert空间H中构造原始问题：

约束条件：

y_i[（w⋅x_i）+b]≥1−ξ_i，i=1，2，…，l，ξ_i≥0 （6-2）

其中，C＞0是一个常数，它控制对错分样本的惩罚程度，控制分数机制的复杂性和不可分离点数之间的平衡，C越大表示对错误的惩罚越重。它也是算法中唯一可以调节的参数。

可以看出模型式（6-2）为典型的二次规划问题，只是问题的规模巨大，且绝大多数不具有稀疏性，使得典型的二次规划求解算法不能直接应用。支持向量分类机常用的求解方法是通过先求解其对偶问题的解，再利用该对偶问题的解来表示原始问题的解，从而确定原始分类问题的最优判别函数。采用Lagrange乘子法求解这个具有线性约束的二次规划问题，得到的对偶问题为