线性可分支持向量机的原理推导 线性分隔超平面关于任意样本点 (x_i,y_i)的函数间隔 公式解析

news/2024/10/18 13:43:59 标签: 机器学习, 支持向量机, 人工智能

本文是将文章《线性可分支持向量机的原理推导》中的公式单独拿出来做一个详细的解析,便于初学者更好的理解。


公式 9-1 用来表达训练集样本点 ( x i , y i ) (\mathbf{x}_i, y_i) (xi,yi) 到线性可分支持向量机分离超平面的距离。
d ^ i = y i ( w ⋅ x i + b ) (9-1) \hat d_i=y_i(w·x_i+b) \tag{9-1} d^i=yi(wxi+b)(9-1)

1. 支持向量机的基本背景

支持向量机的目标是找到一个超平面将不同类别的数据分开,且保证间隔(分类超平面与支持向量之间的距离)最大化。超平面的一般形式为:
w T x + b = 0 \mathbf{w}^T \mathbf{x} + b = 0 wTx+b=0

其中 w \mathbf{w} w 是超平面的法向量, b b b 是偏置。

分类函数 f ( x ) f(\mathbf{x}) f(x) 的形式为:
f ( x ) = sign ( w T x + b ) f(\mathbf{x}) = \text{sign}(\mathbf{w}^T \mathbf{x} + b) f(x)=sign(wTx+b)

这表示一个数据点 x \mathbf{x} x 是否位于分类超平面的某一侧,用于预测其分类标签。

2. 公式 9-1 的具体含义

公式 9-1 定义了样本点 ( x i , y i ) (\mathbf{x}_i, y_i) (xi,yi) 到分类超平面的“带符号距离”:
d ^ i = y i ( w T x i + b ) \hat d_i = y_i (\mathbf{w}^T \mathbf{x}_i + b) d^i=yi(wTxi+b)

解释:
  • d ^ i \hat d_i d^i 是带符号的距离,即考虑到样本点属于哪一类(由 y i y_i yi 表示)。
  • y i y_i yi 是样本 i i i 的真实标签,取值为 + 1 +1 +1 − 1 -1 1,分别表示两类。
  • w T x i + b \mathbf{w}^T \mathbf{x}_i + b wTxi+b 是点 x i \mathbf{x}_i xi 到超平面的函数值。

3. 公式的推导逻辑

  • y i = + 1 y_i = +1 yi=+1 时,如果 w T x i + b > 0 \mathbf{w}^T \mathbf{x}_i + b > 0 wTxi+b>0,说明该点位于超平面正确的一侧,且 d ^ i > 0 \hat d_i > 0 d^i>0 表示它的距离大于 0,意味着分类正确。
  • y i = − 1 y_i = -1 yi=1 时,若 w T x i + b < 0 \mathbf{w}^T \mathbf{x}_i + b < 0 wTxi+b<0 d ^ i \hat d_i d^i 也是正值,表示分类正确。

因此, d ^ i \hat d_i d^i 实际上是样本点到超平面的带符号距离,用来判定样本点是否被正确分类。

4. 为什么引入 y i y_i yi

y i y_i yi 的作用是将样本点的距离和它的真实分类关联起来。对于每个样本,如果该样本位于超平面正确的一侧(即符合它的类别),则 d ^ i \hat d_i d^i 为正,反之为负。因此, y i y_i yi 的引入确保了无论样本属于哪一类,计算出的距离都是一致的,正值意味着分类正确。

5. 总结

公式 9-1 定义了支持向量机中样本点 ( x i , y i ) (\mathbf{x}_i, y_i) (xi,yi) 到分类超平面的距离,其中通过引入 y i y_i yi 来确保这个距离能够反映样本点是否被正确分类。


http://www.niftyadmin.cn/n/5711270.html

相关文章

【进阶OpenCV】 (18)-- Dlib库 --人脸关键点定位

文章目录 人脸关键点定位一、作用二、原理三、代码实现1. 构造人脸检测器2. 载入模型&#xff08;加载预测器&#xff09;3. 获取关键点4. 显示图像5. 完整代码 总结 人脸关键点定位 在dlib库中&#xff0c;有shape_predictor_68_face_landmarks.dat预测器&#xff0c;这是一个…

图书管理新趋势:Spring Boot进销存系统

摘要 随着信息技术在管理上越来越深入而广泛的应用&#xff0c;管理信息系统的实施在技术上已逐步成熟。本文介绍了图书进销存管理系统的开发全过程。通过分析图书进销存管理系统管理的不足&#xff0c;创建了一个计算机管理图书进销存管理系统的方案。文章介绍了图书进销存管理…

关于FFmpeg【使用方法、常见问题、解决方案等】

1、提取音频 【1】提取无损高质量音频文件 问题描述 想要从视频文件中提取出无损高质量音频文件。 解决方案 ffmpeg -i input.mp4 -vn -c:a pcm_s16le -ar 44100 -ac 2 output.wav

AGI 之 【Dify】 之 Dify 在 Windows 端本地部署调用 Ollama 本地下载的大模型,实现聊天对话

AGI 之 【Dify】 之 Dify 在 Windows 端本地部署调用 Ollama 本地下载的大模型&#xff0c;实现聊天对话 目录 AGI 之 【Dify】 之 Dify 在 Windows 端本地部署调用 Ollama 本地下载的大模型&#xff0c;实现聊天对话 一、简单介绍 二、 Ollama 下载安装 三、Ollama 下载 L…

Unity DOTS中的Archetype与Chunk

Unity DOTS中的Archetype与Chunk 在Unity中&#xff0c;archetype&#xff08;原型&#xff09;用来表示一个world里具有相同component类型组合的entity。也就是说&#xff0c;相同component类型的entity在Unity内部会存储到一起&#xff0c;共享同一个archetype。 使用这样的设…

Mac 编译 Unreal 源码版本

Mac M3 Pro、XCode 16.0、Unreal 5.4 流程 分享下我本地操作的全流程和遇到的问题 安装 XCodeGithubDesktop 克隆自己 Fork 的仓库运行 Setup.command运行 GenerateProjectFiles.command 出现警告&#xff1a;Platform Mac is not a valid platform to build. Check that the…

VsCode 如何自定义代码片段(Code Snippet)

前言 在现代前端开发中&#xff0c;提高工作效率是每个开发者的追求。Visual Studio Code&#xff08;Vscode&#xff09;作为一款强大的代码编辑器&#xff0c;提供了许多让开发者高效编程的功能&#xff0c;其中自定义代码片段&#xff08;Code Snippet&#xff09;便是一个…

http://localhost:8080要求用户输入用户名和密码,解决方法!

我们在Eclipse配置Tomcat&#xff0c;测试Tomcat是否配置完成的时候会遇到这样的问题 解决方法&#xff1a; 方法1、修改Tomcat的配置。找自己安装tomcat的目录&#xff0c;打开conf文件夹&#xff0c;找到server.xml&#xff0c;进行修改。 建议用VS code打开修改方便&#x…