会员可以在此提问,百战程序员老师有问必答
对大家有帮助的问答会被标记为“推荐”
看完课程过来浏览一下别人提的问题,会帮你学得更全面
截止目前,同学们一共提了 132885个问题
Python 全系列/第十八阶段:数据分析-数据管理/数据分析案例_案例2_电影数据分析 17026楼
Python 全系列/第二阶段:Python 深入与提高/GUI编程(隐藏) 17027楼
Python 全系列/第十一阶段:重量级Web框架-Django/Redis的入门与应用(拓展) 17028楼
JAVA 全系列/(旧的隐藏)第十五阶段:百战商城项目(Spring Cloud最新架构)/百战商城项目 17029楼

1. One-vs-Rest (OVR)

基本概念

  • OVR,也称为 One-vs-All (OVA),是一种将多类分类问题转化为多个二分类问题的方法。

  • 对于有 K 个类别的分类问题,OVR 会训练 K 个二分类器。每个分类器负责区分一个类别和其余所有类别。

实现步骤

  1. 训练阶段

    • 对于每个类别 ii=1,2,,K),训练一个二分类器 fi

    • 分类器 fi 的目标是将类别 i 的样本标记为正类,其余类别的样本标记为负类。

  2. 预测阶段

    • 对于一个新的样本,使用所有 K 个分类器进行预测。

    • 每个分类器 fi 会输出一个置信度分数(如概率或决策函数值)。

    • 最终,选择置信度分数最高的类别作为预测结果。

优点

  • 简单直观,易于实现。

  • 只需要训练 K 个分类器,计算量相对较小。

缺点

  • 如果类别数量 K 很大,可能会导致类别不平衡问题,因为每个分类器的负类样本数量远多于正类样本。

  • 分类器之间的决策边界可能不够精确。

2. One-vs-One (OVO)

基本概念

  • OVO 是另一种将多类分类问题转化为多个二分类问题的方法。

  • 对于有 K 个类别的分类问题,OVO 会训练 K(K1)2 个二分类器。每个分类器负责区分一对类别。

实现步骤

  1. 训练阶段

    • 对于每一对类别 (i,j)i<j),训练一个二分类器 fij

    • 分类器 fij 的目标是将类别 i 的样本标记为正类,类别 j 的样本标记为负类。

  2. 预测阶段

    • 对于一个新的样本,使用所有 K(K1)2 个分类器进行预测。

    • 每个分类器 fij 会投票给其中一个类别。

    • 最终,选择得票最多的类别作为预测结果。

优点

  • 每个分类器只关注两个类别,避免了类别不平衡问题。

  • 决策边界通常更加精确。

缺点

  • 需要训练的分类器数量较多,计算量较大,尤其是当类别数量 K 很大时。

  • 预测阶段的计算复杂度较高,因为需要运行大量的分类器。

3. OVR 和 OVO 的比较

特性OVR (One-vs-Rest)OVO (One-vs-One)
分类器数量KK(K1)2
训练复杂度较低较高
预测复杂度较低较高
类别不平衡问题可能存在较少存在
决策边界精确度一般较高

4. 选择 OVR 还是 OVO?

  • 选择 OVR:当类别数量 K 较大时,OVR 的计算量较小,适合处理大规模数据集。

  • 选择 OVO:当类别数量 K 较小时,OVO 可以提供更精确的决策边界,适合处理小规模数据集。


人工智能/第六阶段:机器学习-线性分类/SMO优化算法 17030楼
JAVA 全系列/第二阶段:JAVA 基础深化和提高/反射技术(旧) 17031楼
JAVA 全系列/第十六阶段:前后端分离技术VUE/Vue框架 17033楼
JAVA 全系列/第四阶段:网页编程和设计/Javascript 语言(旧) 17034楼
JAVA 全系列/第二阶段:JAVA 基础深化和提高/数据结构 17035楼
Python 全系列/第一阶段:Python入门/Python入门(动画版) 17039楼
JAVA 全系列/第三阶段:数据库编程/MySQL数据库 17040楼

课程分类

百战程序员微信公众号

百战程序员微信小程序

©2014-2025百战汇智(北京)科技有限公司 All Rights Reserved 北京亦庄经济开发区科创十四街 赛蒂国际工业园
网站维护:百战汇智(北京)科技有限公司
京公网安备 11011402011233号    京ICP备18060230号-3    营业执照    经营许可证:京B2-20212637