有效沟通问答-【官方】百战程序员_IT在线教育培训机构

特性	OVR (One-vs-Rest)	OVO (One-vs-One)
分类器数量	$K$	$\frac{K (K - 1)}{2}$
训练复杂度	较低	较高
预测复杂度	较低	较高
类别不平衡问题	可能存在	较少存在
决策边界精确度	一般	较高

4. 选择 OVR 还是 OVO？

选择 OVR：当类别数量 $K$ 较大时，OVR 的计算量较小，适合处理大规模数据集。
选择 OVO：当类别数量 $K$ 较小时，OVO 可以提供更精确的决策边界，适合处理小规模数据集。

人工智能/第六阶段：机器学习-线性分类/SMO优化算法 3楼

SVM和SMO算法之间的关联

1. 支持向量机（SVM）简介

SVM是一种用于分类和回归的监督学习模型。在分类问题中，SVM的目标是找到一个超平面，能够将不同类别的数据点分开，并且使得两个类别之间的间隔（margin）最大化。这个超平面可以表示为：

$w \cdot x + b = 0$
其中， $w$ 是权重向量， $b$ 是偏置项。

2. SVM的优化问题

SVM的训练过程可以转化为一个凸二次规划（Quadratic Programming, QP）问题。对于线性可分的情况，优化问题可以表示为：

$\min_{w, b} \frac{1}{2} ∥ w ∥^{2}$

$subject to y_{i} (w \cdot x_{i} + b) \geq 1, \forall i$
其中， $y_{i}$ 是数据点的标签， $x_{i}$ 是数据点的特征向量。

3. 序列最小优化（SMO）算法

SMO算法是一种用于高效求解SVM优化问题的算法。它由John Platt在1998年提出，专门用于解决大规模数据集的SVM训练问题。

SMO算法的核心思想

SMO算法通过将大的QP问题分解为一系列小的QP问题来求解。具体来说，它每次只选择两个拉格朗日乘子（Lagrange multipliers）进行优化，而固定其他乘子。这种方法大大减少了计算复杂度，使得SMO算法在处理大规模数据集时非常高效。

SMO算法的步骤

选择两个拉格朗日乘子：每次选择两个乘子 $α_{i}$ 和 $α_{j}$ 进行优化。
优化这两个乘子：通过解析方法更新这两个乘子，使得目标函数最大化。
更新模型参数：根据更新后的乘子，重新计算权重向量 $w$ 和偏置项 $b$ 。
检查收敛条件：如果满足收敛条件，则停止；否则，重复上述步骤。

4. SVM和SMO的关联

SMO是SVM的求解器：SMO算法是专门为求解SVM的优化问题而设计的。它通过分解大的QP问题为一系列小的QP问题，使得SVM的训练过程更加高效。
高效性：SMO算法在处理大规模数据集时表现出色，因为它每次只优化两个乘子，减少了计算复杂度。
广泛应用：由于SMO算法的高效性，它被广泛应用于各种SVM实现中，如LIBSVM等。

5. 总结

SVM是一种强大的分类和回归模型，而SMO算法是专门为高效求解SVM优化问题而设计的算法。通过将大的QP问题分解为一系列小的QP问题，SMO算法大大提高了SVM的训练效率，使得SVM在处理大规模数据集时更加实用。希望这个解释能帮助你更好地理解SVM和SMO算法之间的关联。

人工智能/第六阶段：机器学习-线性分类/SMO优化算法 4楼

老师函数距离是指特征向量到超平面的距离还是所有特征到超平面的距离

人工智能/第六阶段：机器学习-线性分类/SVM支持向量机算法 5楼

老师 theta哪去了？

人工智能/第六阶段：机器学习-线性分类/逻辑回归 6楼

这里不应该是+号吗

人工智能/第六阶段：机器学习-线性分类/逻辑回归 7楼

老师为什么我的结果是线性的呢？

人工智能/第六阶段：机器学习-线性分类/逻辑回归 8楼

老师直接使用lr=LogisticRegression()导入模型，如何对模型的参数进行调整优化？

人工智能/第六阶段：机器学习-线性分类/逻辑回归 9楼

老师这个log函数取的是以e为底的吗

人工智能/第六阶段：机器学习-线性分类/逻辑回归 10楼

请教一下老师，为啥我运行人脸分类的代码，报下面的错？

人工智能/第六阶段：机器学习-线性分类/SVM支持向量机算法 11楼

import numpy as np
from sklearn import datasets
from sklearn.linear_model import LogisticRegression
from sklearn.metrics import confusion_matrix
from sklearn.model_selection import GridSearchCV
from sklearn.svm import SVC
import matplotlib.pyplot as plt

iris=datasets.load_iris()
# print(list(iris.keys()))
# print(iris['DESCR'])
# print(iris['feature_names'])
X=iris['data'][:,3:]
# print(X)
# print(iris['target'])
y=iris['target']
print(X)
print(y)

param_grid={'C':[1e3,5e3,1e4,5e4,1e5],
            'gamma':[0.0001,0.0005,0.001,0.005,0.01,0.1]}
model1=GridSearchCV(SVC(kernel='rbf',class_weight='balanced'),param_grid,cv=5)
model1=model1.fit(X,y)
model2=GridSearchCV(SVC(kernel='sigmoid',class_weight='balanced'),param_grid,cv=5)
model2=model2.fit(X,y)

test_labels=np.zeros(150)
test_labels[75:150]=1
result1=model1.predict(X)

test_labels=np.zeros(150)
test_labels[75:150]=1
result2=model2.predict(X)

print(confusion_matrix(test_labels,result1))
print(confusion_matrix(test_labels,result2))
model3=GridSearchCV(SVC(kernel='poly',class_weight='balanced'),param_grid,cv=5)
model3=model3.fit(X,y)

test_labels=np.zeros(150)
test_labels[75:150]=1
result3=model3.predict(X)
print(confusion_matrix(test_labels,result3))

model4=GridSearchCV(SVC(kernel='linear',class_weight='balanced'),param_grid,cv=5)
test_labels=np.zeros(150)
test_labels[75:150]=1
model4=model4.fit(X,y)
result4=model4.predict(X)
print(confusion_matrix(test_labels,result4))

改变四个核函数之后训练出来的模型为什么后面三个结果是一样的，这是巧合还是就是会出现这种情况

人工智能/第六阶段：机器学习-线性分类/SVM支持向量机算法 12楼

import numpy as np

#创建数据集X,y
X=np.random.rand(100,1)
y=4+3*X+np.random.randn(100,1)
X_b=np.c_[np.ones(100),X]


#创建超参数
learning_rate=0.0001
n_iterations=10000

#1.创建cta，w0,w1,w2,w3,....,wn
cta=np.random.randn(2,1)

def p_theta_function(features,w1,w2):
    z=w1*features[0]+w2*features[1]
    #这里使用sigmoid函数，y_heater=1/(1+exp(-1*cta.T.dot(X)))
    return 1/(1+np.exp(-z))

#4.判断是否收敛，一般不会去设置阈值，而是采用相对大的迭代次数
for _ in range(n_iterations):
   
    gradients=0  
    #2.求梯度，计算gradient
    for i in range(100):
        x=X_b[i:i+1,:]
        y=y[i:i+1]
        p_result=p_theta_function(x,cta[0],cta[1])
        gradients+=x.T.dot(p_result-y)
        #3，应用梯度下降法公式调整cta值，cta(t+1)=cta(t)-ita*gradient
    cta=cta-learning_rate*gradients/100
   
print(cta)
这里我传的参数是1行两列，为什么他运行不了显示参数不够

人工智能/第六阶段：机器学习-线性分类/逻辑回归 13楼

老师，这里既然已经求出α1和α2为什么还要做变换来更新α1和α2呢，这里的α1和α2不就是在极值点取得的吗？这里我有些不明白？望老师给解答一下。

人工智能/第六阶段：机器学习-线性分类/SMO优化算法 14楼

老师这个xi为什么把转置去掉了啊

人工智能/第六阶段：机器学习-线性分类/SVM支持向量机算法 15楼

1. SVM回归模型的目标

2. 损失函数的角色

3. SVR的损失函数：ε-不敏感损失

4. SVR的优化目标

5. 通俗总结

1. One-vs-Rest (OVR)

基本概念

实现步骤

优点

缺点

2. One-vs-One (OVO)