老师 在计算梯度的时候,θ-α*gradient,gradient的值是取绝对值吗?
老师我这样理解对吗?已知n个样本→求出哪个模型最有可能得到这n个样本→根据最大似然函数求出估计量→把估计量带回原模型
t0,t1应该怎么设置才能得到比较好的学习率,或者说学习率在实战中应该怎么设置比较合适,是0.1,0.01,0.001一个个试吗?
老师 这里第二个for循环意义是什么呢?随机梯度下降不是一个批次一次迭代吗
老师 Wt+1 = Wt - θ*g 这个公式,
Wt+1 - Wt 这一段为啥等于 θ*斜率啊,这个步长是yt+1 - yt的直线距离吗?
scikit-learn 里面的线性回归是不是比直接用求参公式要慢呀
X_b[random_index:random_index+1]应该就是等价于X_b[random_index]的吧?
.fit() 训练模型后使用transform() 和 直接.fit_transform() 有区别嘛?
为什么之前有段代码 先fit之后再transform,是因为如果使用.fit_transform() 相当于是两个不同数据集进行训练嘛会有不同么?
为什么采用同样的数据集,同样的代码,归一化后的数据 却不一样呢。按道理来说,归一化这个操作是没有随机的。
还是不太明白为什么要对y_train进行取对数处理,基本假定不是假设误差项服从正态分布么,没有要求被解释变量服从正态分布吧。如果需要被解释变量进行取对数处理,为啥前几次的课中没有这种操作呢,望告知,多谢。
最后保险开销charges出来的预测值最终是什么定论?x对应的维度参数和预测值的关系是什么呢?
老师能解释一下最大似然估计吗 听着还是很晕 我自己的理解就是说 一个二项分布 然后其中概率最高的那个组合(比如3个黑球1个白球拥有最高的概率)那么我就可以把他视为这个盒子里面拥有3个黑球以及一个白球
非常抱歉给您带来不好的体验!为了更深入的了解您的学习情况以及遇到的问题,您可以直接拨打投诉热线:
我们将在第一时间处理好您的问题!
关于
课程分类
百战程序员微信公众号
百战程序员微信小程序
©2014-2025百战汇智(北京)科技有限公司 All Rights Reserved 北京亦庄经济开发区科创十四街 赛蒂国际工业园网站维护:百战汇智(北京)科技有限公司 京公网安备 11011402011233号 京ICP备18060230号-3 营业执照 经营许可证:京B2-20212637