y_hat = WTX
y_hat = XΘ
这两个公式代表的含义是一样的吧
WT=(w0,...,wm)
Θ = (w0,...,wm)T
是这样吗老师,x前边的参数有时候是β,有时候是w,有时候是θ,很容易搞混了
老师请问np.random.rand和np.random.randn的区别是啥呀
老师, 视频里面创建数据的时候, y = 4 + 3*X + np.random.randn(100,1), 我知道截距项是4和系数是3。对于在实际的数据集, 我们怎么才能知道它的截距项和对应Xj的系数是什么? 当然, 同时我也想问问我们怎么能确定我们的数据适用于多元线性回归? 因为只有知道数据适用于什么公式,然后才能选择对应算法和它的损失函数求梯度。
老师 损失函数不是 XW - y_hat 吗,为啥加了正则项的这几个都是 (XW - y) 的平方啊
为什么fit_intercept要设置为false,是不是因为x_train之前就设置了include_bias=true,所以x_poly_train里面包括了截距项的原因?请详细告知
老师请问,为什么第一个更容易交在不是坐标轴的地方,第二个图更容易交在坐标轴上或者附近?
老师,这里说的非线性变化成线性是利用上升维的手段, 假如我有个非线性数据集如下:
首先第一个问题, 我判断这是非线性的数据集(因为维度貌似没啥关系,很有相互独立的感觉), 不知道这么判断对不对?
第二个问题, 我是不是得先运用升维手段, 把数据集变为线性的, 在更高维度作平面, 最后就可以利用上Ridge/Lasso算法去训练模型?
请问一下,这里为什么会输出0.0?添加了第30—32行代码后,才出现的,未添加前不会输出0.0
老师, polynomial_features.fit_transform的结果是作为新的X给线性回归算法用, 我这样理解没错吧?
老师 zscore标准化是什么标准化
老师 zscore是标准归一化吗
为什么这里的梯度不求平均,不除以batch_size,我是从后面神经网络那里过来的,后面都会求平均。望告知,多谢。
老师,这行代码的作用提取出来charges这行数据集吗
这里不太理解,中心极限定理对多元线性回归有什么意义
老师 L1表示的菱形都可以成比例扩大呀,并不是只能交在离坐标轴近的地方呀
非常抱歉给您带来不好的体验!为了更深入的了解您的学习情况以及遇到的问题,您可以直接拨打投诉热线:
我们将在第一时间处理好您的问题!
关于
课程分类
百战程序员微信公众号
百战程序员微信小程序
©2014-2025百战汇智(北京)科技有限公司 All Rights Reserved 北京亦庄经济开发区科创十四街 赛蒂国际工业园网站维护:百战汇智(北京)科技有限公司 京公网安备 11011402011233号 京ICP备18060230号-3 营业执照 经营许可证:京B2-20212637