老师,我想问下在yoloV1是把原图resize成448x448直接带入CNN,还是把原图切分成为7x7的cell后,把每一个cell变为448x448然后带入CNN呀
这节课讲的Scales指的是不是图中Scale1对应Feature map的8*8大小,Scale2对应Feature Map的16*16大小和Scales3对应的32*32大小。在Yolo V3中,每个图像给出三种scales,通过聚类得出的9种不同大小的Anchor Boxes被分配到这三个scales中,一个scale对应三种不同大小的Anchor Boxes,是不是应该这样理解?
老师这块代码是不是写错啦,使用2个尺度,应该是【0,1,2】【3,4,5】
老师,这里的逻辑是这样的吗(下图方向),这不是个普通的闭包、或者说内部类么?,我没听太明白里面的嵌套在哪里啊?第2个y_pred改成其他的名字有啥影响吗
老师请教一下,local loss这个模型,阿发取0.25,是因为正例多,而负例少,所以正例乘以0.25,负例乘以0.75吗?
负例易分是什么意思?
老师,1.这里用sse是因为mse 几项求平均时,系数不好求吗?
2.可以这样理解吗:
bbox在no_obj时,对locate_loss项没有贡献,导致有obj_locate_loss项贡献相对过大,梯度震荡;
coordinate项采用较大的惩罚因子,
noobj时,采用较小的惩罚因子,而no_obj只影响classifier错误的loss,没有obj时判成有Class_i的那一项?
如果这样理解的话,有个矛盾:正例少,按理讲应该减少对它的惩罚,加大负例的惩罚?
3.可以理解成:这个模型只有正例,没有负例吗?
老师请问,模型配置文件和权重文件有什么联系和区别,配置文件里边是网络层结构和超参数,权重文件好像也是各层的权值,权值不是超参数吗
老师这个地方的train_bottleneck,视频里说不对darknet53训练了,是什么意思?darknet53是一个配置文件 ,里边配置的是什么
老师请教一下,中间这个卷积参数是要经过训练吗?sam输出mask,可以框出目标,他是怎么训练的啊?输出mask不就已经完成了目标检测了吗?就不用yolo4做后续工作啦?
老师请教一下,下图cmbn,不能并行,下面蓝色我框的,accmulateBN,累加bn,但是计算bn的时候就用本层的bn
计算?这样就可以并行计算了?
有sxs个栅格,每个栅格生成的B个bounding boxes,这些boxes需要预测的x,y ,是否就等于栅格的中心点吗?
如下图所示,还是在栅格中的任意点。
bounding boxes 预测的w和h,是相对于整个图片的比例值,还是实际长度啊?
老师请教一下,yolo3这些代码工作的时候,都需要自己实现吗?自己需要实现哪部分代码?
老师请教一下,sxsx(B*5+c),其中c是栅格预测的条件概率吗Pr(classi|object)吗?
老师请教一下,p(object)这一项是指cell包含object,还是bounding box包含object呢?
另外一个cell的bounding boxes,所包含的object如果不是一个类别,怎样判断cell属于哪个类别?
非常抱歉给您带来不好的体验!为了更深入的了解您的学习情况以及遇到的问题,您可以直接拨打投诉热线:
我们将在第一时间处理好您的问题!
关于
课程分类
百战程序员微信公众号
百战程序员微信小程序
©2014-2025百战汇智(北京)科技有限公司 All Rights Reserved 北京亦庄经济开发区科创十四街 赛蒂国际工业园网站维护:百战汇智(北京)科技有限公司 京公网安备 11011402011233号 京ICP备18060230号-3 营业执照 经营许可证:京B2-20212637