老师,您好:
我想爬取上海二手房成交页面里面经纪人的评分和被评价次数,用了很多种写法,debugg的时候都是空值,运行也是控制,但是用谷歌插件是显示出来的,不知道哪里出了问题,希望老师解答。用了以下方法都不行:
num_agent = response.xpath('normalize-space(//div[@class="fr"]/span[@class="fr"]/a/text())').extract_first()
num_agent = response.xpath('string(//div[@class="fr"]/span[@class="fr"]/a/text())').extract_first()
num_agent = response.xpath('//div[@class="fr"]/span[@class="fr"]/a/text()').extract_first()
老师,我在创建文件的时候出现了问题,这个怎么解决
老师,我一直有一个问题,不知道到底是什么原因,在这个爬虫视频教程中视频老师一共用了三次“cookies” 跳过密码登录;但是我为什么不行,我把登录后的网址复制到scrapy中,然后直接访问网址; 它不会报没有登录,请登录这个错误。而是把源代码直接打印出来,但是打印出来的源代码又不是 我复制的这个登录后的源代码,而是登录前的源代码;我换很多网址和账号,都不知道到底是为什么;
老师,就像这个,这是我大学学校的一个学习网址。我粘贴的这个网址(
http://trzy.edu.chinaacc.com/student/mycenter/wdzl.shtm
)是登录到我的账号信息里面去了的;可是我直接这样访问网址它居然不像视频中老师那样显示没有登录,请登录这样的话;二就是直接打印源代码,而这个源代码又根本就不是我这个网址当前的源代码; 从我们爬虫基础到scrapy到现在高级,一共用cookies跳过密码登录三次,但是每一次我都是报这个错误;希望老师你帮忙看一下,我实在不知道是什么原因;一直纠结个很长时间,这个查百度也都无法查
老师,是因为不能获取这种链接吗?,为什么包这个错啊?
老师,麻烦您帮忙看一下这个是什么原因,我打印斗罗大陆的内容,但是只打印了一章程序就停止了, 刚刚开始接触这个,也不会看,看不出来问题。麻烦老师帮帮忙
first_xiaoshuo04.zip
老师,这里面的这个yield在这里的用法是什么啊,没明白
老师,为什么scrapy这章没有笔记,连.md文件格式的笔记都没有。老师,你们能不能上传一下笔记嘛。 前面就有同学问过好几次,你们总是说等一下就传,要吗就是反馈。但是我重新再链接里面去重新打开下载, 资料根本就没有更新
老师,我这个终端打开出现这个,不能初始化。
卸载重新安装还是有问题
老师这个是怎么回事?我明明已经安装好了whois了的,在cmd下能正常打印出信息,我已经将python-whois模块导入到pycharm里面了。
老师,这个是为什么啊,是图片问题吗? 加载不出来(提示:魔方开放源代码光学字符识别引擎3.02与轻便型无法打开输入文件:yzm1.jpg)
image.zip
老师,代码和视频中差不多,但是报错,图片也下载不下来,是哪里出了问题?
老师,这个阶段上传的资料压缩包解压出错,解压后只看得到源码
老师,为什么urllib最新版4下载不了,点进去就一直是加载状态
真的不明白这是什么意思;只2要我在.com后面加参数就会返回这个。 老师你说换一个网站试一下是什么意思啊?,没明白
老师,那个.crx文件拉到浏览器上无效根本就不是我们的问题,你们能不能用心点啊;很多人都遇到了这个问题, 老师你们不觉得奇怪吗难道我们学了这么久还是笨蛋吗?每个人都在这里出问题?。 这个问题的原因是现在谷歌浏览器版本更新了,不在兼容那个版本的.crx文件。所以大家会有这个错误
非常抱歉给您带来不好的体验!为了更深入的了解您的学习情况以及遇到的问题,您可以直接拨打投诉热线:
我们将在第一时间处理好您的问题!
关于
课程分类
百战程序员微信公众号
百战程序员微信小程序
©2014-2025百战汇智(北京)科技有限公司 All Rights Reserved 北京亦庄经济开发区科创十四街 赛蒂国际工业园网站维护:百战汇智(北京)科技有限公司 京公网安备 11011402011233号 京ICP备18060230号-3 营业执照 经营许可证:京B2-20212637