from selenium import webdriver from time import sleep # 构造一个浏览器 chrome = webdriver.Chrome() url = 'https://www.huya.com/l' chrome.get(url) sleep(3) temp1 = chrome.find_elements_by_class_name('nick') temp2 = chrome.find_elements_by_class_name('js-num') # 主播名字 names = [temp.text.strip() for temp in temp1] # 主播人气 counts = [temp.text.strip() for temp in temp2] temp3 = sorted(zip(names, counts), key=lambda s: s[1], reverse=True) for name, count in temp3: print(name, ':', count) chrome.quit()
老师您好,我这个代码的意思是想按主播的观看人数从大到小输出(只爬了第一页的数据),但是输出的结果却不正确,我不知道哪写错了
meta是什么意思 作用是什么 怎么用 每次遇到这种类型的东西 也不介绍 不说 直接用 我们又不会 不知道 不应该说清楚嘛?
老师麻烦帮我看下这个实操作业为什么抓不下来数据
taobao.rar
老师 我有个问题:提取目录的url 跟 内容的url 不一样该怎么提取呢?是在start_urls 那里加上url嘛还是?
图片在这里,刚才忘记上传了。。。。。。。。。。
dokcer在国,,内用不了了么?
老师互联网这个怎么用不了啊
start()函数是线程Thread自带的吗,他是绑定run方法还是怎么调用啊,我直接使用t1对象的run方法时候,就还是单线程的,start方法是怎么实现的啊?
老师,你好!类似于当当网这种,要实现click(),却找不到搜索按键元素,想使用submit()也想不通,麻烦老师帮忙看下,谢谢!
ddw.7z
老师,xpath插件已失效,网上重新下好几个都不行,不知道您那儿是否有有效的安装包?有的话,能麻烦您发一份给我吗?
novel.zip
老师,上面是我的项目文件,我在执行时爬取下来的内容章节不是顺序的,里面有爬取下来之后的结果,在novel.txt里,他的顺序是第1章,第49章,第48章.........,这是由于并行运行导致的吗?还是什么原因,该怎么解决呢?谢谢老师!
老师 为啥在有process_item()的情况下get_media_requests()不起作用,只能出现其中一个吗
scrapy指令执行错乱
这个问题没有任何的报错,scrapy也能正常运行,但是就算有问题:
本人在scrapy项目里面创建好一个.py文件,且正常爬取到网站之后,当在该项目下终端运行指令scrapy相关指令(如scrapy crawl、scrapy genspider --)结果都执行的是我前面创建好的.py文件的运行效果,尽管我的指令明明是创建文件甚至指令都不全面,重启项目、重装scrapy、更换编辑器、都没能解决,创建一个新项目能正常执行genspider指令,但是同样只能创建一个,再次创建就是craw的效果了
这种情况是怎么回事?
老师,能不能把您的课件整理一下,默认打开的setting什么的,这样看课件真的很费劲。
这个模块还是不懂是干嘛的
非常抱歉给您带来不好的体验!为了更深入的了解您的学习情况以及遇到的问题,您可以直接拨打投诉热线:
我们将在第一时间处理好您的问题!
关于
课程分类
百战程序员微信公众号
百战程序员微信小程序
©2014-2025百战汇智(北京)科技有限公司 All Rights Reserved 北京亦庄经济开发区科创十四街 赛蒂国际工业园网站维护:百战汇智(北京)科技有限公司 京公网安备 11011402011233号 京ICP备18060230号-3 营业执照 经营许可证:京B2-20212637