老师
1、selenium的获取URL方法
from time import sleep from selenium import webdriver from selenium.webdriver.common.by import By from selenium.webdriver.common.keys import Keys from selenium.webdriver.support.wait import WebDriverWait from selenium.webdriver.support import expected_conditions as EC driver = webdriver.Chrome() driver.maximize_window() driver.get('http://www.baidu.com') sleep(2) try: driver.find_element_by_id('kw').send_keys('汽车之家') driver.find_element_by_id('su').click() '''延时操作,访问页面''' driver.implicitly_wait(10) # WebDriverWait(driver,10).until(EC.presence_of_element_located((By.XPATH,'//div[@id="1"]/h3/a'))).send_keys(Keys.ENTER) driver.find_element_by_xpath('//div[@id="1"]/h3/a').send_keys(Keys.ENTER) # 或者 Keys.RETURN '''页面相关操作''' driver.implicitly_wait(10) a = driver.current_url print(a) except Exception as e: print(e) finally: sleep(10) driver.quit()
这个方法为什么获取不到当前访问页面的URL?比如这里成功通过百度,跳转到了汽车之家的官网,调用这个方法打印的是百度搜索页面的URL,还是说这个方法本来就是这样?如何获取到当前页面的url呢?
2、selenium获取页面源代码
获取源代码应该也是根据他当前获取的URL的源代码吧,比如这里只能获取百度搜索页面的的URL,所以打印的也是百度搜索页面的源码
我不用cookie也直接能登入啊,啥情况
urllib.request Requesturlopen fake_useragent UserAgent url = headers = {: UserAgent().random} req = Request(url=headers) reps = urlopen(req) (reps.read().decode())
image.zip
老师,麻烦帮我看看我的代码为什么出现图中的bug,这样的bug应该怎么解决?
windows中splash无法渲染怎么搞?下载splash源码改完怎么做啊
问题1:
第一个红框是我写的1080P的图片选项,第二个红框是老师那种直接显示的960x600的图片,为什么我的就会出现
错误?通过我的1080p链接直接就能访问到图片:http://desk.zol.com.cn/showpic/1920x1080_115443_131.html
问题2:
最后一页的链接是:javascript:;,不是一个链接所以会报这个Missing错误,那是不是应该自己写个判断了,比如html结尾
老师,是不是请求的网址不能访问了,直接通过链接和python写的请求都不能访问,返回404
urllib.request Request,urlopen urllib.parse urlencode urlargs{, } f_date(args) (f_date) headers{} request(url,headers, f_date.()) resp(request) (resp.().())
报错时少了关键字参数date ,为什么,老师,编写过程中date老是提示
douban.zip
老师麻烦看下,我打印item字典时里面的name,star,url都一一对应,
但是加入content了,打印出来的name,star,url都是一样的值,麻烦老师可以帮我修改下吗
老师,这个item不是字典吗,为什么还要dict它
老师,你好。
<em class="">
华硕(ASUS)灵耀14 十代i7 13.5mm超轻薄14英寸商务办公手提
<font class="skcolor_ljg">笔记本</font>
电脑(i7-1065G7 16G 512G 高色域)松木青
</em>
使用xpath怎么<em>标签中的所有文本信息。
老师,请问,LinkExtractor(allow=r'/text/page/\d+').extract_links(response) 这句代码是什么意思呢
谷歌浏览器在国内很多情况都访问不了怎么解决么
老师,请问,这句代码怎么理解呢,中间的string(.)又是什么意思呢
老师,请问,用xpath提取,这里的[2]是表示什么哦
老师,请问,在浏览器用账号密码登录虾米音乐, 登录前后,右键查看源代码都是一样的,是为什么呢,而且爬下来的html也是这个
但是登录后 用F12中的elements可以知道登录了,能看到‘退出登录’
非常抱歉给您带来不好的体验!为了更深入的了解您的学习情况以及遇到的问题,您可以直接拨打投诉热线:
我们将在第一时间处理好您的问题!
关于
课程分类
百战程序员微信公众号
百战程序员微信小程序
©2014-2025百战汇智(北京)科技有限公司 All Rights Reserved 北京亦庄经济开发区科创十四街 赛蒂国际工业园网站维护:百战汇智(北京)科技有限公司 京公网安备 11011402011233号 京ICP备18060230号-3 营业执照 经营许可证:京B2-20212637