老师这个是怎么回事?我明明已经安装好了whois了的,在cmd下能正常打印出信息,我已经将python-whois模块导入到pycharm里面了。
你好,老师,我按照源代码写了一边爬虫,但是没收到数据,控制台也没有报错,看打印好像说是没有items,但是对比源代码找不到不一样的地方,我把源代码上传了上去,请老师帮我看看
lianjia11.rar
老师,手机验证码应该如何处理,还有那个滑块验证的应该如何处理
import requests from fake_useragent import UserAgent # from urllib.error import URLError import os def get_header(): location = os.getcwd() + '/fake_useragent.json' ua = UserAgent(path=location) return ua.random url = "https://www.qiushibaike.com/text/" headers = { "User-Agent":get_header() } resp = requests.get(url,headers=headers) print(resp.text)
老师,按照视频中爬取,但是这一段是没有被爬下来的,老师,是代码有问题吗?麻烦老师看一下
每次元素还没加载完成就退出了,用sleep强制等待才行
conda怎末下载11111111111111111111111111111111111111111111
requests hashlib md5 Chaojiying_Client(): (usernamepasswordsoft_id): .username = username password = password.encode() .password = md5(password).hexdigest() .soft_id = soft_id .base_params = { : .username: .password: .soft_id} .headers = { : : } (imcodetype): params = { : codetype} params.update(.base_params) files = {: (im)} r = requests.post(=params=files=.headers) r.json() (im_id): params = { : im_id} params.update(.base_params) r = requests.post(=params=.headers) r.json() (filenamecode_type=): chaojiying = Chaojiying_Client() im = (filename).read() resp = chaojiying.PostPic(imcode_type) resp.get() __name__ == : (get_code())
老师, 这个哪里有问题啊,照着老师的敲下来的, 识别不出来验证码。
打印出来的结果为空
老师,请问,我想复制部分内容自己做笔记,但是给的资料中pdf中的文字,为什么复制到wps中变成这种,字体有大有小,重新设置都没有用,然后网页的页字不见了,查找网页两个字,又是两个框框
就是运行不出来
import requests login ='http://www.chaojiying.com/user/login/' img ="http://www.chaojiying.com/public/default/images/content_login/img_login.jpg" headers={ "User-Agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/87.0.4280.88 Safari/537.36" } #创建session对象 session =requests.session() #第一次获取登陆页面 resp = session.get(login,headers=headers) #获取验证码 img_resp=session.get(img,headers=headers) #保存验证码 with open("code.jpg","wb") as f: f.write(img_resp.content) code=input("输入:") date={ 'user': 'jingrunping', 'pass': '456363', 'imgtxt':code, 'act': '1' } #登陆操作 login_resp=session.post(login,headers=headers,date=date) print(login_resp.text)
from urllib.request import urlopen from urllib.request import Request from random import choice url = "https://www.baidu.com/" user_agents=[ "ua1","ua2","ua3" ] # print(choice(user_agents)) #定义user_Agent变量 headers = { "User-Agent": choice(user_agents) } #封装request对象 req = Request(url,headers=headers) print(req.get_header("User-agent")) #发送请求 # resp = urlopen(req) # print(resp.read().decode())
print(req.get_header("User-agent"))
这句中,User-agent和User-Agent大写与小写有什么区别吗?而且这块不是应该与headers语句的中User-Agent一致吗?
爬取小说第一章节内容
爬取步骤
进入第一章:复制url
然后就是发的截图的代码步骤如下
运行后发现,也不报错,什么都不显示
老师可以分享一下软件安装吗 ,官网下载不了
老师为什么用find_element_by_link_text找不到元素,用xpathhelper都能找到文本
老师好,请问这个b具体表示什么意思?是按照什么方式编码呢?在python里面是b,是不是意味着不同语言爬取的html文本的编码方式也不同呢?
非常抱歉给您带来不好的体验!为了更深入的了解您的学习情况以及遇到的问题,您可以直接拨打投诉热线:
我们将在第一时间处理好您的问题!
关于
课程分类
百战程序员微信公众号
百战程序员微信小程序
©2014-2026百战汇智(北京)科技有限公司 All Rights Reserved 北京亦庄经济开发区科创十四街 赛蒂国际工业园网站维护:百战汇智(北京)科技有限公司 京公网安备 11011402011233号 京ICP备18060230号-3 营业执照 经营许可证:京B2-20212637