有效沟通问答-【官方】百战未来_IT在线教育培训机构

会员可以在此提问，百战未来老师有问必答

对大家有帮助的问答会被标记为“推荐”
看完课程过来浏览一下别人提的问题，会帮你学得更全面

截止目前，同学们一共提了 135016个问题

老师我这个是怎么回事呢。。。

Python全系列/第十六阶段：Python 爬虫开发/scrapy框架使用 256楼

老师，我按照视频的做法走到python操作appium，目前fiddler、模拟器和appium都正常，但是python端一直报错，报错信息如下：

Traceback (most recent call last):

File "D:\Simon\simonPythonPractice\移动端爬虫(spider_of_fiddler_get_application_data)\manipulate_android_simulator_with_appium.py", line 16, in <module>

driver_android = webdriver.Remote(server, desired)

^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^

File "D:\Python311\Lib\site-packages\appium\webdriver\webdriver.py", line 230, in __init__

super().__init__(

TypeError: WebDriver.__init__() got an unexpected keyword argument 'desired_capabilities'

Python全系列/第十六阶段：Python 爬虫开发/移动端爬虫 257楼

老师，这个报的错怎么解决啊？

Python全系列/第十六阶段：Python 爬虫开发/爬虫基础 258楼

不支持传递encoding了

Python全系列/第十六阶段：Python 爬虫开发/Python爬虫基础与应用 259楼

这段代码什么意思 data是什么用处，为什么要这么用后面的转码又是什么意思

Python全系列/第十六阶段：Python 爬虫开发/爬虫基础（旧） 260楼

因为

是post请求所以

然后我就把data传了进去

from urllib.request import  urlopen,Request
from urllib.parse import urlencode
from fake_useragent import UserAgent
url='http://ynuf.aliapp.org/service/um.json'
us=UserAgent(path='D:/地址/fake_useragent.json')
heads={
    'User-Agent':us.chrome
}
n={
    'data':'106!7mumc0clNbmcvtLXjmEzz838NyROP5D17c0+xKUUz+Htnc6352am21WSjWFgm+HmnrIV+Ohj+KNy5vUTih8mqqwuWlaqFJUXw8fQ2zRPG1dGW4T9aPEvHT01O4rkysYJqfM8bdThPTOrlr27m+7zdbS4RnC0yY3JfCeL74FsPy/JDuaUE0lWs+eU0M8Hs+IsggkIfItP3eS7JGUOfTsKsPoU5u88s+eAmthkl+9zPQxC+OF/wo535MXLXs4YAELMptVBc9N6yj4WZGeHvct8ASF8UwJUncf0KQ7e4Bar6RJ+rClbcD7WKnm5B5Sp76LwgTHlhbM8caJEPQyGXGeYIU1FjExzDIRnA20wCCqFSinYDxjlWVYqMo1u7G1i03RXtuLpKcTJrwEJWOAxcge9saHfNWcWw4d4mFGQQkM4noQmytG4U7pm7fbZO7nKr80SsnTgpBe2PE1BOPvFEcpZC8O8+0N5wQiRXzlweCzTe3rUhHFVGkRgn79A8I1AQM8KzkEXsQNDOBA8z5ptZIaOa07cYnn19/BdYmMgH9zjW7pv8XAZFzWHHpsYka7HwQaqgoZVQc1yRisQ6SBsKfxsSUCO'
}
req=Request(url,headers=heads,data=urlencode(n).encode())
op=urlopen(req)
print(op.read().decode())
print(op.getcode())

这个是结果

它返回了一个字典给我，该如何更改才能显示html代码界面呢

Python全系列/第十六阶段：Python 爬虫开发/爬虫基础（旧） 261楼

使用fake_useragrnt还是会识别程序

Python全系列/第十六阶段：Python 爬虫开发/爬虫基础 262楼

2023-12-29 11:17:50 [scrapy.core.engine] INFO: Spider opened
2023-12-29 11:17:50 [scrapy.extensions.logstats] INFO: Crawled 0 pages (at 0 pages/min), scraped 0 items (at 0 items/min)
2023-12-29 11:17:50 [scrapy.extensions.telnet] INFO: Telnet console listening on 127.0.0.1:6023
2023-12-29 11:17:50 [scrapy.core.engine] DEBUG: Crawled (403) <GET https://www.beqege.com/1150/15333.html> (referer: None)
2023-12-29 11:17:50 [scrapy.spidermiddlewares.httperror] INFO: Ignoring response <403 https://www.beqege.com/1150/15333.html>: HTTP status code is not handled or not allowed
2023-12-29 11:17:50 [scrapy.core.engine] INFO: Closing spider (finished)

这是爬不了吗

Python全系列/第十六阶段：Python 爬虫开发/scrapy框架使用 263楼

老师，这个CMD里面的参数是在run容器的时候自动执行并暴露一个端口号，下面八个ENTRYPOINT中的参数不也是在run的时候自动执行么，这里面的参数不太明白含义，能解释下么，

Python全系列/第十六阶段：Python 爬虫开发/docker 容器扩展（旧） 264楼

import re

import requests

from fake_useragent import UserAgent

url = 'https://www.qidian.com/rank/yuepiao/'

headers = {'User-Agent':UserAgent().chrome}

res = requests.get(url,headers = headers)

res.encoding = 'utf-8'

with open('tmp.html','w',encoding='utf-8') as f:

f.write(res.text)

rs =re.findall('<div class="book-mid-info"> <h2><a href=".+?>(.+)</a>',res.text)

print(rs)

爬的起点网，为什么会爬出来想要的东西后面的那些什么标签什么的呀

Python全系列/第十六阶段：Python 爬虫开发/爬虫基础 265楼

因为

是post请求所以

然后我就把data传了进去

from urllib.request import  urlopen,Request
from urllib.parse import urlencode
from fake_useragent import UserAgent
url='http://ynuf.aliapp.org/service/um.json'
us=UserAgent(path='D:/地址/fake_useragent.json')
heads={
    'User-Agent':us.chrome
}
n={
    'data':'106!7mumc0clNbmcvtLXjmEzz838NyROP5D17c0+xKUUz+Htnc6352am21WSjWFgm+HmnrIV+Ohj+KNy5vUTih8mqqwuWlaqFJUXw8fQ2zRPG1dGW4T9aPEvHT01O4rkysYJqfM8bdThPTOrlr27m+7zdbS4RnC0yY3JfCeL74FsPy/JDuaUE0lWs+eU0M8Hs+IsggkIfItP3eS7JGUOfTsKsPoU5u88s+eAmthkl+9zPQxC+OF/wo535MXLXs4YAELMptVBc9N6yj4WZGeHvct8ASF8UwJUncf0KQ7e4Bar6RJ+rClbcD7WKnm5B5Sp76LwgTHlhbM8caJEPQyGXGeYIU1FjExzDIRnA20wCCqFSinYDxjlWVYqMo1u7G1i03RXtuLpKcTJrwEJWOAxcge9saHfNWcWw4d4mFGQQkM4noQmytG4U7pm7fbZO7nKr80SsnTgpBe2PE1BOPvFEcpZC8O8+0N5wQiRXzlweCzTe3rUhHFVGkRgn79A8I1AQM8KzkEXsQNDOBA8z5ptZIaOa07cYnn19/BdYmMgH9zjW7pv8XAZFzWHHpsYka7HwQaqgoZVQc1yRisQ6SBsKfxsSUCO'
}
req=Request(url,headers=heads,data=urlencode(n).encode())
op=urlopen(req)
print(op.read().decode())
print(op.getcode())

这个是结果

它返回了一个字典给我，该如何更改才能显示html代码界面呢

Python全系列/第十六阶段：Python 爬虫开发/爬虫基础（旧） 266楼

from urllib.request import Request,urlopen
from random import choice
from fake_useragent import UserAgent

url = "http://httpbin.org/get"
ua = UserAgent()
# print(ua.ie)
# print(ua.chrome)
# print(ua.firefox)
headers = {
    "User-Agent":ua.random
}
req = Request(url,headers=headers)
resp = urlopen(req)
print(resp.read().decode())

老师，运行代码显示这个错误，然后按照网上给的一些方法改后，运行还是这个错误

Python全系列/第十六阶段：Python 爬虫开发/scrapy框架使用（旧） 267楼

显示报错，找不到办法

Python全系列/第十六阶段：Python 爬虫开发/scrapy框架使用 268楼

无法安装xpath，将文件拖动到开发者工具界面，显示程序包无效，网上搜的几种方式也尝试了，没反应

1561858412(1).jpg

Python全系列/第十六阶段：Python 爬虫开发/爬虫反反爬- 269楼

配置了，不起作用

Python全系列/第十六阶段：Python 爬虫开发/scrapy框架使用 270楼

同学您好