有效沟通问答-【官方】百战程序员_IT在线教育培训机构

会员可以在此提问，百战程序员老师有问必答

对大家有帮助的问答会被标记为“推荐”
看完课程过来浏览一下别人提的问题，会帮你学得更全面

截止目前，同学们一共提了 133940个问题

时间排序推荐排序

为什么我打印出来的是两个地址啊

Python 全系列/第十六阶段：Python 爬虫开发/爬虫基础 451楼

Python 全系列/第十六阶段：Python 爬虫开发/爬虫基础 452楼

douban.zip

老师麻烦看下,我打印item字典时里面的name,star,url都一一对应,

但是加入content了,打印出来的name,star,url都是一样的值,麻烦老师可以帮我修改下吗

Python 全系列/第十六阶段：Python 爬虫开发/移动端爬虫开发- 453楼

Docker 服务怎么开启，查询了，他说还要wsl什么的下载，好多东西要配置，能专门有一个教程教一下嘛，孩子搞不定了

Python 全系列/第十六阶段：Python 爬虫开发/爬虫反反爬 454楼

安装到最后的两个步骤了，结果在pip3 intsall scrapy出现了问题，老师该如何解决

Python 全系列/第十六阶段：Python 爬虫开发/分布式爬虫 455楼

里边的换行符可以去掉吗我用的中文办法，但是去不掉换行符，视频方法也不行

Python 全系列/第十六阶段：Python 爬虫开发/爬虫反反爬- 456楼

老师这个是为什么啊？我重装了lxml也没有解决

Python 全系列/第十六阶段：Python 爬虫开发/爬虫基础 457楼

为啥我的显示process.argv is not a function node也装了啊是自定义的方法吗

Python 全系列/第十六阶段：Python 爬虫开发/爬虫反反爬- 458楼

老师，我为什么按照你的代码敲只爬取一章啊

Python 全系列/第十六阶段：Python 爬虫开发/scrapy框架使用（旧） 459楼

<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"><html><head>
<meta http-equiv="Content-Type" content="text/html; charset=utf-8">
<!--[if lt IE 9]><script r='m'>document.createElement("section")</script><![endif]--></head>
<body>
<input type="hidden" id="__onload__" name="X4MUECfS5nm7ZcYH.jY1sVsEfS5H8oe5iInBytSD.PZakcfoSqgSDonoUQm7Uch1Z3LwAYnIRqg58T9E0dsu0G" value="ZY3u8CPnbz8y5BVlg4Tdqa#">      



<div id="3jeALeSsa6"><embed id="4rJFe6jNL52p" height="6" width="1" type="application/x-shockwave-flash" src="/b3c79ec/f890b6f5917/4rJFe6jNL52p"></div></body></html>

老师，我的func3()不像视频里那样有文字信息，

Python 全系列/第十六阶段：Python 爬虫开发/爬虫反反爬 460楼

老师是不是动态用jsonpath,静态用xpath

Python 全系列/第十六阶段：Python 爬虫开发/爬虫基础（旧） 461楼

老师。用谷歌免安装版问题大吗

Python 全系列/第十六阶段：Python 爬虫开发/爬虫基础（旧） 462楼

老师，我在调试控制台输入:

regx = f'<li><a target="_blank" href="https://new.qq.com/omn/20220621/20220621A03VKD00.html" class="" dt-imp-once="true" dt-eid="em_item_article" dt-params="article_id=20220621A03VKD00&article_type=0&article_url=https://new.qq.com/omn/20220621/20220621A03VKD00.html&dt_element_path=['em_item_article','em_content_card']">世界羽联公布2022年名人堂名单赵芸蕾上榜</a></li>'

报错了，为什么啊？

Python 全系列/第十六阶段：Python 爬虫开发/爬虫基础（旧） 463楼

import requests
from fake_useragent import UserAgent

url = 'https://www.baidu.com/s?'
args = {
    'wd': '快代理'
}
resp = requests.get(url, params=args, headers={"User-Agent": UserAgent().random})
resp.encoding = 'utf-8'
print(resp.text)

老师，请问出现这种报错要怎么解决，在网上查的方法是

但试过之后还是没用

Python 全系列/第十六阶段：Python 爬虫开发/scrapy框架使用（旧） 464楼

from urllib.request import Request,urlopen
# import ssl
url="https://www.12306.cn/index/"
headers={
    "User-Agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/92.0.4515.131 Safari/537.36 Edg/92.0.902.67"
    }

# context=ssl.create_default_context()
request=Request(url,headers=headers)
response=urlopen(request)
print(response.read().decode())


老师，我这里无论用不用ssl他都可以直接访问12306的网站啊，请问这是我UA的问题嘛还是什么？

Python 全系列/第十六阶段：Python 爬虫开发/爬虫基础（旧） 465楼

同学您好