有效沟通问答-【官方】百战程序员_IT在线教育培训机构

JAVA 全系列

Python 全系列

Python入门

Python 深入与提高

AIGC人工智能工具全能班

Stable Diffusion（自选模型）AI绘图

大模型全系列

【AI科普】深入浅出人工智能

【AI理论】提示词工程：高效对话与优化技巧

【职场AI】AI在职场中的高效应用场景

【办公AI】DeepSeek接入办公工具实战

【工作流】Coze视频工作流

【Python入门】零基础快速掌握Python编程

【Java入门】从零开始学Java：基础到实践

【企业实战】如何在项目中集成智能聊天机器人

【AI社交】在微信中接入DeepSeek打造AI女友

【大模型框架】LangChain 与基于RAG构建医疗问答系统

【AI助手与数据可视化】Assistants 与 Streamlit

【大模型本地部署与微调】训练属于你的Deepseek

【编程探秘】解锁AI智能编程工具奥秘

【图像绘图】走进Midjourney图像AI绘图世界

【模绘解析】洞悉Stable Diffusion（自选模型）AI绘图原理

大厂算法特训班

C++特训班

鸿蒙应用开发

大数据全系列

Hadoop 分布式计算MapReduce和资源管理Yarn

人工智能

人工智能基础-Python科学计算和可视化

深度学习-目标检测YOLO(V8正在更新中)实战

微服务

SpringBoot与MybatisPlus

Spring Cloud Alibaba技术栈

租房网（Spring Cloud最新架构）

软件测试全系列

Java编程基础和Java Web开发基础

7u职场软实力

毕设项目

软考中级

软考初级

ROS2机器人开发

计算机考研408

百战万词考研英语

考研英语7000词汇精讲1（1-1000）

考研英语7000词汇精讲2（1000-2000）

考研英语7000词汇精讲3（2000-3000）

考研英语7000词汇精讲4（3000-4000）

考研英语7000词汇精讲5（4000-5000）

考研英语7000词汇精讲6（5000-6000）

考研英语7000词汇精讲7（6000以上）

英文原版报刊选题：《经济学人》选题

英文原版报刊选题：《纽约时报》选题

英文原版报刊选题：《自然nature》选题

英文原版报刊选题：《时代周刊times》选题

英文原版教材：《柏拉图：理想国，西方哲学源头》

考研英语

考研政治

会员可以在此提问，百战程序员老师有问必答

对大家有帮助的问答会被标记为“推荐”
看完课程过来浏览一下别人提的问题，会帮你学得更全面

截止目前，同学们一共提了 133059个问题

时间排序推荐排序

没有验证码跟课堂上不一样

Python 全系列/第十四阶段：Python 爬虫开发/爬虫反反爬 346楼

老师：

selenium 教学文档在哪里，本章下载资料没有喔？/

Python 全系列/第十四阶段：Python 爬虫开发/爬虫反反爬- 347楼

selenium webdriver

driver webdriver.()
url driver.(url)
driver.().()
driver.().()

补充一下：老师这是我第二个问题写的代码，出现的问题是click这一行代码它报错了

Python 全系列/第十四阶段：Python 爬虫开发/爬虫反反爬- 348楼

老师，上传的资料里没有mongo的资料，麻烦上传一下吧！

Python 全系列/第十四阶段：Python 爬虫开发/爬虫数据存储 349楼

老师，macOS下载夜神模拟器后没有夜神多开器，要怎么安装安卓5呢

Python 全系列/第十四阶段：Python 爬虫开发/移动端爬虫开发- 350楼

from selenium import webdriver

driver = webdriver.Chrome()
url = 'https://www.google.com/'
driver.get(url)
# 输入要搜索的内容
driver.find_element_by_xpath('//input[@type="text"]').send_keys('python')
# 点击搜索按钮
driver.find_element_by_xpath('//input[@value="Google 搜索"]').click()

Python 全系列/第十四阶段：Python 爬虫开发/爬虫反反爬- 351楼

import scrapy

class XiaoshuoSpider(scrapy.Spider):
    name = "xiaoshuo"
    allowed_domains = ["zhhbqg.com"]
    start_urls = ["https://www.bqgui.cc/book/108732/1.html"]

    def parse(self, response):
        # 章节名称
        title = response.xpath('//h1/text()').extract_first()
        # 章节内容
        content = response.xpath('//div[@id="chaptercontent"]/text()').extract()
        # 下一章链接
        next_btn = response.xpath('//a[@id="pb_next"]/@href').get()

        yield {
            "title": title,
            "content": content
        }
        yield scrapy.Request('https://www.bqgui.cc'+next_btn, callback=self.parse)

# Define your item pipelines here
#
# Don't forget to add your pipeline to the ITEM_PIPELINES setting
# See: https://docs.scrapy.org/en/latest/topics/item-pipeline.html

# useful for handling different item types with a single interface
from itemadapter import ItemAdapter

class Scrapy06Pipeline:
    def open_spider(self, spider):
        self.file = open('xiaoshuo.txt', 'w', encoding='utf-8')

    def process_item(self, item, spider):
        self.file.write(item['title'] + '\n')
        self.file.write(''.join(item['content']) + '\n\n\n')
        return item

    def close_spider(self, spider):
        self.file.close()

下一章功能没有实现，只能爬取第一章，这是为什么呢？

Python 全系列/第十四阶段：Python 爬虫开发/scrapy框架使用 352楼

我准备爬取 https://m.lread.net的一本小说，这小说有时候一个章节分了两页html。我如何将第二页的内容与前一页内容合并，保存到csv文件里？

#pipelines.py
import csv
class RuanyunPipeline(object):
    def __init__(self):
        self.filename= open('douluodalu.csv','w',newline="",encoding='utf-8')
        self.writer=csv.writer(self.filename)
        self.writer.writerow(['title','url_next','content'])
    def process_item(self, item, spider):
        if '-' not in item['url_now']:
            self.writer.writerow([item['title'],item['url_now'],item['content']])
        else :
            self.writer.writerow([item['title'],item['url_now'],item['content']])
        return item
    def close_spider(self,spider):
        if self.filename:
            self.filename.close()

ruanyun.zip

Python 全系列/第十四阶段：Python 爬虫开发/移动端爬虫开发- 353楼

Python 全系列/第十四阶段：Python 爬虫开发/Python爬虫基础与应用 354楼

老师这个是怎么回事？我明明已经安装好了whois了的，在cmd下能正常打印出信息，我已经将python-whois模块导入到pycharm里面了。

Python 全系列/第十四阶段：Python 爬虫开发/爬虫基础（旧） 355楼

你好，老师，我按照源代码写了一边爬虫，但是没收到数据，控制台也没有报错，看打印好像说是没有items，但是对比源代码找不到不一样的地方，我把源代码上传了上去，请老师帮我看看

lianjia11.rar

Python 全系列/第十四阶段：Python 爬虫开发/动态数据抓取 356楼

老师，手机验证码应该如何处理，还有那个滑块验证的应该如何处理

Python 全系列/第十四阶段：Python 爬虫开发/爬虫反反爬- 357楼

import requests
from fake_useragent import UserAgent
# from urllib.error import URLError
import os
def get_header():
    location = os.getcwd() + '/fake_useragent.json'
    ua = UserAgent(path=location)
    return ua.random
url = "https://www.qiushibaike.com/text/"
headers = {
    "User-Agent":get_header()
}
resp = requests.get(url,headers=headers)
print(resp.text)

老师，按照视频中爬取，但是这一段是没有被爬下来的，老师，是代码有问题吗？麻烦老师看一下

Python 全系列/第十四阶段：Python 爬虫开发/爬虫反反爬- 358楼

每次元素还没加载完成就退出了，用sleep强制等待才行

Python 全系列/第十四阶段：Python 爬虫开发/爬虫反反爬 359楼

conda怎末下载11111111111111111111111111111111111111111111

Python 全系列/第十四阶段：Python 爬虫开发/Python爬虫基础与应用 360楼

同学您好