有效沟通问答-【官方】百战程序员_IT在线教育培训机构

JAVA 全系列

Python全系列

职业规划/学习方法

AI驱动的Python编程

大模型入门和应用

【AI理论】提示词工程：高效对话与优化技巧

【职场AI】AI在职场中的高效应用场景

【办公AI】DeepSeek接入办公工具实战

【工作流】Coze视频工作流

【Python入门】零基础快速掌握Python编程

【Java入门】从零开始学Java：基础到实践

【企业实战】如何在项目中集成智能聊天机器人

【AI社交】在微信中接入DeepSeek打造AI女友

【大模型框架】LangChain 与基于RAG构建医疗问答系统

【AI助手与数据可视化】Assistants 与 Streamlit

【大模型本地部署与微调】训练属于你的Deepseek

【编程探秘】解锁AI智能编程工具奥秘

【图像绘图】走进Midjourney图像AI绘图世界

【模绘解析】洞悉Stable Diffusion（自选模型）AI绘图原理

WEB前端全系列

大厂算法特训班

C++特训班

鸿蒙应用开发

大数据全系列

Hadoop 分布式计算MapReduce和资源管理Yarn

人工智能

人工智能基础-Python科学计算和可视化

微服务

SpringBoot与MybatisPlus

Spring Cloud Alibaba技术栈

租房网（Spring Cloud最新架构）

软件测试全系列

Java编程基础和Java Web开发基础

7u职场软实力

毕设项目

软考中级

软考初级

ROS2机器人开发

计算机考研408

百战万词考研英语

考研英语7000词汇精讲1（1-1000）

考研英语7000词汇精讲2（1000-2000）

考研英语7000词汇精讲3（2000-3000）

考研英语7000词汇精讲4（3000-4000）

考研英语7000词汇精讲5（4000-5000）

考研英语7000词汇精讲6（5000以上）

英文原版报刊选题：《经济学人》选题

英文原版报刊选题：《纽约时报》选题

英文原版报刊选题：《自然nature》选题

英文原版报刊选题：《时代周刊times》选题

英文原版教材：《柏拉图：理想国，西方哲学源头》

考研英语

考研政治

AI Agent智能体开发大厂孵化器

会员可以在此提问，百战程序员老师有问必答

对大家有帮助的问答会被标记为“推荐”
看完课程过来浏览一下别人提的问题，会帮你学得更全面

截止目前，同学们一共提了 134310个问题

时间排序推荐排序

老师我运行的时候得到了 <Element html at 0x276ac8e2400> 这个而我真正想得到的是文字这个怎么办

Python全系列/第十六阶段：Python 爬虫开发/爬虫反反爬- 931楼

有一个小问题如果爬取过程中遇到这样的就是一段话没说完需要再深一层的点进去之后有分页的应该怎么爬取

Python全系列/第十六阶段：Python 爬虫开发/爬虫反反爬- 932楼

untitled8.zip

mongo 不会保存并且能成功，但是mysql会报错

Python全系列/第十六阶段：Python 爬虫开发/爬虫数据存储 933楼

untitled8.zip

老师我找了好久也不知道为啥报错，他没有改名成功，但是图片能成功下载

Python全系列/第十六阶段：Python 爬虫开发/scrapy 框架高级 934楼

image.zip

报了这个错误没有scrap有。contrib这个模块？？？

前面项目都可以运行这个运行不了模块应该都装了

Python全系列/第十六阶段：Python 爬虫开发/scrapy 框架高级 935楼

老师怎么去除红色里面的文字

如果不去掉得的的内容是这样的

Python全系列/第十六阶段：Python 爬虫开发/移动端爬虫开发- 936楼

untitled8.zip

控制台并未输出百度网页的html信息

Python全系列/第十六阶段：Python 爬虫开发/移动端爬虫开发- 937楼

老师我这个程序报了这个错误，怎么解决

23.猫眼电影1.zip

Python全系列/第十六阶段：Python 爬虫开发/爬虫反反爬- 938楼

没学Django 和 Tornado框架可以学这个和后面的阶段的内容的吗？

Python全系列/第十六阶段：Python 爬虫开发/爬虫基础（旧） 939楼

老师，我用的是火狐浏览器，我已经安装了selenium包，把火狐对应的driver也放到了Python环境中，可是却不能运行代码

Python全系列/第十六阶段：Python 爬虫开发/爬虫反反爬- 940楼

老师，请问爬取页面之前，我们如何就能判断一个网站是动态渲染页面还是静态渲染页面？还是只能看它爬取之后的response.text的结果判断？

Python全系列/第十六阶段：Python 爬虫开发/动态数据抓取 941楼

为什么老师说的话，和屏幕上显示的东西不一样啊，感觉说的快，写的慢

Python全系列/第十六阶段：Python 爬虫开发/scrapy框架使用（旧） 942楼

老师，本节中，爬取小说，其实小说网址已经换了，里面的标签内容也和视频中不一样，我的思路是，先爬取首页，从首页中提取所有小说章节中的url，然后重新yield Request（url）中（按顺序添加的）让他重新爬取与重新解析，但是爬下来的小说章节保存在文件中都是乱

scrapy爬取小说.zip

序的，求解！

Python全系列/第十六阶段：Python 爬虫开发/移动端爬虫开发- 943楼

from urllib.request import Request,urlopen
import re

def get_html(url):
    headers = {
        'User-agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.25 Safari/537.36 Core/1.70.3756.400 QQBrowser/10.5.4039.400'
                      'X-CSRF-Token: 0Jq5gyy1OYDW0iKKdDCnieaIPQoxCLHg'}
    req = Request(url, headers=headers)

    res = urlopen(req)
    return res.read().decode()

def save_html(html,filename):
    pattern = r'<div class="content">\s*<span>\s*(.+)<span>'
    v=re.findall(pattern,html)
    with open(filename, 'w', encoding='utf-8') as f:
        # f.write(html)
        for i in v:
            f.write('\t'+i+'\n\n')

def main(i,m):
    url = 'https://www.qiushibaike.com/text/{}'.format(i)
    html=get_html(url)

    filename = '第' + str(m+3) + '页段子.html'
    save_html(html, filename)


if __name__ == '__main__':
    p_list=['','page/2/','page/3/']
    m = 1
    for i in p_list:
        main(i,m)
        m+=1

Python全系列/第十六阶段：Python 爬虫开发/爬虫反反爬- 944楼

里边的换行符可以去掉吗我用的中文办法，但是去不掉换行符，视频方法也不行

Python全系列/第十六阶段：Python 爬虫开发/爬虫反反爬- 945楼

同学您好