pycharm中怎么点开断点的错误地方code吗 图中红色部分
老师,视频里面的网页版的教程在哪能看到
from fake_useragent import UserAgent import requests from pyquery import PyQuery from time import sleep def get_html(url): headers = {'User-Agent': UserAgent().chrome} resp = requests.get(url, headers=headers) sleep(3) if resp.status_code == 200: resp.encoding = 'utf-8' return resp.text else: return None def get_list(html): pq = PyQuery(html) all_a = pq('div>a[data-act="movies-click"]') return [a.get("href") for a in all_a] def get_index(html): pq = PyQuery(html) # 电影标题 name = pq('h1.name').eq(0).text() # 电影类型 types = pq('a.text-link').eq(0).text() # 参演人员 actors_m = pq('li.celebrity.actor>div>.name') actor = format_actors(actors_m) return f"电影名:{name} \n 类型:{types} \n 演员:{actor} \n" def format_actors(a_list): actors_set = set() for a in a_list: actors_set.add(a.text.strip()) return actors_set def start(): num = int(input("输入获取多少页数据:")) for i in range(num): url = f'https://www.maoyan.com/films?offset={i * 30}' html = get_html(url) # 请求内容 all_href = get_list(html) # 使用PuQuery解析 for a in all_href: url_ = f'https://maoyan.com{a}' index_html = get_html(url_) info = get_index(index_html) print(info) if __name__ == '__main__': start()
老师,每次爬取到第八个的时候总是出错,index超范围,或者这样
老师,每次获取到第八个,都会出错,index超范围之内的
老师你好,我配置环境变量中,输入命令系统没有反应,该怎么办
http类型的ip能访问https 的网页吗?
https类型的IP能访问http的网页吗?
老师我安装python执行export PATH=$PATH:/usr/local/python3/bin/命令怎么没有反应呢?接下里如何配置,如何创建python虚拟机?
请问有讲课老师用的那个文档吗,像前面几章那样 资料都是PDF类型的,方便查看 这种md后缀的不太方便
求同款科学上网工具~~~
老师讲义能发一分么
老师,我为什么按照你的代码敲只爬取一章啊
老师,怎么和视频上不一样,没有打印关于百度的信息
你这个写的代码放在哪里啊。。。。。。。。。。。。。。。。。
老师,之前创建还好好的,现在就不行了,咋回事。
动态数据可以用Xpath么
非常抱歉给您带来不好的体验!为了更深入的了解您的学习情况以及遇到的问题,您可以直接拨打投诉热线:
我们将在第一时间处理好您的问题!
关于
课程分类
百战程序员微信公众号
百战程序员微信小程序
©2014-2025百战汇智(北京)科技有限公司 All Rights Reserved 北京亦庄经济开发区科创十四街 赛蒂国际工业园网站维护:百战汇智(北京)科技有限公司 京公网安备 11011402011233号 京ICP备18060230号-3 营业执照 经营许可证:京B2-20212637