老师,你好,在User-Agent那里,可以导入fake_useragent模块然后random一下吗
老师,这个是不是不能在win10家庭版来安装啊,只能在专业版上啊
起初报错说我端口决绝访问,我直接改成了0.0.0.0 然后这个错误:builtins.ValueError: unsupported pickle protocol: 5
尝试了好多办法都不行,还是提示ModuleNotFoundError: No module named '_ctypes'
老师,您看这是什么错误,怎么解决呀???
想要获取的网址:
https://www.nasdaq.com/market-activity/stocks/aapl/historical#.UWdnJBDMhHk
使用urllib爬取数据,用ajax抓取不到数据
"""获得动态数据""" from urllib.request import Request, urlopen url = 'https://api.nasdaq.com/api/quote/AAPL/historical?assetclass=stocks&fromdate=2021-03-11&limit=18&todate=2021-04-11' headers = { "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/89.0.4389.90 Safari/537.36" } req = Request(url, headers=headers) # 发送请求 resp = urlopen(req) # 用info 接受响应 info = resp.read().decode() print(info)
请老师指教,不要用Selenium爬取数据,用urllib爬取数据
老师你好,我想暗搓搓地问一个不是本节课的知识点,就是VScode怎么设置可以使得输入main可以提示if __name__ == "__main__",我pycharm可以提示但是VScode不行。
找不到错误,就是无法修改图片名称
bizhi.zip
老师,你好!对于在谷歌浏览器上安装扩展程序,我的电脑出现下面情况,不知道怎么解决,试过卸载浏览器重新下载,还是不行
webdriver中的这些参数都是干什么的? 具体什么情况 下需要使用那些???
讲的有点少了吧? 爬取视频的方法呢?有些网站的视频链接不是很明显的,那应该怎么操作呢?这就是讲了最基本的爬取明显的网站的东西吧?
这边的课上的笔记怎么没有了呢。。。???
from fake_useragent import UserAgent import requests from lxml import etree #解析库 def get_html(url): ''' param url:要爬取的地址 return:返回html ''' headers={"User-Agent":UserAgent().chrome} resp=requests.get(url,headers=headers) #发送请求 if resp.status_code ==200: resp.encoding='utf-8' #设置字符集 return resp.text else: return None def parse_list(html): ''' param url:传递进来一个有电影列表的html return:返回一个电影列表的url ''' # if html: #html在有值的情况下在做解析 e=etree.HTML(html) list_url=['http://maoyan.com{}'.format(url) for url in e.xpath('//div[@class="movie-item-hover"]/a/@href')] return list_url def pares_index(html): ''' param url:传递进来一个有电影具体信息的html return:提取好的电影具体信息 ''' e = etree.HTML(html) name = e.xpath('//h1[@class="name"]/text()') type = e.xpath('//li[@class="ellipsis"][1]/a/text()') content = e.xpath('//span[@class="dra"]/text()') return {"name":name,"type":type,"content":content} # actors=e.xpath('') # actors=format_data(actors) # 有重复的演员名字,需要去重 # def format_data(actors): # actor_set=set() # for actor in actors: # actor_set.add(actor.strip()) #strip去空格 # return actor_set def main(): '''控制上述方法的实施,分配相应的url''' num = int(input('请输入多少页:')) for page in range(num): url="https://maoyan.com/films?showType=1&offset={}".format(page*30) list_html=get_html(url) #发送请求 list_url=parse_list(list_html) #解析list_html,返回list_url每个电影的信息 for url in list_url: info_html=get_html(url) movie = pares_index(info_html) print(movie) if __name__ =='__main__': main()
老师,这个代码只运行到请输入多少页,然后就运行结束了。哪里出错了?
老师,为什么用F12看返回的是中文,用requests返回的是英文
import requests from fake_useragent import UserAgent url = "https://wmswxtest.saikul.com/sk-ep/oauth/token" headers = {"User-Agent":UserAgent().random} data = { "scope": "select", "grant_type": "password", "username": "ceshi", "password": "6666", "client_id": "client_2", "client_secret": "6666"} resp = requests.post(url,headers=headers,data=data) resp.encoding = "utf-8" print(resp.text)
不知道老师,有没有解决验证的好办法,分享一下
非常抱歉给您带来不好的体验!为了更深入的了解您的学习情况以及遇到的问题,您可以直接拨打投诉热线:
我们将在第一时间处理好您的问题!
关于
课程分类
百战程序员微信公众号
百战程序员微信小程序
©2014-2025百战汇智(北京)科技有限公司 All Rights Reserved 北京亦庄经济开发区科创十四街 赛蒂国际工业园网站维护:百战汇智(北京)科技有限公司 京公网安备 11011402011233号 京ICP备18060230号-3 营业执照 经营许可证:京B2-20212637