会员可以在此提问,百战程序员老师有问必答
对大家有帮助的问答会被标记为“推荐”
看完课程过来浏览一下别人提的问题,会帮你学得更全面
截止目前,同学们一共提了 132390个问题
JAVA 全系列/第五阶段:JavaWeb开发/Servlet技术详解(旧) 10531楼

Desktop.zip

老师,我花了一个小时写了一个模仿技能释放的,能帮我看看有没有什么没有考虑到的吗。

WEB前端全系列/第二阶段:JavaScript编程模块/DOM模型 10532楼
Python 全系列/第二阶段:Python 深入与提高/GUI编程(隐藏) 10536楼
JAVA 全系列/第二阶段:JAVA 基础深化和提高/IO 流技术(旧) 10541楼
Python 全系列/第二阶段:Python 深入与提高/GUI编程(隐藏) 10542楼

代码:

mport requests
from bs4 import BeautifulSoup
from fake_useragent import UserAgent
from time import sleep
def get_url(url):
    proxies={"http":"http://61.135.155.82:443"}
    headers={"User-Agent":UserAgent().random}
    # sleep(2)
    resp=requests.get(url,headers=headers,proxies=proxies,timeout=5)
    resp.encoding="utf-8"
    if resp.status_code==200:
        return resp.text
    else:
        return None
def parse_list(html):
    soup=BeautifulSoup(html,'lxml')
    movie_list=["http://maoyan.com{}".format(a.get('href')) for a in soup.select('dl[class="movie-list"] dd>div[class="movie-item film-channel"]>a')]
    return movie_list
def parse_index(html):
    soup=BeautifulSoup(html,'lxml')
    title=soup.select('div[class="movie-brief-container"]>h1')
    # type=soup.select('div[class="movie-brief-container"]>ul>li>a')
    print(title[0].text)
    # print(type[0].text)
def main():
    url="https://maoyan.com/films?showType=3&offset=0"
    html=get_url(url)
    movie_list=parse_list(html)
    for url in movie_list:
        # print(url)
        html=get_url(url)
        parse_index(html)
if __name__=="__main__":
    main()

运行结果:

屏幕截图 2021-03-11 073945.png

老师请问一下,为什么我的程序timeout错误,网上说要设置一个timeout时间,我设置了一个timeout=5可是还是报错,请问这是什么原因?麻烦老师帮我看一下

Python 全系列/第十五阶段:Python 爬虫开发/爬虫反反爬- 10543楼
WEB前端全系列/第四阶段:BootStrap框架模块/BootStrap组件 10544楼
JAVA 全系列/第六阶段:项目管理与SSM框架/Mybatis 10545楼

课程分类

百战程序员微信公众号

百战程序员微信小程序

©2014-2025百战汇智(北京)科技有限公司 All Rights Reserved 北京亦庄经济开发区科创十四街 赛蒂国际工业园
网站维护:百战汇智(北京)科技有限公司
京公网安备 11011402011233号    京ICP备18060230号-3    营业执照    经营许可证:京B2-20212637