会员可以在此提问,百战程序员老师有问必答
对大家有帮助的问答会被标记为“推荐”
看完课程过来浏览一下别人提的问题,会帮你学得更全面
截止目前,同学们一共提了 132358个问题
Python 全系列/第十五阶段:Python 爬虫开发/scrapy框架使用 346楼
Python 全系列/第五阶段:数据库编程/python操作mysql 347楼
Python 全系列/第三阶段:Python 网络与并发编程/网络通信 348楼
Python 全系列/第八阶段:轻量级Web开发利器-Flask框架/Flask视图基础和URL 349楼

发现有的皮肤名字是带着\\的,保存不到文件夹中,下面是改进的版本:

import requests

from fake_useragent import UserAgent

from urllib.request import urlretrieve

from os import makedirs, path

from time import sleep


def ensure_directory_exists(directory):

    if not path.exists(directory):

        makedirs(directory)


def sanitize_filename(filename):

    # 将文件名中的特殊字符替换为下划线

    return filename.replace(" ", "_").replace("/", "_").replace("\\", "_")


def get_hero_img(hero_id=1, hero_name=""):

    url = f'https://game.gtimg.cn/images/lol/act/img/js/hero/{hero_id}.js'

    headers = {'User-Agent': UserAgent().chrome}

    resp = requests.get(url, headers=headers)

   

    hero_dir = path.join('./_反爬和反反爬/imgs/lolskin', sanitize_filename(hero_name))

    ensure_directory_exists(hero_dir)


    for sk in resp.json().get('skins', []):

        if sk.get("mainImg"):

            print(f'皮肤名:{sk.get("name")}    皮肤下载地址: {sk.get("mainImg")}')

            img_filename = sanitize_filename(sk.get("name")) + '.jpg'

            img_path = path.join(hero_dir, img_filename)

            urlretrieve(sk.get("mainImg"), filename=img_path)

            sleep(0.5)


# ...(其余代码保持不变)


def get_hero_list():

    url = 'https://game.gtimg.cn/images/lol/act/img/js/heroList/hero_list.js'

    headers = {'User-Agent': UserAgent().chrome}

    resp = requests.get(url, headers=headers)

   

    for h in resp.json().get('hero', []):

        hero_id = h.get('heroId')

        hero_name = h.get('name')

        yield (hero_id, hero_name)


if __name__ == '__main__':

    for hero_id, hero_name in get_hero_list():

        print(f'=========正在下载的: 英雄名:{hero_name}')

        get_hero_img(hero_id, hero_name)

        print(f'=====下载完成:英雄:{hero_name}')


Python 全系列/第十五阶段:Python 爬虫开发/爬虫反反爬 350楼

以下更改之后可以保存到相应英雄名的文件夹:

import requestsfrom fake_useragent import UserAgentfrom urllib.request import urlretrievefrom os import makedirs, pathfrom time import sleepdef ensure_directory_exists(directory):    """确保目录存在,如果不存在则创建"""    if not path.exists(directory):        makedirs(directory)def get_hero_img(hero_id=1, hero_name=""):    url = f'https://game.gtimg.cn/images/lol/act/img/js/hero/{hero_id}.js'    headers = {'User-Agent': UserAgent().chrome}    resp = requests.get(url, headers=headers)        hero_dir = f'./_反爬和反反爬/imgs/lol/{hero_name.replace(" ", "_")}'    ensure_directory_exists(hero_dir)    for sk in resp.json().get('skins', []):        if sk.get("mainImg"):            print(f'皮肤名:{sk.get("name")}    皮肤下载地址: {sk.get("mainImg")}')            img_filename = path.join(hero_dir, f'{sk.get("name").replace(" ", "_")}.jpg')            urlretrieve(sk.get("mainImg"), filename=img_filename)            sleep(1)def get_hero_list():    url = 'https://game.gtimg.cn/images/lol/act/img/js/heroList/hero_list.js'    headers = {'User-Agent': UserAgent().chrome}    resp = requests.get(url, headers=headers)        for h in resp.json().get('hero', []):        hero_id = h.get('heroId')        hero_name = h.get('name')        yield (hero_id, hero_name)if __name__ == '__main__':    for hero_id, hero_name in get_hero_list():        print(f'=========正在下载的: 英雄名:{hero_name}')        get_hero_img(hero_id, hero_name)        print(f'=====下载完成:英雄:{hero_name}')




Python 全系列/第十五阶段:Python 爬虫开发/爬虫反反爬 351楼
Python 全系列/第二阶段:Python 深入与提高/异常机制 355楼
Python 全系列/第二阶段:Python 深入与提高/异常机制 356楼
JAVA 全系列/第六阶段:项目管理与SSM框架/Spring6 357楼
WEB前端全系列/第六阶段:音乐社区高级项目模块/音乐社区项目_蓝莓派 359楼
Python 全系列/第二阶段:Python 深入与提高/文件处理 360楼

课程分类

百战程序员微信公众号

百战程序员微信小程序

©2014-2025百战汇智(北京)科技有限公司 All Rights Reserved 北京亦庄经济开发区科创十四街 赛蒂国际工业园
网站维护:百战汇智(北京)科技有限公司
京公网安备 11011402011233号    京ICP备18060230号-3    营业执照    经营许可证:京B2-20212637