有效沟通问答-【官方】百战程序员_IT在线教育培训机构

会员可以在此提问，百战程序员老师有问必答

对大家有帮助的问答会被标记为“推荐”
看完课程过来浏览一下别人提的问题，会帮你学得更全面

截止目前，同学们一共提了 133940个问题

时间排序推荐排序

老师为啥我set·add. url的时候提示我不可哈希的list，

Python 全系列/第十六阶段：Python 爬虫开发/爬虫反反爬- 61楼

老师，这个地方为什么要采用[]将image_url括起来

Python 全系列/第十六阶段：Python 爬虫开发/scrapy 框架高级 62楼

我通过

pip3 install fake-useragent

下载fake-useragent库的时候一直提示我：error: could not create 'c:\program files\python37\Lib\site-packages\fake_useragent': 拒绝访问。

Python 全系列/第十六阶段：Python 爬虫开发/scrapy框架使用（旧） 63楼

代码可以运行，但结果没出来中文

Python 全系列/第十六阶段：Python 爬虫开发/爬虫基础 64楼

他把图片写到了js里面怎么整

Python 全系列/第十六阶段：Python 爬虫开发/爬虫反反爬 65楼

2024-07-14 14:28:22 [scrapy.extensions.logstats] INFO: Crawled 0 pages (at 0 pages/min), scraped 0 items (at 0 items/min)

2024-07-14 14:28:22 [scrapy.extensions.telnet] INFO: Telnet console listening on 127.0.0.1:6023

2024-07-14 14:28:22 [scrapy.core.engine] DEBUG: Crawled (418) <GET https://bj.lianjia.com/ershoufang/> (referer: None)

2024-07-14 14:28:23 [scrapy.spidermiddlewares.httperror] INFO: Ignoring response <418 https://bj.lianjia.com/ershoufang/>: HTTP status code is not handled or not allowed

老师这是什么意思

Python 全系列/第十六阶段：Python 爬虫开发/scrapy框架使用 66楼

老师，您这个视频比音频快了5秒以上，这也太有压了吧

Python 全系列/第十六阶段：Python 爬虫开发/scrapy 框架高级 67楼

如果某些网址需要登陆之后才能进行下一步，那对应的cookie应该怎么放进去，在哪个位置

Python 全系列/第十六阶段：Python 爬虫开发/移动端爬虫开发- 68楼

# _*_coding=utf-8 _*_
from time import sleep

import requests
from fake_useragent import UserAgent
from selenium import webdriver
from selenium.webdriver.support.wait import WebDriverWait
from selenium.webdriver.support import expected_conditions as ec
from selenium.webdriver.common.by import By
from huadong import distance, track


def save_img():
    url = 'https://www.sf-express.com/cn/sc/dynamic_function/waybill/#search/bill-number/SF1406050054883'
    chrome = webdriver.Chrome()
    chrome.get(url)
    wait = WebDriverWait(chrome, 5)

    try:
        wait.until(ec.presence_of_element_located((By.ID, 'tcaptcha_popup')))
        # 切换窗口
        chrome.switch_to_frame('tcaptcha_popup')
        # 获取图片
        img = chrome.find_element_by_id('slideBkg')
        img_src = img.get_attribute('src')[:-1]
        # 下载图片
        download_img(img_src + '1', 'ctp1.png')
        download_img(img_src + '2', 'ctp2.png')
        # 获取滑动的距离
        tmp_distance = distance.get_long()
        # 生成滑动轨迹
        tk = track.get_track(tmp_distance-12)
        # 滑动按钮
        # 选中按钮
        button = chrome.find_element_by_id('tcaptcha_drag_button')
        webdriver.ActionChains(chrome).click_and_hold(button).perform()
        # 按轨迹滑动按钮
        for t in tk:
            webdriver.ActionChains(chrome).move_by_offset(xoffset=t,yoffset=0).perform()
        # 释放按钮
        webdriver.ActionChains(chrome).release().perform()
        # 休眠2秒
        sleep(2)
        chrome.quit()
    except Exception as e:
        print(e)
        chrome.quit()


def download_img(url, filename):
    # print(url)
    headers = {
        'User-Agent': UserAgent().chrome
    }
    resp = requests.get(url, headers=headers)

    with open(f'./imgs/{filename}', 'wb') as f:
        f.write(resp.content)


if __name__ == '__main__':
    save_img()