有效沟通问答-【官方】百战程序员_IT在线教育培训机构

会员可以在此提问，百战程序员老师有问必答

对大家有帮助的问答会被标记为“推荐”
看完课程过来浏览一下别人提的问题，会帮你学得更全面

截止目前，同学们一共提了 133940个问题

时间排序推荐排序

ASN1.prototype.getHexStringValue = function () {

ReferenceError: ASN1 is not defined

Python 全系列/第十六阶段：Python 爬虫开发/爬虫反反爬 676楼

老师你好，我配置环境变量中，输入命令系统没有反应，该怎么办

Python 全系列/第十六阶段：Python 爬虫开发/scrapy框架使用（旧） 677楼

老师这个软件有中文的吗，英文看不懂

Python 全系列/第十六阶段：Python 爬虫开发/scrapy框架使用（旧） 678楼

这个引进aiohttp为啥显示错误啊

Python 全系列/第十六阶段：Python 爬虫开发/爬虫基础（旧） 679楼

selenium webdriver
selenium.webdriver ActionChains
openpyxl workbook
base_urls = []
shop_names = []
m_names = []
prices = []
com_names = []
offers = []
driver_base(url):
    driver = webdriver.Chrome()
    driver.get(url)
    driver.set_window_size(=, =, =)
    driver.implicitly_wait()
    driver

p_url(driver,shop_page):
    input = driver.find_element_by_id()
    input.send_keys()
    botton = driver.find_element_by_xpath()
    botton.click()
    source = driver.find_element_by_xpath()
    target = driver.find_element_by_class_name()
    actions = ActionChains(driver)
    actions.drag_and_drop(source, target)
    actions.perform()
    base_url_0 = driver.find_elements_by_xpath()
    num (,(base_url_0)):
        base_urls.append(base_url_0[num].get_attribute())
    shop_page != :
        pn_next = driver.find_element_by_class_name()
        pn_next.click()
        shop_page = shop_page - :
            source = driver.find_element_by_xpath()
            target = driver.find_element_by_class_name()
            actions = ActionChains(driver)
            actions.drag_and_drop(source, target).perform()
            base_url_1 = driver.find_elements_by_xpath()
            num (, (base_url_1)):
                base_urls.append(base_url_1[num].get_attribute())
            base_url_1.clear()
        :
            (.format( shop_page))
        :
            (.format(shop_page))
    base_urls_1 = ((base_urls))
    (.format((base_urls_1)), , base_urls_1)
    base_urls_1

p_data(base_urls_1):
    y_num = (base_urls_1)
    href base_urls_1:
        y_num =y_num - (.format(y_num))
        href_driver = webdriver.Chrome()
        href_driver.get(href)
        href_driver.set_window_size(=, =, =)
        :
            shop_name = href_driver.find_element_by_xpath()
            shop_name = shop_name.text
            m_name = href_driver.find_element_by_xpath()
            m_name = m_name.text
            price = href_driver.find_element_by_xpath()
            price = price.text
            com_num = href_driver.find_element_by_xpath()
            com_num = com_num.text
            offer = href_driver.find_element_by_id()
            offer = offer.text
            shop_names.append(shop_name)
            m_names.append(m_name)
            prices.append(price)
            com_names.append(com_num)
            offers.append(offer)
            href_driver.close()
        :
            ()
    :
            save_data(shop_names, m_names, prices, com_names, offers)


save_data(shop_names,m_names,prices,com_names,offers):
    wb = workbook.Workbook()
    ws = wb.active
    ws.append([])
    ws.append([,, , , ,])
    n ((offers)):
        ws.append([n + ,shop_names[n],m_names[n],prices[n],com_names[n],offers[n]])
    wb.save()

__name__ == :
    shop_page = (())
    url = driver = driver_base(url)
    base_urls_1 = p_url(driver,shop_page)
    p_data(base_urls_1)
    driver.close()

Python 全系列/第十六阶段：Python 爬虫开发/爬虫反反爬- 680楼

老师，这个Android5是安装不了软件？

Python 全系列/第十六阶段：Python 爬虫开发/移动端爬虫开发- 681楼

老师，爬取豆瓣电影时，

如果想提高访问效率，limit=20可以改成200，那么前面的start规则是不是也就变了，是不是每次不在增加20了？

Python 全系列/第十六阶段：Python 爬虫开发/爬虫基础（旧） 682楼

界面也不一样

Python 全系列/第十六阶段：Python 爬虫开发/scrapy框架使用（旧） 683楼

老师，分布式的3种写法中，我怎么感觉第一种写法要修改的代码最少，最容易理解，执行效率最高，不需要麻烦的手动lpush操作。其次是第二种写法。至于第三种写法，我怎么感觉crawlspider的方式并不比spider好用

Python 全系列/第十六阶段：Python 爬虫开发/分布式爬虫 684楼

scrapy02.rar

无法获取url

Python 全系列/第十六阶段：Python 爬虫开发/scrapy框架使用（旧） 685楼

老师，我自己的代码和资料里的代码都会出现百度安全验证

这是我的代码

代码1：

from urllib.request import urlopen,Request
from fake_useragent import UserAgent
from urllib.parse import quote
# args = '尚学堂'
# print(quote(args)) #%E5%B0%9A%E5%AD%A6%E5%A0%82 #通过它转换中文、汉字
args = input('请输入要搜索的内容：')
ua = UserAgent()
url = f'https://www.baidu.com/s?wd={quote(args)}'
headers = {
    'User-Agent':ua.chrome
}
req = Request(url,headers = headers)
resp = urlopen(req)
print(resp.read().decode())

Python 全系列/第十六阶段：Python 爬虫开发/爬虫基础（旧） 686楼

Python 全系列/第十六阶段：Python 爬虫开发/scrapy框架使用 687楼

为什么我这里创建成功但是却没有那个页面，不知道问题出在哪里

Python 全系列/第十六阶段：Python 爬虫开发/移动端爬虫开发- 688楼

老师，我自己的代码和资料里的代码都会出现百度安全验证

这是我的代码

代码2：

from urllib.request import urlopen,Request
from fake_useragent import UserAgent
from urllib.parse import urlencode

args = input('请输入要搜索的内容：')
parms = {
    'wd':args
}
# print(urlencode(parms)) #把汉字转换成编码

ua = UserAgent()
# url = f'https://www.baidu.com/s?{urlencode(parms)}'
url = f'http://www.baidu.com/s?ie=utf-8&f=8&rsv_bp=1&rsv_idx=1&tn=baidu&wd=%E5%A4%A9%E6%B0%94&fenlei=256&oq=%25E5%25B0%259A%25E5%25AD%25A6%25E5%25A0%2582&rsv_pq=f7b1202800024f69&rsv_t=be31f9qpyyfaaH6RH8MnYIeBOdXAk6TR5wmyOGLEFbhe13o7aWCkqzMvXBs&rqlang=cn&rsv_enter=1&rsv_dl=tb&rsv_btype=t&rsv_sug3=8&rsv_sug1=6&rsv_sug7=100&rsv_sug2=0&inputT=1987&rsv_sug4=1987'
# print(url)

headers = {
    'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/102.0.5005.63 Safari/537.36 Edg/102.0.1245.39'
}
req = Request(url,headers = headers)
resp = urlopen(req)
print(resp.read().decode())

Python 全系列/第十六阶段：Python 爬虫开发/爬虫基础（旧） 689楼

xiaoshuo.rar

老师，我执行完，只能取到第一章，麻烦帮忙看看什么原因？

Python 全系列/第十六阶段：Python 爬虫开发/移动端爬虫开发- 690楼

同学您好