会员可以在此提问，百战程序员老师有问必答

对大家有帮助的问答会被标记为“推荐”
看完课程过来浏览一下别人提的问题，会帮你学得更全面

截止目前，同学们一共提了 133940个问题

老师，安装上virtualenvwrapper虚拟环境，怎么在导航栏没找到配置的视频上出现的那个虚拟环境的配置

Python 全系列/第十六阶段：Python 爬虫开发/爬虫基础（旧） 601楼

老师爬虫工程师需要掌握哪些东西，这个方面的工作

Python 全系列/第十六阶段：Python 爬虫开发/爬虫基础（旧） 602楼

爬取下来为Unicode编码的兄弟们，可以加上

resp.encoding = 'utf-8'

来改变解码方式

Python 全系列/第十六阶段：Python 爬虫开发/爬虫基础（旧） 603楼

老师为啥我这个Tomcat里面啥命令也没有，没有像视频中一样可以显示IP地址

Python 全系列/第十六阶段：Python 爬虫开发/docker 容器扩展（旧） 604楼

因为

是post请求所以

然后我就把data传了进去

from urllib.request import  urlopen,Request
from urllib.parse import urlencode
from fake_useragent import UserAgent
url='http://ynuf.aliapp.org/service/um.json'
us=UserAgent(path='D:/地址/fake_useragent.json')
heads={
    'User-Agent':us.chrome
}
n={
    'data':'106!7mumc0clNbmcvtLXjmEzz838NyROP5D17c0+xKUUz+Htnc6352am21WSjWFgm+HmnrIV+Ohj+KNy5vUTih8mqqwuWlaqFJUXw8fQ2zRPG1dGW4T9aPEvHT01O4rkysYJqfM8bdThPTOrlr27m+7zdbS4RnC0yY3JfCeL74FsPy/JDuaUE0lWs+eU0M8Hs+IsggkIfItP3eS7JGUOfTsKsPoU5u88s+eAmthkl+9zPQxC+OF/wo535MXLXs4YAELMptVBc9N6yj4WZGeHvct8ASF8UwJUncf0KQ7e4Bar6RJ+rClbcD7WKnm5B5Sp76LwgTHlhbM8caJEPQyGXGeYIU1FjExzDIRnA20wCCqFSinYDxjlWVYqMo1u7G1i03RXtuLpKcTJrwEJWOAxcge9saHfNWcWw4d4mFGQQkM4noQmytG4U7pm7fbZO7nKr80SsnTgpBe2PE1BOPvFEcpZC8O8+0N5wQiRXzlweCzTe3rUhHFVGkRgn79A8I1AQM8KzkEXsQNDOBA8z5ptZIaOa07cYnn19/BdYmMgH9zjW7pv8XAZFzWHHpsYka7HwQaqgoZVQc1yRisQ6SBsKfxsSUCO'
}
req=Request(url,headers=heads,data=urlencode(n).encode())
op=urlopen(req)
print(op.read().decode())
print(op.getcode())

这个是结果

它返回了一个字典给我，该如何更改才能显示html代码界面呢

Python 全系列/第十六阶段：Python 爬虫开发/爬虫基础（旧） 605楼

因为

是post请求所以

然后我就把data传了进去

from urllib.request import  urlopen,Request
from urllib.parse import urlencode
from fake_useragent import UserAgent
url='http://ynuf.aliapp.org/service/um.json'
us=UserAgent(path='D:/地址/fake_useragent.json')
heads={
    'User-Agent':us.chrome
}
n={
    'data':'106!7mumc0clNbmcvtLXjmEzz838NyROP5D17c0+xKUUz+Htnc6352am21WSjWFgm+HmnrIV+Ohj+KNy5vUTih8mqqwuWlaqFJUXw8fQ2zRPG1dGW4T9aPEvHT01O4rkysYJqfM8bdThPTOrlr27m+7zdbS4RnC0yY3JfCeL74FsPy/JDuaUE0lWs+eU0M8Hs+IsggkIfItP3eS7JGUOfTsKsPoU5u88s+eAmthkl+9zPQxC+OF/wo535MXLXs4YAELMptVBc9N6yj4WZGeHvct8ASF8UwJUncf0KQ7e4Bar6RJ+rClbcD7WKnm5B5Sp76LwgTHlhbM8caJEPQyGXGeYIU1FjExzDIRnA20wCCqFSinYDxjlWVYqMo1u7G1i03RXtuLpKcTJrwEJWOAxcge9saHfNWcWw4d4mFGQQkM4noQmytG4U7pm7fbZO7nKr80SsnTgpBe2PE1BOPvFEcpZC8O8+0N5wQiRXzlweCzTe3rUhHFVGkRgn79A8I1AQM8KzkEXsQNDOBA8z5ptZIaOa07cYnn19/BdYmMgH9zjW7pv8XAZFzWHHpsYka7HwQaqgoZVQc1yRisQ6SBsKfxsSUCO'
}
req=Request(url,headers=heads,data=urlencode(n).encode())
op=urlopen(req)
print(op.read().decode())
print(op.getcode())

这个是结果

它返回了一个字典给我，该如何更改才能显示html代码界面呢

Python 全系列/第十六阶段：Python 爬虫开发/爬虫基础（旧） 606楼

老师这是啥意思呀 安装了 用不了，pip install  和 pip3 install  都安装了 都不行

Python 全系列/第十六阶段：Python 爬虫开发/爬虫基础（旧） 607楼

为啥我的报这个路径错误，明明弄了这个ANDROID_HOME路径了，百度了一下说，appium的环境变量没有配置

这个页面怎么打开

Python 全系列/第十六阶段：Python 爬虫开发/移动端爬虫开发- 608楼

from my_fake_useragent import UserAgent
from bs4 import  BeautifulSoup
from time import sleep
import requests

url = 'https://maoyan.com/films/1218188'
headers = {"User_Agent":UserAgent().random()}
proxies = {"http":"http://175.155.71.22:1133"}
resp  = requests.get(url,headers=headers,proxies=proxies)
resp.encoding='utf-8'

soup = BeautifulSoup(resp.text,'lxml')
name = soup.select('h1.name')[0].text #电影名
ename = soup.select('div.ename')[0].text #英文名
type = soup.select('li.ellipsis>a')[0].text #电影类型
director = soup.select('li.celebrity > div >a')[0].text #导演
actors = soup.select('li.celebrity actor>a') #演员
intor = soup.select('span.dra')
actor_set = set()
for actor in actors:
    print(actor.text.stirp())
print(name,ename,type,director,intor)

老师我这是爬取猫眼电影的你好李焕英，我的IP被禁止访问，我用了代理也不行，我试了多个免费高匿代理，还是不行，老师帮我看看，是我代码有问题吗？

Python 全系列/第十六阶段：Python 爬虫开发/爬虫基础（旧） 609楼

老师我这个该怎么解决，把user换成图片中的就有用，写成代码中的就没用

Python 全系列/第十六阶段：Python 爬虫开发/爬虫基础（旧） 610楼

老师我这个该怎么解决，把user换成图片中的就有用，写成代码中的就没用

Python 全系列/第十六阶段：Python 爬虫开发/爬虫基础（旧） 611楼

老師不知道爲什麽輸出的亂碼

from my_fake_useragent import UserAgent
from bs4 import  BeautifulSoup
from time import sleep
import requests

url = 'https://maoyan.com/films/1299372'
header = {'User_Agent':UserAgent().random()}
resp  = requests.get(url,headers=header)

soup = BeautifulSoup(resp.text,'lxml')


print(soup.find_all("a"))

Python 全系列/第十六阶段：Python 爬虫开发/爬虫基础（旧） 612楼

老师为啥按操作，准备操作弄完之后显示这样呢

Python 全系列/第十六阶段：Python 爬虫开发/爬虫反反爬- 613楼

老师，我按照要求配置，还是显示

python selenium模块使用出错解决，Message: 'geckodriver' executable needs to be in PATH

Python 全系列/第十六阶段：Python 爬虫开发/爬虫基础（旧） 614楼

# _*_coding=utf-8 _*_
from time import sleep

import requests
from fake_useragent import UserAgent
from selenium import webdriver
from selenium.webdriver.support.wait import WebDriverWait
from selenium.webdriver.support import expected_conditions as ec
from selenium.webdriver.common.by import By
from huadong import distance, track


def save_img():
    url = 'https://www.sf-express.com/cn/sc/dynamic_function/waybill/#search/bill-number/SF1406050054883'
    chrome = webdriver.Chrome()
    chrome.get(url)
    wait = WebDriverWait(chrome, 5)

    try:
        wait.until(ec.presence_of_element_located((By.ID, 'tcaptcha_popup')))
        # 切换窗口
        chrome.switch_to_frame('tcaptcha_popup')
        # 获取图片
        img = chrome.find_element_by_id('slideBkg')
        img_src = img.get_attribute('src')[:-1]
        # 下载图片
        download_img(img_src + '1', 'ctp1.png')
        download_img(img_src + '2', 'ctp2.png')
        # 获取滑动的距离
        tmp_distance = distance.get_long()
        # 生成滑动轨迹
        tk = track.get_track(tmp_distance-12)
        # 滑动按钮
        # 选中按钮
        button = chrome.find_element_by_id('tcaptcha_drag_button')
        webdriver.ActionChains(chrome).click_and_hold(button).perform()
        # 按轨迹滑动按钮
        for t in tk:
            webdriver.ActionChains(chrome).move_by_offset(xoffset=t,yoffset=0).perform()
        # 释放按钮
        webdriver.ActionChains(chrome).release().perform()
        # 休眠2秒
        sleep(2)
        chrome.quit()
    except Exception as e:
        print(e)
        chrome.quit()


def download_img(url, filename):
    # print(url)
    headers = {
        'User-Agent': UserAgent().chrome
    }
    resp = requests.get(url, headers=headers)

    with open(f'./imgs/{filename}', 'wb') as f:
        f.write(resp.content)


if __name__ == '__main__':
    save_img()

老师为啥报这个错误，，路径啥的都对啊

Python 全系列/第十六阶段：Python 爬虫开发/爬虫反反爬- 615楼

python selenium模块使用出错解决，Message: 'geckodriver' executable needs to be in PATH

同学您好