有效沟通问答-【官方】百战未来_IT在线教育培训机构

会员可以在此提问，百战未来老师有问必答

对大家有帮助的问答会被标记为“推荐”
看完课程过来浏览一下别人提的问题，会帮你学得更全面

截止目前，同学们一共提了 135016个问题

时间排序推荐排序

Python全系列/第十六阶段：Python 爬虫开发/Python爬虫基础与应用 361楼

老师这个是怎么回事？我明明已经安装好了whois了的，在cmd下能正常打印出信息，我已经将python-whois模块导入到pycharm里面了。

Python全系列/第十六阶段：Python 爬虫开发/爬虫基础（旧） 362楼

你好，老师，我按照源代码写了一边爬虫，但是没收到数据，控制台也没有报错，看打印好像说是没有items，但是对比源代码找不到不一样的地方，我把源代码上传了上去，请老师帮我看看

lianjia11.rar

Python全系列/第十六阶段：Python 爬虫开发/动态数据抓取 363楼

老师，手机验证码应该如何处理，还有那个滑块验证的应该如何处理

Python全系列/第十六阶段：Python 爬虫开发/爬虫反反爬- 364楼

import requests
from fake_useragent import UserAgent
# from urllib.error import URLError
import os
def get_header():
    location = os.getcwd() + '/fake_useragent.json'
    ua = UserAgent(path=location)
    return ua.random
url = "https://www.qiushibaike.com/text/"
headers = {
    "User-Agent":get_header()
}
resp = requests.get(url,headers=headers)
print(resp.text)

老师，按照视频中爬取，但是这一段是没有被爬下来的，老师，是代码有问题吗？麻烦老师看一下

Python全系列/第十六阶段：Python 爬虫开发/爬虫反反爬- 365楼

每次元素还没加载完成就退出了，用sleep强制等待才行

Python全系列/第十六阶段：Python 爬虫开发/爬虫反反爬 366楼

conda怎末下载11111111111111111111111111111111111111111111

Python全系列/第十六阶段：Python 爬虫开发/Python爬虫基础与应用 367楼

requests
hashlib md5


Chaojiying_Client():

    (usernamepasswordsoft_id):
        .username = username
        password = password.encode()

        .password = md5(password).hexdigest()
        .soft_id = soft_id
        .base_params = {
            : .username: .password: .soft_id}
        .headers = {
            : : }


    (imcodetype):
        params = {
            : codetype}
        params.update(.base_params)
        files = {: (im)}
        r = requests.post(=params=files=.headers)
        r.json()


    (im_id):
        params = {
            : im_id}
        params.update(.base_params)
        r = requests.post(=params=.headers)
        r.json()

(filenamecode_type=):
    chaojiying = Chaojiying_Client()  im = (filename).read()  resp = chaojiying.PostPic(imcode_type)   resp.get()

__name__ == :
    (get_code())

老师，这个哪里有问题啊，照着老师的敲下来的，识别不出来验证码。

打印出来的结果为空

Python全系列/第十六阶段：Python 爬虫开发/爬虫反反爬- 368楼

老师，请问，我想复制部分内容自己做笔记，但是给的资料中pdf中的文字，为什么复制到wps中变成这种，字体有大有小，重新设置都没有用，然后网页的页字不见了，查找网页两个字，又是两个框框

Python全系列/第十六阶段：Python 爬虫开发/爬虫基础（旧） 369楼

就是运行不出来

import requests
login ='http://www.chaojiying.com/user/login/'
img ="http://www.chaojiying.com/public/default/images/content_login/img_login.jpg"
headers={
    "User-Agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/87.0.4280.88 Safari/537.36"
}

#创建session对象
session =requests.session()
#第一次获取登陆页面
resp = session.get(login,headers=headers)
#获取验证码
img_resp=session.get(img,headers=headers)

#保存验证码
with open("code.jpg","wb") as f:
    f.write(img_resp.content)

code=input("输入：")
date={
'user': 'jingrunping',
'pass': '456363',
'imgtxt':code,
'act': '1'
}
#登陆操作
login_resp=session.post(login,headers=headers,date=date)
print(login_resp.text)

Python全系列/第十六阶段：Python 爬虫开发/爬虫反反爬- 370楼

from urllib.request import urlopen
from urllib.request import Request
from random import choice

url = "https://www.baidu.com/"
user_agents=[
    "ua1","ua2","ua3"
]
# print(choice(user_agents))
#定义user_Agent变量
headers = {
   "User-Agent": choice(user_agents)

}
#封装request对象
req = Request(url,headers=headers)
print(req.get_header("User-agent"))
#发送请求
# resp = urlopen(req)
# print(resp.read().decode())