requests模块-526互联

1、介绍

requests是python用于处理http/https的一个第三方库，需要pip安装。

2、request函数

import requests
res = requests.request(method='GET', url='https://www.baidu.com/');

request是一个函数，method和url参数必须给定
res的类型为<class ‘requests.models.Response’>

（1）method

该参数必须设置，一般是GET、POST、PUT、DELETE、PATCH、OPTIONS、HEAD。也可以是小写，或者混杂
method设置错误，比如为GE，不影响请求的发送。http的请求方法就为设置的错误值的大写，由服务器决定如何处理。如果对方法有限定可能会响应302，没有限定则可能会响应200。
res.request.method的值即这里设置的字符串。如果是小写的get，会自动转为大写。

（2）url

该参数必须设置，而且需要包括协议部分
如果域名不存在http或者https服务，会报错
可以直接处理https，也可以是http

（3）params

q = {'name':'zz'}
# q = {'name':'zz','age':12}
# q_2 = [('name','zz'),('age',22)]
# q_3 = 'name=xx&age=12'
res_1 = requests.request(method='GET', url='https://www.baidu.com', params=q)
# https://www.baidu.com?name=zz
res_2 = requests.request(method='GET', url='https://www.baidu.com?name=12', params=q)
# https://www.baidu.com?name=12&name=zz

作用：设置url中的请求参数，类型可以为字典或者元组的列表，或者字符串

字典中的值会拼接到url中的params部分，如果未有参数，则先会添加?。如果已有参数，则直接追加，注意不会检查已有参数是否已经重名

（4）data

data_1 = 'abcd'	# abcd
data_2 = {'name':'zz','age':12}	# name=zz&age=12
data_3 = [('name','zz'),('age',12)] # name=zz&age=12

作用：设置body部分携带的数据，类型可以为字符串、元组的列表和字典

（5）json

json_1 = 'abcd'	# b'"abcd"'
json_2 = {'name':'zz','age':12}	# b'{"name": "zz", "age": 12}'
json_3 = [('name','zz'),('age',12)]	# b'[["name", "zz"], ["age", 12]]'

作用：设置body部分携带的数据，以json格式发送，类型可以为字符串、元组的列表和字典

（6）headers

headers = {'User-Agent':'zz','age':'12', 'Cookie':'name=zz; age=123'}

作用：设置请求的头部字段，类型为字典，并且字典元素的键和值都必须是str类型，否则报错

request方法自身默认会设置一些http请求头部字段，在指定headers参数时，会进行判断是否已设置字段，判断不区分大小写，如果重复则覆盖，如果不重复则追加字段

如果覆盖，并且新设置的键和值替代之前的键和值。主要注意其键的大小写以新设置的为准

headers的键可以任意设置，而非一定要是http协议规定的，同时可以直接在其中设置cookie

（7）cookies

cookies = {'name':'zz','age':'12'}

作用：设置请求携带的cookie，类型为字典，并且字典元素的键和值都必须是str类型，否则报错

（8）files

upload_files = {'file': open('report.xls', 'rb')}
r = requests.post(url, files=upload_files)

作用：上传文件

在读取文件时，注意务必使用'rb'即二进制模式读取，这样获取的bytes长度才是文件的长度。

3、特定请求方法

def get(url, params=None, **kwargs)
def options(url, **kwargs)
def head(url, **kwargs)
def post(url, data=None, json=None, **kwargs)
def put(url, data=None, **kwargs)
def patch(url, data=None, **kwargs)
def delete(url, **kwargs)

4、请求信息

print(res.request.url, type(res.request.url))
print(res.request.method, type(res.request.method))
print(res.request.headers, type(res.request.headers))
print(res.request.body, type(res.request.body))
print(res.request.hooks, type(res.request.hooks))

（1）url和method

这两个属性类型为字符串，并且一个正常的request方法调用其值不为空

（2）headers

1）从值的形式上来说，是字典形式，键和值都是字符串。但实际的数据类型为<class ‘requests.structures.CaseInsensitiveDict’>

2）其值往往也不为空，模块代码会默认设置和携带一些头部

3）以下四种均输出，证明大小写不敏感

if 'user-agent' in res.request.headers:
    print(1)
if 'user-agent' in res.request.headers.keys():
    print(12)
if 'User-Agent' in res.request.headers:
    print(13)
if 'User-Agent' in res.request.headers.keys():
    print(134)

4）对headers直接在pyqt等要求参数为字符串str的场景中必须使用str函数进行强转

（3）body

如果没有设置data或者json，其值为None，类型为NoneType

在pyqt等要求参数为字符串str的场景中必须使用str函数进行强转

如果设置了data或者json，其值为str类型

（4）hooks

属性类型为字典，字典只有一个元素，其键为response，值为一个列表，列表的元素为定义的钩子函数

在pyqt等要求参数为字符串str的场景中必须使用str函数进行强转

{'response': [<function print_url at 0x0000026BC320F0D0>, <function change_url at 0x0000026BC35D0700>]}

5、响应信息

（1）响应

print(res, type(res))
# <Response [302]> <class 'requests.models.Response'>

请求执行之后会返回一个响应对象

（2）headers

作用：获取响应的头部字段信息

其类似dict类型，可用通过索引取值，或者str函数转换，或者调用dict类型的方法

如果取值没有该字段，会报错

print(res.headers, type(res.headers))
# {'Server': 'nginx/1.15.5', 'Date': 'Sat, 21 Aug 2021 21:10:41 GMT', 'Content-Type': 'text/html', 'Content-Length': '157', 'Connection': 'keep-alive'} <class 'requests.structures.CaseInsensitiveDict'>
print(res.headers['Server'])
print(res.headers.values())

（3）url、raw、ok、is_redirect、reason、status_code

print(res.url, type(res.url))
print(res.raw, type(res.raw))
print(res.ok, type(res.ok))
print(res.is_redirect, type(res.is_redirect))
print(res.reason, type(res.reason))
print(res.status_code, type(res.status_code))
'''
https://www.baidu.com/ <class 'str'>
<urllib3.response.HTTPResponse object at 0x0000018470426AF0> <class 'urllib3.response.HTTPResponse'>
True <class 'bool'>
False <class 'bool'>
OK <class 'str'>
200 <class 'int'>
'''

url：str类型
raw：暂时未找到应用方式
ok：bool类型，判断是否为200
is_redirect：bool类型，判断是否为3xx
reason：str类型，状态描述
status_code：int类型，状态代码

（4）encoding、apparent_encoding、cookies、history、

print(res.encoding, type(res.encoding))
print(res.apparent_encoding, type(res.apparent_encoding))
print(res.cookies, type(res.cookies))
print(res.history, type(res.history))
'''
ISO-8859-1 <class 'str'>
utf-8 <class 'str'>
<RequestsCookieJar[<Cookie BDORZ=27315 for .baidu.com/>]> <class 'requests.cookies.RequestsCookieJar'>
[] <class 'list'>
'''

encoding：编码，str类型
apparent_encoding：表现编码，str类型
cookies：自定义类型，可以通过其对象方法操作
history：历史，list类型

（5）content、text、links

print(res.text.encode(encoding=res.encoding).decode(res.apparent_encoding))
print(res.content, type(res.content))
print(res.links, type(res.links))
'''
xxx
b'xxx' <class 'bytes'>
{} <class 'dict'>
'''

text：内容部分，str类型。其一般会进行字符编码传输，res.encoding指定传输编码。而apparent_encoding指定重新编码
- 但注意res.encoding参数可能会为None，该请求会报错，所以需要先做判断
- apparent_encoding一般直接指定为utf-8
context：内容部分，bytes字节类型
links：字典类型

（6）elapsed、next、is_permanent_redirect

print(res.elapsed, type(res.elapsed))
print(res.next, type(res.next))
print(res.is_permanent_redirect, type(res.is_permanent_redirect))
'''
0:00:00.230697 <class 'datetime.timedelta'>
None <class 'NoneType'>
False <class 'bool'>
'''

elapsed：请求的响应时间
next：一般是重定向使用的路径
is_permanent_redirect：是否永久重定向

wireshark模块requests编码

auth_request vouch-proxy amp模块