爬虫pytesseract requests selenium
selenium之三种等待,强制等待、隐式等待和显式等待
显式等待 presence_of_element_locatedpresence_of_all_elements_locatedvisibility_of_any_elements_located 判断页面至少有一个元素可见 visible, 传入locator,一旦定位就返回 the list o ......
selenium之内联框架和多窗口切换
内联框架frame frame是一种内联框架,用于在html里面内部嵌入子页面(完整的html),对于这种元素,内部子页面的内容selenium无法直接控制,必须通过 switch_to跳转到对应的frame,才能进行操作,注意,操作之后一定要跳出该frame 多窗口切换 handle 句柄:用来指 ......
selenium之鼠标键盘操作
鼠标操作 1.引入ActionChains类 2.定位相关元素 3.在ActionChains().调用相关鼠标操作方法 from selenium.webdriver.common.action_chains import ActionChains 双击操作: ActionChains(drive ......
selenium之下拉菜单列表定位
下拉菜单列表定位>>使用Select类定位 from selenium.webdriver.support.ui import Select #导入Select类 select=Select(driver.find_element_by_css_selector('[name="baseinfopr ......
selenium之元素定位
安装、卸载、查看 安装:pip install selenium==xxxx 卸载:pip uninstall selenium 查看版本号:pip show selenium 定位方式使用规则 有id,直接用有name,如果界面上只有一个表单,直接用。(最好检查以下唯一性)class_name,注 ......
扫描器及常见爬虫特征
Nessus Nessus 扫描器的特征信息同样在请求的 URL,Headers,Body 三项里 URL: nessus Nessus Headers: x_forwarded_for: nessus referer: nessus host: nessus Body: nessus Nessus ......
selenium 模拟登录环境
尽量windows环境 1.安装python 3.11.5 2、安装selenium pip install selenium -i https://pypi.tuna.tsinghua.edu.cn/simple 3 、验证码识别库 pip install ddddocr -i https://p ......
如何用python request同时上传文件和JSON参数
一个http学习摸索过程中的记录,对http框架并不十分了解,如果有误欢迎指出。 假设我们目前有一些文件,和参数需要通过POST发送到请求服务端,我们可以通过content type为multipart/form-data 来同时传入这两个参数。 准备参数 我们先设置需要传入的参数,这里 file_ ......
【接口自动化测试实战】python+requests+Pytest+yaml+Allure
前言 一、先来了解下pytest 二、需要具备的基础知识 三、开发环境准备 四、接口自动化实战(设计项目目录) 五、方法封装 六、编写自动化用例脚本 七、持续集成 八、其他自动化框架 ......
python_requests
python 可以使用requests模块进行http协议通信 #!/usr/bin/python3 # -*- coding: UTF-8 -*- #参考 https://blog.csdn.net/m0_71986704/article/details/130046305 import requ ......
Playwright爬虫绕过Cloudflare人机验证
1. 问题描述 有些网关接入了Cloudflare的人机验证组件,当使用Playwright等自动化工具爬取的时候,会被人机验证阻拦。阻断的效果如下: 2. 问题原因 Selenium、Puppeteer、Playwright等自动化控制工具的实现都会遵循一个规范,就是使用这些工具的时候,获取 na ......
自动化测试工具 —— selenium介绍及基本使用方法
Selenium是一个开源、免费、简单、灵活,对Web浏览器支持良好的自动化测试工具,在UI自动化、爬虫等场景下是十分实用的,能够熟练掌握并使用Selenium工具可以大大的提高效率。 Selenium简介 Selenium支持多平台、多浏览器、多语言去实现自动化测试,是一个开源和可移植的Web测试 ......
VS2022新建python项目爬虫网页
一、安装python插件。 二、新建python项目。 三、安装配置DEBUG环境。 四、根据操作系统选择DEBUG环境。 五、安装requests库 在当前DEBUG环境安装requests库 六、使用requests库,爬取网页内容 完结! ......
Request 爬虫的 SSL 连接问题深度解析
SSL 连接简介 SSL(Secure Sockets Layer)是一种用于确保网络通信安全性的加密协议,广泛应用于互联网上的数据传输。在数据爬取过程中,爬虫需要与使用 HTTPS 协议的网站进行通信,这就牵涉到了 SSL 连接。本文将深入研究 Request 爬虫中的 SSL 连接问题,并提供解 ......
selenium+pytest进行自动化测试(项目:白羽黑月SMS)
最近在学习selenium和pytest,刚好找到一个合适的项目学习,根据bysms给出来的测试用例进行自动化测试编写 首先先写了登录的测试用例,因为后续测试都是在登陆的基础上测试的,所以把这单独写出来 创建一个login_success.py文件 from selenium.webdriver.c ......
封装uniapp的request
1 uni.request() 二次封装 import Vue from 'vue' const baseUrl = 'http://127.0.0.1:8080' // 服务器地址 const imageUrl = baseUrl const staticVariables = { BASE_UR ......
爬虫获取网页开发者模式NetWork信息
using System; using System.Collections.Generic; using System.Linq; using System.Threading; using System.Threading.Tasks; using OpenQA.Selenium; using ......
如何优雅的使用微信小程序的wx.request请求(封装request.js工具类)
首先官方的文档不是支持Promise风格的请求 我们通过官方文档可以看到微信小程序发请求的一些具体参数,下面的代码展示了用wx.request()发送的一个标准请求: wx.request({ url: "https://xxx.com", method:"POST", data:{ phone:1 ......
Flask之request.json()和 request.form.get()
在Flask中,request.json 和 request.form.get() 用于从HTTP请求中获取数据,但它们主要用于不同类型的数据传递方式。 request.json: 用于从包含JSON数据的请求体中提取数据。 适用于POST请求中包含JSON数据的情况,通常是通过AJAX请求或使用C ......
【爬虫】多线程下载文件
import requests import json from lxml import etree from concurrent.futures import ThreadPoolExecutor 导入多线程所需要的库 def mians(num): url=f"http://www.1o1o. ......
request对象方法
# 登陆功能 # form表单action三个参数写法 request.method # 获取当前请求方式 全大写的字符串 request.GET # 获取url问好后面携带的参数 .get() 列表最后一个元素 .getlist() 拿整个列表request.POST # 获取post请求提交过来 ......
通过api登录接口获得cookie,给selenium使用,绕开登录页面
1、通过接口登录获得cookie def get_token_cookie(): test = SSO_EXAMPLE() token = test.get_session.json()['token'] cookie = test.get_session.cookies return token, ......
golang环境和第三方爬虫包下载安装一把成
复制代码在CentOS7.6中命令行中全部粘贴执行,golang环境和第三方爬虫包全部安装一把成。 wget https://golang.google.cn/dl/go1.21.4.linux-amd64.tar.gz tar -zxvf go1.21.4.linux-amd64.tar.gz - ......
【K哥爬虫普法】不要沾边!涉案 7k 合判 6 年!
我国目前并未出台专门针对网络爬虫技术的法律规范,但在司法实践中,相关判决已屡见不鲜,K 哥特设了“K哥爬虫普法”专栏,本栏目通过对真实案例的分析,旨在提高广大爬虫工程师的法律意识,知晓如何合法合规利用爬虫技术,警钟长鸣,做一个守法、护法、有原则的技术人员。 案情简介 涉事人员: ① 被告人赵某龙(下 ......
Selenium4+python被单独定义<div>的动态输入框和二级下拉框要怎么定位?
今天在做练习题的时候,发现几个问题捣鼓了好久,写下这篇来记录 问题一: 有层级的复选框无法定位到二级目录 对于这种拥有二级框的选项无法定位,也不是<select>属性. 我们查看下HTML,发现它是被单独封装在body内拥有动态属性的独立<div>,当窗口点击的时候才会触发. 解决: driver. ......
selenium用js删除元素后,在进行定位
一个自动化项目,里面有200多个相同元素,着200多个元素,就文本不同。我就想着用文本定位就好了,但是Xpath没有办法定位到下面的元素。这是下面所遇到的问题: 我就用了 //*[contains(text(),'金湾分公司')] 去定位,但这么写没办法定位到,因为前面有注解<! >(但我当时一直不 ......
Multi-IO, multi-request, single server
两个函数send and recv 1 num = send(s, addr_of_data, len_of_data, 0); 2 num = recv(s, addr_of_buffer, len_of_buffer, 0); 3 close(s); s: socket s, 是其他client ......
【爬虫】进一步提取图片url,下载图片
import requests from lxml import etree url="https://pic.netbian.com/4kdongman/" domain="https://pic.netbian.com/" data=requests.get(url) #print(data.t ......
今日头条我的收藏爬虫
背景: 今日头题我的收藏搜索功能很弱,收藏的文章在pc/手机上总是如法全部搜索出来。也给头条反馈了很多次,总是不搭理。实在忍受不了这种敷衍,决定自己写一个爬虫。 思路: 先解决有无问题,做一个最基础版本。 、 头条我的收藏是是get请求,返回的是json格式数据,直接使用requests发送请求到头 ......