爬虫pytesseract requests selenium

selenium之三种等待,强制等待、隐式等待和显式等待

显式等待 presence_of_element_locatedpresence_of_all_elements_locatedvisibility_of_any_elements_located 判断页面至少有一个元素可见 visible, 传入locator,一旦定位就返回 the list o ......
selenium

selenium之内联框架和多窗口切换

内联框架frame frame是一种内联框架,用于在html里面内部嵌入子页面(完整的html),对于这种元素,内部子页面的内容selenium无法直接控制,必须通过 switch_to跳转到对应的frame,才能进行操作,注意,操作之后一定要跳出该frame 多窗口切换 handle 句柄:用来指 ......
框架 selenium

selenium之鼠标键盘操作

鼠标操作 1.引入ActionChains类 2.定位相关元素 3.在ActionChains().调用相关鼠标操作方法 from selenium.webdriver.common.action_chains import ActionChains 双击操作: ActionChains(drive ......
selenium 键盘 鼠标

selenium之下拉菜单列表定位

下拉菜单列表定位>>使用Select类定位 from selenium.webdriver.support.ui import Select #导入Select类 select=Select(driver.find_element_by_css_selector('[name="baseinfopr ......
selenium 菜单

selenium之元素定位

安装、卸载、查看 安装:pip install selenium==xxxx 卸载:pip uninstall selenium 查看版本号:pip show selenium 定位方式使用规则 有id,直接用有name,如果界面上只有一个表单,直接用。(最好检查以下唯一性)class_name,注 ......
selenium 元素

扫描器及常见爬虫特征

Nessus Nessus 扫描器的特征信息同样在请求的 URL,Headers,Body 三项里 URL: nessus Nessus Headers: x_forwarded_for: nessus referer: nessus host: nessus Body: nessus Nessus ......
爬虫 扫描器 特征 常见

selenium 模拟登录环境

尽量windows环境 1.安装python 3.11.5 2、安装selenium pip install selenium -i https://pypi.tuna.tsinghua.edu.cn/simple 3 、验证码识别库 pip install ddddocr -i https://p ......
selenium 环境

如何用python request同时上传文件和JSON参数

一个http学习摸索过程中的记录,对http框架并不十分了解,如果有误欢迎指出。 假设我们目前有一些文件,和参数需要通过POST发送到请求服务端,我们可以通过content type为multipart/form-data 来同时传入这两个参数。 准备参数 我们先设置需要传入的参数,这里 file_ ......
同时 参数 request 文件 python

【接口自动化测试实战】python+requests+Pytest+yaml+Allure

前言 一、先来了解下pytest 二、需要具备的基础知识 三、开发环境准备 四、接口自动化实战(设计项目目录) 五、方法封装 六、编写自动化用例脚本 七、持续集成 八、其他自动化框架 ......
实战 requests 接口 python Pytest

python_requests

python 可以使用requests模块进行http协议通信 #!/usr/bin/python3 # -*- coding: UTF-8 -*- #参考 https://blog.csdn.net/m0_71986704/article/details/130046305 import requ ......
python_requests requests python

Playwright爬虫绕过Cloudflare人机验证

1. 问题描述 有些网关接入了Cloudflare的人机验证组件,当使用Playwright等自动化工具爬取的时候,会被人机验证阻拦。阻断的效果如下: 2. 问题原因 Selenium、Puppeteer、Playwright等自动化控制工具的实现都会遵循一个规范,就是使用这些工具的时候,获取 na ......
爬虫 人机 Playwright Cloudflare

自动化测试工具 —— selenium介绍及基本使用方法

Selenium是一个开源、免费、简单、灵活,对Web浏览器支持良好的自动化测试工具,在UI自动化、爬虫等场景下是十分实用的,能够熟练掌握并使用Selenium工具可以大大的提高效率。 Selenium简介 Selenium支持多平台、多浏览器、多语言去实现自动化测试,是一个开源和可移植的Web测试 ......

VS2022新建python项目爬虫网页

一、安装python插件。 二、新建python项目。 三、安装配置DEBUG环境。 四、根据操作系统选择DEBUG环境。 五、安装requests库 在当前DEBUG环境安装requests库 六、使用requests库,爬取网页内容 完结! ......
爬虫 网页 项目 python 2022

Request 爬虫的 SSL 连接问题深度解析

SSL 连接简介 SSL(Secure Sockets Layer)是一种用于确保网络通信安全性的加密协议,广泛应用于互联网上的数据传输。在数据爬取过程中,爬虫需要与使用 HTTPS 协议的网站进行通信,这就牵涉到了 SSL 连接。本文将深入研究 Request 爬虫中的 SSL 连接问题,并提供解 ......
爬虫 深度 Request 问题 SSL

selenium+pytest进行自动化测试(项目:白羽黑月SMS)

最近在学习selenium和pytest,刚好找到一个合适的项目学习,根据bysms给出来的测试用例进行自动化测试编写 首先先写了登录的测试用例,因为后续测试都是在登陆的基础上测试的,所以把这单独写出来 创建一个login_success.py文件 from selenium.webdriver.c ......
selenium 项目 pytest SMS

封装uniapp的request

1 uni.request() 二次封装 import Vue from 'vue' const baseUrl = 'http://127.0.0.1:8080' // 服务器地址 const imageUrl = baseUrl const staticVariables = { BASE_UR ......
request uniapp

爬虫获取网页开发者模式NetWork信息

using System; using System.Collections.Generic; using System.Linq; using System.Threading; using System.Threading.Tasks; using OpenQA.Selenium; using ......
爬虫 开发者 NetWork 模式 网页

如何优雅的使用微信小程序的wx.request请求(封装request.js工具类)

首先官方的文档不是支持Promise风格的请求 我们通过官方文档可以看到微信小程序发请求的一些具体参数,下面的代码展示了用wx.request()发送的一个标准请求: wx.request({ url: "https://xxx.com", method:"POST", data:{ phone:1 ......
request 工具 程序 wx js

Flask之request.json()和 request.form.get()

在Flask中,request.json 和 request.form.get() 用于从HTTP请求中获取数据,但它们主要用于不同类型的数据传递方式。 request.json: 用于从包含JSON数据的请求体中提取数据。 适用于POST请求中包含JSON数据的情况,通常是通过AJAX请求或使用C ......
request Flask json form get

【爬虫】多线程下载文件

import requests import json from lxml import etree from concurrent.futures import ThreadPoolExecutor 导入多线程所需要的库 def mians(num): url=f"http://www.1o1o. ......
爬虫 线程 文件

request对象方法

# 登陆功能 # form表单action三个参数写法 request.method # 获取当前请求方式 全大写的字符串 request.GET # 获取url问好后面携带的参数 .get() 列表最后一个元素 .getlist() 拿整个列表request.POST # 获取post请求提交过来 ......
对象 request 方法

通过api登录接口获得cookie,给selenium使用,绕开登录页面

1、通过接口登录获得cookie def get_token_cookie(): test = SSO_EXAMPLE() token = test.get_session.json()['token'] cookie = test.get_session.cookies return token, ......
selenium 接口 页面 cookie api

golang环境和第三方爬虫包下载安装一把成

复制代码在CentOS7.6中命令行中全部粘贴执行,golang环境和第三方爬虫包全部安装一把成。 wget https://golang.google.cn/dl/go1.21.4.linux-amd64.tar.gz tar -zxvf go1.21.4.linux-amd64.tar.gz - ......
爬虫 第三方 环境 golang

【K哥爬虫普法】不要沾边!涉案 7k 合判 6 年!

我国目前并未出台专门针对网络爬虫技术的法律规范,但在司法实践中,相关判决已屡见不鲜,K 哥特设了“K哥爬虫普法”专栏,本栏目通过对真实案例的分析,旨在提高广大爬虫工程师的法律意识,知晓如何合法合规利用爬虫技术,警钟长鸣,做一个守法、护法、有原则的技术人员。 案情简介 涉事人员: ① 被告人赵某龙(下 ......
爬虫 7k

Selenium4+python被单独定义<div>的动态输入框和二级下拉框要怎么定位?

今天在做练习题的时候,发现几个问题捣鼓了好久,写下这篇来记录 问题一: 有层级的复选框无法定位到二级目录 对于这种拥有二级框的选项无法定位,也不是<select>属性. 我们查看下HTML,发现它是被单独封装在body内拥有动态属性的独立<div>,当窗口点击的时候才会触发. 解决: driver. ......
Selenium4 Selenium 动态 python div

selenium用js删除元素后,在进行定位

一个自动化项目,里面有200多个相同元素,着200多个元素,就文本不同。我就想着用文本定位就好了,但是Xpath没有办法定位到下面的元素。这是下面所遇到的问题: 我就用了 //*[contains(text(),'金湾分公司')] 去定位,但这么写没办法定位到,因为前面有注解<! >(但我当时一直不 ......
selenium 元素

Multi-IO, multi-request, single server

两个函数send and recv 1 num = send(s, addr_of_data, len_of_data, 0); 2 num = recv(s, addr_of_buffer, len_of_buffer, 0); 3 close(s); s: socket s, 是其他client ......
multi-request Multi-IO request single server

【爬虫】进一步提取图片url,下载图片

import requests from lxml import etree url="https://pic.netbian.com/4kdongman/" domain="https://pic.netbian.com/" data=requests.get(url) #print(data.t ......
爬虫 图片 url

今日头条我的收藏爬虫

背景: 今日头题我的收藏搜索功能很弱,收藏的文章在pc/手机上总是如法全部搜索出来。也给头条反馈了很多次,总是不搭理。实在忍受不了这种敷衍,决定自己写一个爬虫。 思路: 先解决有无问题,做一个最基础版本。 、 头条我的收藏是是get请求,返回的是json格式数据,直接使用requests发送请求到头 ......
爬虫 头条

requests+编码模块+百度贴吧数据抓取

1.查看本地发送过去的头文件import requestshtml = requests.get(url='http://httpbin.org/get').textprint(html) 2.编码模块使用 //使用原因:URL不能识别中文编码,中文转换为编码模式) (1)urlencode()方法 ......
百度贴吧 贴吧 模块 requests 编码
共1820篇  :10/61页 首页上一页10下一页尾页