爬虫pytesseract requests selenium

selenium之三种等待，强制等待、隐式等待和显式等待

显式等待 presence_of_element_locatedpresence_of_all_elements_locatedvisibility_of_any_elements_located 判断页面至少有一个元素可见 visible，传入locator，一旦定位就返回 the list o ......

selenium更新时间 2023-11-27

selenium之内联框架和多窗口切换

内联框架frame frame是一种内联框架，用于在html里面内部嵌入子页面（完整的html），对于这种元素，内部子页面的内容selenium无法直接控制，必须通过 switch_to跳转到对应的frame，才能进行操作，注意，操作之后一定要跳出该frame 多窗口切换 handle 句柄：用来指 ......

框架 selenium更新时间 2023-11-27

selenium之鼠标键盘操作

鼠标操作 1.引入ActionChains类 2.定位相关元素 3.在ActionChains().调用相关鼠标操作方法 from selenium.webdriver.common.action_chains import ActionChains 双击操作： ActionChains(drive ......

selenium 键盘鼠标更新时间 2023-11-27

selenium之下拉菜单列表定位

下拉菜单列表定位>>使用Select类定位 from selenium.webdriver.support.ui import Select #导入Select类 select=Select(driver.find_element_by_css_selector('[name="baseinfopr ......

selenium 菜单更新时间 2023-11-27

selenium之元素定位

安装、卸载、查看安装：pip install selenium==xxxx 卸载：pip uninstall selenium 查看版本号：pip show selenium 定位方式使用规则有id，直接用有name，如果界面上只有一个表单，直接用。（最好检查以下唯一性）class_name，注 ......

selenium 元素更新时间 2023-11-27

扫描器及常见爬虫特征

Nessus Nessus 扫描器的特征信息同样在请求的 URL，Headers，Body 三项里 URL： nessus Nessus Headers： x_forwarded_for: nessus referer: nessus host: nessus Body： nessus Nessus ......

爬虫扫描器特征常见更新时间 2023-11-27

selenium 模拟登录环境

尽量windows环境 1.安装python 3.11.5 2、安装selenium pip install selenium -i https://pypi.tuna.tsinghua.edu.cn/simple 3 、验证码识别库 pip install ddddocr -i https://p ......

selenium 环境更新时间 2023-11-24

如何用python request同时上传文件和JSON参数

一个http学习摸索过程中的记录，对http框架并不十分了解，如果有误欢迎指出。假设我们目前有一些文件，和参数需要通过POST发送到请求服务端，我们可以通过content type为multipart/form-data 来同时传入这两个参数。准备参数我们先设置需要传入的参数，这里 file_ ......

同时参数 request 文件 python更新时间 2023-11-24

【接口自动化测试实战】python+requests+Pytest+yaml+Allure

前言一、先来了解下pytest 二、需要具备的基础知识三、开发环境准备四、接口自动化实战（设计项目目录）五、方法封装六、编写自动化用例脚本七、持续集成八、其他自动化框架 ......

实战 requests 接口 python Pytest更新时间 2023-11-24

python_requests

python 可以使用requests模块进行http协议通信 #!/usr/bin/python3 # -*- coding: UTF-8 -*- #参考 https://blog.csdn.net/m0_71986704/article/details/130046305 import requ ......

python_requests requests python更新时间 2023-11-24

Playwright爬虫绕过Cloudflare人机验证

1. 问题描述有些网关接入了Cloudflare的人机验证组件，当使用Playwright等自动化工具爬取的时候，会被人机验证阻拦。阻断的效果如下： 2. 问题原因 Selenium、Puppeteer、Playwright等自动化控制工具的实现都会遵循一个规范，就是使用这些工具的时候，获取 na ......

爬虫人机 Playwright Cloudflare更新时间 2023-11-23

自动化测试工具 —— selenium介绍及基本使用方法

Selenium是一个开源、免费、简单、灵活，对Web浏览器支持良好的自动化测试工具，在UI自动化、爬虫等场景下是十分实用的，能够熟练掌握并使用Selenium工具可以大大的提高效率。 Selenium简介 Selenium支持多平台、多浏览器、多语言去实现自动化测试，是一个开源和可移植的Web测试 ......

测试工具使用方法 selenium 工具方法更新时间 2023-11-23

VS2022新建python项目爬虫网页

一、安装python插件。二、新建python项目。三、安装配置DEBUG环境。四、根据操作系统选择DEBUG环境。五、安装requests库在当前DEBUG环境安装requests库六、使用requests库，爬取网页内容完结！ ......

爬虫网页项目 python 2022更新时间 2023-11-23

Request 爬虫的 SSL 连接问题深度解析

SSL 连接简介 SSL（Secure Sockets Layer）是一种用于确保网络通信安全性的加密协议，广泛应用于互联网上的数据传输。在数据爬取过程中，爬虫需要与使用 HTTPS 协议的网站进行通信，这就牵涉到了 SSL 连接。本文将深入研究 Request 爬虫中的 SSL 连接问题，并提供解 ......

爬虫深度 Request 问题 SSL更新时间 2023-11-22

selenium+pytest进行自动化测试（项目：白羽黑月SMS）

最近在学习selenium和pytest，刚好找到一个合适的项目学习，根据bysms给出来的测试用例进行自动化测试编写首先先写了登录的测试用例，因为后续测试都是在登陆的基础上测试的，所以把这单独写出来创建一个login_success.py文件 from selenium.webdriver.c ......

selenium 项目 pytest SMS更新时间 2023-11-22

封装uniapp的request

1 uni.request() 二次封装 import Vue from 'vue' const baseUrl = 'http://127.0.0.1:8080' // 服务器地址 const imageUrl = baseUrl const staticVariables = { BASE_UR ......

request uniapp更新时间 2023-11-22

爬虫获取网页开发者模式NetWork信息

using System; using System.Collections.Generic; using System.Linq; using System.Threading; using System.Threading.Tasks; using OpenQA.Selenium; using ......

爬虫开发者 NetWork 模式网页更新时间 2023-11-21

如何优雅的使用微信小程序的wx.request请求（封装request.js工具类）

首先官方的文档不是支持Promise风格的请求我们通过官方文档可以看到微信小程序发请求的一些具体参数，下面的代码展示了用wx.request()发送的一个标准请求： wx.request({ url: "https://xxx.com", method:"POST", data:{ phone:1 ......

request 工具程序 wx js更新时间 2023-11-21

Flask之request.json()和 request.form.get()

在Flask中，request.json 和 request.form.get() 用于从HTTP请求中获取数据，但它们主要用于不同类型的数据传递方式。 request.json：用于从包含JSON数据的请求体中提取数据。适用于POST请求中包含JSON数据的情况，通常是通过AJAX请求或使用C ......

request Flask json form get更新时间 2023-11-21

【爬虫】多线程下载文件

import requests import json from lxml import etree from concurrent.futures import ThreadPoolExecutor 导入多线程所需要的库 def mians(num): url=f"http://www.1o1o. ......

爬虫线程文件更新时间 2023-11-20

request对象方法

# 登陆功能 # form表单action三个参数写法 request.method # 获取当前请求方式全大写的字符串 request.GET # 获取url问好后面携带的参数 .get() 列表最后一个元素 .getlist() 拿整个列表request.POST # 获取post请求提交过来 ......

对象 request 方法更新时间 2023-11-20

通过api登录接口获得cookie，给selenium使用，绕开登录页面

1、通过接口登录获得cookie def get_token_cookie(): test = SSO_EXAMPLE() token = test.get_session.json()['token'] cookie = test.get_session.cookies return token, ......

selenium 接口页面 cookie api更新时间 2023-11-20

golang环境和第三方爬虫包下载安装一把成

复制代码在CentOS7.6中命令行中全部粘贴执行，golang环境和第三方爬虫包全部安装一把成。 wget https://golang.google.cn/dl/go1.21.4.linux-amd64.tar.gz tar -zxvf go1.21.4.linux-amd64.tar.gz - ......

爬虫第三方环境 golang更新时间 2023-11-20

【K哥爬虫普法】不要沾边！涉案 7k 合判 6 年！

我国目前并未出台专门针对网络爬虫技术的法律规范，但在司法实践中，相关判决已屡见不鲜，K 哥特设了“K哥爬虫普法”专栏，本栏目通过对真实案例的分析，旨在提高广大爬虫工程师的法律意识，知晓如何合法合规利用爬虫技术，警钟长鸣，做一个守法、护法、有原则的技术人员。案情简介涉事人员： ① 被告人赵某龙（下 ......

爬虫 7k更新时间 2023-11-20

Selenium4+python被单独定义＜div＞的动态输入框和二级下拉框要怎么定位?

今天在做练习题的时候,发现几个问题捣鼓了好久,写下这篇来记录问题一: 有层级的复选框无法定位到二级目录对于这种拥有二级框的选项无法定位,也不是<select>属性. 我们查看下HTML,发现它是被单独封装在body内拥有动态属性的独立<div>,当窗口点击的时候才会触发. 解决: driver. ......

Selenium4 Selenium 动态 python div更新时间 2023-11-20

selenium用js删除元素后，在进行定位

一个自动化项目，里面有200多个相同元素，着200多个元素，就文本不同。我就想着用文本定位就好了，但是Xpath没有办法定位到下面的元素。这是下面所遇到的问题：我就用了 //*[contains(text(),'金湾分公司')] 去定位，但这么写没办法定位到，因为前面有注解<! >(但我当时一直不 ......

selenium 元素更新时间 2023-11-20

Multi-IO, multi-request, single server

两个函数send and recv 1 num = send(s, addr_of_data, len_of_data, 0); 2 num = recv(s, addr_of_buffer, len_of_buffer, 0); 3 close(s); s: socket s，是其他client ......

multi-request Multi-IO request single server更新时间 2023-11-20

【爬虫】进一步提取图片url，下载图片

import requests from lxml import etree url="https://pic.netbian.com/4kdongman/" domain="https://pic.netbian.com/" data=requests.get(url) #print(data.t ......

爬虫图片 url更新时间 2023-11-18

今日头条我的收藏爬虫

背景：今日头题我的收藏搜索功能很弱，收藏的文章在pc/手机上总是如法全部搜索出来。也给头条反馈了很多次，总是不搭理。实在忍受不了这种敷衍，决定自己写一个爬虫。思路：先解决有无问题，做一个最基础版本。、头条我的收藏是是get请求，返回的是json格式数据，直接使用requests发送请求到头 ......

爬虫头条更新时间 2023-11-18

requests+编码模块+百度贴吧数据抓取

1.查看本地发送过去的头文件import requestshtml = requests.get(url='http://httpbin.org/get').textprint(html) 2.编码模块使用 //使用原因：URL不能识别中文编码，中文转换为编码模式) (1)urlencode()方法 ......

百度贴吧贴吧模块 requests 编码更新时间 2023-11-18

共1820篇 :10/61页 首页上一页78910111213下一页尾页