selenium scrapy splash

Selenium Grid4.0 - 多台计算机上并行运行

前言当你希望在多台计算机上并行运行测试？Selenium Grid可以帮你实现。官方文档原文：https://www.selenium.dev/documentation/grid/getting_started/ Selenium Grid允许通过将客户端发送的命令路由到远程浏览器实例，在远程 ......

多台 Selenium Grid4 Grid更新时间 2024-01-13

selenium加载驱动的两种方式

以chrome浏览器举例第一种查看本地chrome浏览器版本：右上角-设置-关于chrome，我的版本是：120.0.6099.200 去对应驱动下载网站下载常用网站（更新到114）：https://registry.npmmirror.com/binary.html?path=chromed ......

selenium 方式更新时间 2024-01-12

Airtest-Selenium实操小课②：刷B站视频

Airtest-Selenium Selenium Airtest 视频更新时间 2024-01-11

selenium获取淘宝内容

淘宝的反爬非常厉害，即使模拟了浏览器，仍然会有一大堆验证流程，首先声明这里只是实现了可用的代码，并不实用。下面是一段示例代码，用于模拟爬取淘宝特定关键词下，按销量排序，商品的价格、店名等数据：在开始之前，要下载谷歌浏览器和对应的webdriver，Python、以及Python安装seleniu ......

selenium 内容更新时间 2024-01-10

为什么selenium会被识别出来

因为浏览器指纹暴露了身份可以通过下面这个网址检测，如果是selenium打开的，就会显示红色 Antibot (sannysoft.com) 可以用selenium调试手动打开的浏览器来伪装：首先命令行加参数打开浏览器： start chrome.exe --remote-debugging-p ......

selenium更新时间 2024-01-10

scrapy -- 暂停爬虫、恢复爬虫

1、启动爬虫 scrapy crawl spider -s JOBDIR=record/spider-1 record/spider-1表示一个路径，作用是记录爬虫状态2、暂停爬虫终端输入Ctrl+C，此时爬虫并不会立即停止，需要等待一会当终端出现可以敲击命令时，说明爬虫已暂停 3、恢复爬虫 s ......

爬虫 scrapy更新时间 2024-01-10

scrapy使用文件管道FilesPipeline下载视频

1.爬虫文件 class MeiShiSpider(scrapy.Spider): name = 'meishi' allowed_domains = ['baidu.com'] start_urls = ['https://tieba.baidu.com/f?kw=美食'] def parse(s ......

FilesPipeline 管道文件 scrapy 视频更新时间 2024-01-08

Scrapy爬虫学习

目录Scrapy基本功能Scrapy Shell用法XPATH语法及用法null Scrapy基本功能 Scrapy Shell用法 XPATH语法及用法参考资料：基础入门：https://zhuanlan.zhihu.com/p/35355747 https://www.w3school.co ......

爬虫 Scrapy更新时间 2024-01-08

使用Python+selenium实现第一个自动化测试脚本

这篇文章主要介绍了使用Python+selenium实现第一个自动化测试脚本，文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值，需要的朋友们下面随着小编来一起学习学习吧最近在学web自动化，记录一下学习过程。此处我选用python3.6+selenium3.0，均用最新 ......

脚本 selenium Python更新时间 2024-01-05

selenium窗口切换

一、handle窗口切换当点击某个元素后，会重新生成一个新的页签，但此时我们的操作仍然在原先的窗口当中，如果要在新的窗口继续操作元素，那么就要用到handle窗口切换的方法。常用方法： window_handles：获取当前打开的所有窗口句柄，返回类型为一个列表。 current_window_ ......

selenium更新时间 2024-01-05

python使用Scrapy插入数据到MySql报错 Incorrect string value: ‘\\xF0\\x9F\\"错误

👍🏻这样的字符，插入失败这个问题，原因是UTF-8编码有可能是两个、三个、四个字节。Emoji表情或者某些特殊字符是4个字节，而Mysql的utf8编码最多3个字节，所以数据插不进去。 Window下phpstudy 1、设置服务端，编码为utf8mb4 2、设置数据库和表字符校对为utf8m ......

Incorrect 错误数据 python Scrapy更新时间 2024-01-05

scrapy的正常流程图

正常流程（如下图）是，引擎(engine)将url交给下载器(downloader)，下载器来进行数据下载，如果我们想导入selenium，那么必须要阻断这个过程，并有selenium来代替，我们就需要通过修改downloadmiddleware中的process_request来实现。 ......

流程图流程 scrapy更新时间 2024-01-04

爬虫中scrapy管道的使用

来源：http://www.shanhubei.com/archives/8595.html 一、pipeline中常用的方法 1. process_item（self，item，spider）管道类中必须有的函数实现对item数据的处理必须return item 2. open_spider ......

爬虫管道 scrapy更新时间 2024-01-04

selenium 获取数据

const {Builder, Browser, By, Key, until} = require('selenium-webdriver'); let aa = function(){ (async function example() { let driver = await new Buil ......

selenium 数据更新时间 2024-01-04

scrapy的暂停与重启

转载：https://www.jianshu.com/p/a72e31b3a0f7 在爬取大型站点的时候，或遇到某些特殊情况的时候，往往需要赞同爬虫，并稍后再接着之前执行到的位置继续爬取，而不是每次出问题都从头开始。 scrapy的暂停与重启的设置很简单： 1.创建工作目录在当前项目下，创建工作目 ......

scrapy更新时间 2024-01-04

2024年了，为何 Selenium 依然这么火？

今天给大家带来的主题是自动化测试框架Selenium，话不多说，直接开始！ 1.什么是 Selenium 自动化测试 Jason Huggins 于 2004 年创建了一个 JavaScript 框架，旨在将其从重复的手动测试中解放出来。最初命名为 JavaScriptTestRunner 的产品 ......

Selenium 2024更新时间 2024-01-03

scrapy爬取图片时遇到错误：ValueError: Missing scheme in request url: //scpic3.chinaz.net/Files/pic/pic9/202103

错误原因是在请求资源的时候没有使用完整的url只向//scpic3.chinaz.net/Files/pic/pic9/202103发送了资源请求，而完整的资源地址需要前面加上https:所以在pipelines.py文件的get_media_requests方法中，在发送request请求时修改为 ......

ValueError pic 错误 Missing request更新时间 2024-01-03

Selenium | 控制已打开的浏览器-python-chrome

实现这个有两个步骤：1. 打开浏览器 2. 在python中编写代码控制此打开的浏览器第一步：打开浏览器也有两种方式方式一：用命令打开操作步骤： 1）右键点击chrome的快捷图标，复制出起始位置 2）进入到环境变量-系统变量-找到path，双击编辑，把起始位置复制进去 3）打开cmd命令 ......

python-chrome Selenium 浏览器 python chrome更新时间 2024-01-03

29、Scrapy框架使用

Scrapy的功能强大，爬取效率高，相关扩展组件多，可配置和可拓展程度非常高。基于Twisted的异步处理框架，是纯python实现的爬虫框架，架构清晰，模块之间耦合度低，可扩展型极强，可以灵活完成各种需求。Scrapy架构重要组成：Engine：引擎，处理系统的数据流数据、触发事务，框架核心。It ......

框架 Scrapy更新时间 2024-01-03

06-scrapy的使用

scrapy解析数据 # 运行爬虫程序 scrapy crawl cnblogs ##### 可以项目目录下写个main.py from scrapy.cmdline import execute execute(['scrapy','crawl','cnblogs','--nolog']) ### ......

scrapy 06更新时间 2024-01-02

07-scrapy的高阶用法

爬虫中间件和下载中间件爬虫中间件 # 第一步：写个爬虫中间件类 class ScrapyDemoSpiderMiddleware: @classmethod def from_crawler(cls, crawler): # This method is used by Scrapy to cre ......

高阶 scrapy 07更新时间 2024-01-02

05-打码平台的使用、scrapy介绍安装

打码平台数字字母类的验证码可以使用python模块：ddddocr 计算题，成语题，滑块。。。：第三方打码平台，人工操作打码平台 -云打码，超级鹰超级鹰SDK import requests from hashlib import md5 class ChaojiyingClient(obje ......

scrapy 平台 05更新时间 2024-01-02

03-selenium的使用

搜索文档数 find_all：找所有，返回列表 find：找一个 Tag对象 from bs4 import BeautifulSoup import re html_doc = """ <html><head><title>The Dormouse's story</title></head> < ......

selenium 03更新时间 2024-01-02

04-selenium等待元素加载、元素使用、xpath的使用

selenium等待元素加载 # 代码操作非常快》有的标签还没加载》找就找不到》就会报错 # 设置等待：显示等待，隐士等待 bro.implicitly_wait(10) # 找某个标签，如果找不到，最多等待10s selenium元素操作 # 点击操作 click() # 写文字 send_ ......

元素 selenium xpath 04更新时间 2024-01-02

Selenium（2）

一、安装Selenium pip install selenium 二、八大元素定位要想操作 Web 界面上的元素，首先要定位到该元素，Selenium 提供了定位元素的 API,这些方法都被定义在 WebDriver 类中，这些方法都以 find 开头。一共有如下八种： from time ......

Selenium更新时间 2024-01-01

Selenium（3）

一、特殊元素 1.有些元素它是不可见的( div ) style='display:none' 2.有些元素是隐藏的 hidden 3.有些元素是不可用的 disabled=disabled 灰色 4.有些元素是不可编辑的 readonly=readonly ... 二、特殊场景 1.frame/i ......

Selenium更新时间 2024-01-01

Selenium（1）

一、Selenium简介Selenium是一个用于Web 应用程序的自动化测试工具。Selenium测试直接运行在浏览器中，就像真正的用户在操作一样。主要功能包括：测试与浏览器的兼容性（测试你的应用程序是否能够很好的工作在不同浏览器和操作系统之上）。测试系统功能（创建回归测试检验软件功能和用户需求 ......

Selenium更新时间 2024-01-01

(selenium) 让浏览器在 webdriver 调用后保持打开状态

在使用 selenium 进行 webdriver 测试时，浏览器在调用完后将会自动关闭，即使没有调用 "driver.close()"。有时候，可能需要特意将浏览器保持开启状态，此时需要使用 detach 参数 # 'detach' = True 将不会自动关闭 options.add_exp ......

webdriver selenium 浏览器状态更新时间 2023-12-30

Python+Selenium+Pytest+Allure+Jenkins实现的Web自动化框架

目录一、测试的项目二、需求分析三、用例设计-部分用例举例四、框架说明4.1 测试框架结构图如下：4.2 项目功能五、代码设计与功能说明5.1 POM简介：Page Object Modle页面对象模型5.2 基础封装层：pages/basePage.py5.3 PO页面对象层：pages/userL ......

框架 Selenium Jenkins Python Pytest更新时间 2023-12-29

python_selenium定位页面元素

页面元素常用的定位方法有id、name、css、xpath id和name直接通过对应的值定位 class属性值有多个值时，使用css选择器定位只需要其中一个属性值即可，使用xpath时，属性值需要全部写上示例：<input type="" autocomplete="on" placeholde ......

python_selenium selenium 元素页面 python更新时间 2023-12-29

共680篇 :1/23页 首页上一页1234下一页尾页