不需要写规则的采集工具-简数采集器

发布时间 2023-06-30 16:52:43作者: 长夜待

简数采集器】是采集和导出非常简单、高效的网页采集器,浏览器直接登录使用无需下载,不用手写规则,智能识别+鼠标点选快速生成采集规则。

简数采集器不仅提供网页文章全自动采集、定时采集、定时自动导出等基本功能,还创新实现了智能识别和鼠标可视化点选生成采集规则(不用手写规则)、书签采集等特色功能,大幅提升了采集配置效率,大大节省了电脑资源和成本。

采集方法:

1. 创建采集任务

  点击简数采集器控制台左侧菜单按钮“创建采集任务”,输入采集任务名和要采集的”列表页“网址,如:https://www.域名.com/ (这里首页即作为列表页:内容含有多个详情页即可),详情页链接可填或不填,系统会自动识别。

如下图,输入完成后点击 “下一步”。

 

 

2. 完善列表页智能获取结果(可选)

  简数采集器会先采用智能算法获取需要采集的详情页链接(多个),如果不是想要的数据,可以点击“列表提取器”进行手动指定,只需要在可视化界面上用鼠标点击。

  智能获取结果如下图:

 

列表提取器 打开后如下图:

 

3. 完善详情页智能获取结果(可选)

  上一步获取了多个详情页链接后,继续下一步,系统会使用其中一个详情页链接来智能抽取详情页数据(如:标题,作者,日期,内容,标签等)

  详情页智能抽取结果如下:

 

如果智能抽取的内容不是想要的,请打开【详情提取器】进行修改,可以对左侧的各字段进行修改或增加删除等。如下图:

 

4. 启动采集数据

完成后,即可启动运行,进行数据采集了。

采集后的数据结果,在该采集任务的“结果数据&导出发送”里面,您可以在这里对数据进行导出发送。

 

使用简数采集器采集数据就是这么简单方便,大大提高采集效率。