全网采集器

发布时间 2023-07-14 16:57:40作者: 长夜待

简数采集器支持全网采集,只要输入对应关键词即可采集全网相关数据,类似搜索引擎。

简数采集器的按关键词泛采集功能,会对搜索结果采集并进行智能识别,不需要用户配置采集规则。

关键词全网采集可用于舆情监控、市场研究分析等。

使用方法如下:

1. 添加全网采集任务

简数采集器的左侧菜单的【采集任务管理】列表中,点击【按关键词泛采集】即可创建任务。

或者在简数采集器上方,点击【+按关键词采集】按钮也可以创建任务。

 

2. 配置全网采集任务

关键词:填写要采集的关键词,支持多个关键词,多个用英文分号;隔开;

               支持高级指令,例如要指定采集一个网站的相关关键词文章:

                    关键词 site:www.域名.com

       或者

       site:www.域名.com 关键词

采集页数:设置采集的页数,一页最多可采集10条数据,但由于一些是广告或网站首页等页面,实际采集的数据量不固定;

开始页数:设置采集的起始页,建议从第2页或者第3页开始采集,因为第一页较多是广告页没有什么用;

 

3. 数据处理高级配置

还可以对采集的数据进行数据处理,例如删除,过滤某些内容,采集前配置好,采集时就会自动执行已设置的数据处理。

点击任务下方的红色【配置处理】按钮进入数据处理配置页面,按需求配置即可。

如果不需要,可以忽略不设置的,一般使用默认设置即可!

 

简数采集器关键词泛采集任务设置完成后,记得点击下方保存,然后即可启动采集按钮,。