简数采集器支持全网采集,只要输入对应关键词即可采集全网相关数据,类似搜索引擎。
简数采集器的按关键词泛采集功能,会对搜索结果采集并进行智能识别,不需要用户配置采集规则。
关键词全网采集可用于舆情监控、市场研究分析等。
使用方法如下:
1. 添加全网采集任务
在简数采集器的左侧菜单的【采集任务管理】列表中,点击【按关键词泛采集】即可创建任务。
或者在简数采集器上方,点击【+按关键词采集】按钮也可以创建任务。
2. 配置全网采集任务
关键词:填写要采集的关键词,支持多个关键词,多个用英文分号;隔开;
支持高级指令,例如要指定采集一个网站的相关关键词文章:
关键词 site:www.域名.com
或者
site:www.域名.com 关键词
采集页数:设置采集的页数,一页最多可采集10条数据,但由于一些是广告或网站首页等页面,实际采集的数据量不固定;
开始页数:设置采集的起始页,建议从第2页或者第3页开始采集,因为第一页较多是广告页没有什么用;
3. 数据处理高级配置
还可以对采集的数据进行数据处理,例如删除,过滤某些内容,采集前配置好,采集时就会自动执行已设置的数据处理。
点击任务下方的红色【配置处理】按钮进入数据处理配置页面,按需求配置即可。
如果不需要,可以忽略不设置的,一般使用默认设置即可!
简数采集器关键词泛采集任务设置完成后,记得点击下方保存,然后即可启动采集按钮,。