位置:吾爱资源网 > 下载中心 > 软件下载 > 水淼软件

Sm·关键词网址采集器V2.12

资源单独售价:30

本资源已审核通过,内容严格保密,格式标准,质量保证。VIP会员免费下载!

大小:1.50 MB 人气:

资源介绍:

根据关键词搜索百度、搜狗、谷歌、必应、雅虎、360等,采集搜索结果的网址和标题输出保存。谷歌需要翻墙。每个关键词600到800条。采集例子 >>

关键词可以附带搜索引擎参数,就跟网页里输入关键词搜索一样,如百度里搜索结果网址中必须包含bbs的关键词,则输入“关键词 inurl:bbs.”

保存模板可引用的数据:
#网址#:采集的原始网址
#标题#:网址对应的网页标题
#域名#:原始网址的域名部分,如“http://test.52bfb.cn/123.htm”中的“test.52bfb.cn”
#顶级域名#:取原始网址的顶级域名部分,如“http://test.52bfb.cn/123.htm”中的“52bfb.cn”
#描述#:网页标题下面的一段描述文字


问题集锦:
1、为什么采集一段时间之后,无法采集?
这可能采集多了被搜索引擎限制。一般换个IP(如使用VPN换IP)即可继续采集,如果不换,只能等待搜索引擎取消屏蔽之后才能继续采集。百度的屏蔽时间通常半小时到数小时。

2、不同批次关键词采集的结果为什么会存在部分网址重复?
尤其是只引用了#域名#或#顶级域名#之后,这种部分网址重复的情况比较多。这也是正常的,因为每个网站的内页可能包含很多主题,不同关键词都可能采集到该网站的不同内页,当引用域名后,相同网站的不同内页的域名结果自然就相同了。
另外,软件里的自动去重,是针对本次采集的结果内部进行去重,以前采集的结果是不在本次去重范围的。如果两次采集的结果存在部分网址重复,可以把他们合并一起,使用软件去重(文本去重打乱器)。

3、为什么采集回来的网址的主题与关键词不符?
这是因为引用了#域名#或#顶级域名#后,取的是域名部分,域名打开的是该网站的首页,而采集的原网址可能不是首页,而是该网站的某一篇文章的内页,该内页包含关键词主题,因此被搜索引擎收录,软件才能采集得到。但取域名后,你打开的域名首页就不一定包含该关键词。
为了比对采集是否正确,可以在保存模板里输入:<a href="#网址#" target="_blank">#标题#</a><br>,保存为htm文件,采集完后可以自己打开该文件查看比对。

 关键词网址采集器.png

版权声明

本资源仅代表作者观点,不代表本站立场。
本资源来源于网络或系作者授权发表,未经许可,不得转载。
本资源地址:http://www.52bfb.cn/soft/softdown.asp?softid=2875
更新日期:2019-10-26 00:57:10