守望采集器是一个绿色免费的文章数据采集软件,可用来在网上采集各种数据。支持采集过程断点续采功能,不受浏览器意外关闭影响,重新启动后不会重复采集。只需要简单的鼠标复制剪贴即可生成完美的采集规则,无需烦琐的过程,即便你是新手亦能游刃有余地使用守望采集器采集任何内容!
功能介绍
1、支持文章内容分页采集;
2、支持论坛采集
3、支持UTF-8转换到GB2312,可采集内容字符格式为UTF-8的目标;
4、支持把文章内容保存到本地;
5、支持站点+栏目管理方式,使采集管理一目了然;
6、支持文章链接替换功能;
7、支持采集器设置无限过滤功能;
8、支持文章内图片采集保存到本地,自动替换文件名避免重复;
9、支持文章内FLASH文件采集保存到本地;
10、支持限制PHP FOPEN函数功能的虚拟主机;
11、支持采集结果人工筛选,并提供“空标题、空内容”的快速过滤删除;
12、支持PHPWIND、Discuz论坛导库,程序包内含2大论坛导库规则及操作指南说明;
13、支持自定义入库间隔时间,躲避虚拟主机并发数限制。
守望采集器优点
1、守望程序采用PHP开发支持跨平台运行,无论Windows还是Unix类操作系统都可运行,是一个高效采集、完美入库的在线应用软件。
2、守望不受安装地点限制,家里、单位电脑、网站服务器都可以;推荐直接安装在网站服务器上运行,更能体会守望超强功能和方便之处。
3、采用服务器安装,可将采集的图片/Flash直接抓取到本机使用;无需像其他采集器采集到个人电脑还要将数据FTP上传服务器。试想如果您当天采集图片、Flash超过100M,上传时间是个什么概念。
4、采用服务器安装,可快速进行采集内容导入CMS文章系统或BBS论坛系统;若您使用非在线的采集器,远程入库或上传SQL文件来入库都会浪费时间。
5、守望独有的断点续采、重复采集过滤功能,更能节约您制作内容时间。
守望采集器使用教程
主要说下如何导入你的网站,至于怎么编写采集规则,这个很简单,这里就不再重复了!
导入原理:主要是利用系统的api函数,模拟打开浏览器,自动填写采集的数据到表单,自动提交。
1.首先设置好你的网站参数,模拟导入不受网站系统、地理位置、编码方式、网站语言……影响,即可导入任何可以连接的网站,所以本版本新加入dvbbs(动网)、php168、phpcms……导入程式,如果没有你的网站的导入程式,你可以联系我帮你写!
2.经过测试可以导入gb2312、utf-8、big5……编码的网站,但是big5编码的网站导入后,可能会有少许乱码现象(不多)。
3.导入时间间隔,这个参数很重要哦,如果你网站连接速度很慢的话,请设置这个参数哦,本地测试可设置为0。 单位:毫秒(1秒=1000毫秒)
4. 最重要一点了哦:→你必须在IE浏览器中登陆你的网站,再执行导入数据!
例如:你的网站(DZ) http://bbs.dz.com
首先启动IE,连接你的网站,登陆,想用哪个用户发贴就用哪个用户登陆一下哦,cookie保存长点,登陆后,别关闭IE,最小化就行了。
然后采集数据,选择目标,导入数据即可!
- PC官方版
- 安卓官方手机版
- IOS官方手机版