蓝天采集器 V2.3安装教程:云端自动化数据采集发布系统——墨涩网
蓝天采集器云端自动化数据采集发布系统,蓝天采集器(SkyCaiji),致力于网站数据自动化采集发布,系统采用PHP+Mysql开发,可部署在云端服务器,使数据采集便捷化、智能化、云端化,让您随时随地移动办公!支持多级、多页、分页采集,自定义采集规则(支持正则、XPATH、JSON等)精准匹配任意信息流,几乎能采集所有类型的网页,绝大多数文章类型页面内容可实现智能识别,无缝对接各类CMS建站程序,实现免登陆导入数据,支持自定义数据发布插件,也可以直接导入数据库、存储为Excel文件、生成API接口等,软件实现定时定量全自动采集发布,无需人工干预!内置云平台,用户可分享及下载采集规则,发布供求信息以及社区求助、交流等
官网
http://www.skycaiji.com/
要求
PHP5.4 至 PHP7
安装环境要求
操作系统:Linux/Windows
软件环境:IIS/Apache/Nginx + MySQL 5.0 及以上
安装教程
1.将下载的软件上传至您的服务器,如果根目录有站点建议放在子目录里,解压后打开浏览器输入您的服务器域名或ip地址(存放在子目录则加上子目录的名称),进入安装界面
2.点击“接受”,进入环境检测页面
3.必须确保所有参数都正确,否则使用中会出现错误,点击“下一步”进入数据安装界面
4.填写好数据库及创始人配置,点击“下一步”
5.登录界面
6.后台界面
使用手册:
http://www.skycaiji.com/Manual/doc/about
蓝天采集器V2.3版本更新文档
1、修复自动采集死循环卡死问题,cli命令模式php路径问题(linux中自动识别php路径需要关闭目录跨站保护) 2、加强自动采集触发的安全性,优化自动采集性能减少系统消耗 3、加入函数插件,可用于数据处理的使用函数和条件判断中,(注意:条件判断中的使用函数功能有改动需要重新编写) 4、加入调用接口功能,可用于数据处理和发布设置中 5、新增代理类型socks4和socks5,加入代理ip动态获取功能,可对接多个api接口自动分析获取有效ip 6、新增腾讯翻译,优化翻译功能 7、加强页面分析功能,只需点击即可精准获取元素的xpath和同类型元素的xpath,制作规则更加简单 8、规则增加简单模式,有新手引导和页面分析功能,让新手更易入门 9、已采集数据新增统计图表,可查看年、月、日、任务、发布方式等相应的数据量 10、采集增加遵守robots协议功能(可关闭),采集设置和图片本地化设置分离 11、升级“第三方平台”应用 |
源码下载
官网下载:http://www.skycaiji.com/Manual/doc/install
网盘下载:https://www.lanzous.com/i7vio0f
版权声明:本文采用知识共享 署名4.0国际许可协议BY-NC-SA 进行授权
文章作者:<墨涩>
文章链接:
免责声明:本站为资源分享站,所有资源信息均来自网络,您必须在下载后的24个小时之内从您的电脑中彻底删除上述内容;版权争议与本站无关,所有资源仅供学习参考研究目的,如果您访问和下载此文件,表示您同意只将此文件用于参考、学习而非其他用途,否则一切后果请您自行承担,如果您喜欢该程序,请支持正版软件,购买注册,得到更好的正版服务。
本站为非盈利性站点,并不贩卖软件,不存在任何商业目的及用途,网站会员捐赠是您喜欢本站而产生的赞助支持行为,仅为维持服务器的开支与维护,全凭自愿无任何强求。