分类
大小:33.1 GB更新日期:2016-12-30 08:39:45.000
类别:浏览辅助
火车采集器(LocoySpider)是一款专业的功能强大的网络数据/信息挖掘软件,通过灵活的配置,您可以很轻松的从网页上抓取文字、图片、文件等任何资源。程序支持远程下载图片文件,支持网站登陆后的信息采集,支持探测文件真实地址,支持代理,支持防盗链的采集,支持采集数据直接入库和模仿人手工发布等许多功能特点。火车采集器支持从任何类型的网站采集获取您所需要的信息,如各种新闻类网站、论坛、电子商务网站、求职招聘网站等。同时具有强大的网站登录采集、多页和分页的采集、网站跨层采集、POST采集、脚本页面采集、动态页面采集等高级采集功能。强大的php和c#插件支持,让您可以通过二次开发实现您所想要的任何更强大的功能。
功能特性:
1.规则自定义 - 通过采集规则的定义,可以搜索所有网站采集几乎任何类型的信息。
2.多任务,多线程 - 可以同时进行多个信息采集任务,每个任务可以使用多个线程。
3.所见即所得 - 任务采集过程所见即所得,过程中遍历的链接信息、采集信息、错误信息等都会及时的反映在软件界面中。
4.数据保存 - 数据边采集边自动保存到关系数据库中,并且数据结构能够自动适应,软件可以根据采集规则自动创建数据库,以及其中的表和字段,也可以通过导库方式灵活的将数据保存到客户已有的数据库结构中。
5.断点续采 - 信息采集任务可以在停止后从断点开始继续采集,从此你用不再担心你的采集任务意外中断了。
6.网站登录 - 支持网站Cookie,支持网站可视化登录,即使登录时需要验证码的网站也能采集。
7.计划任务 - 通过这个功能可以让你的采集任务定时、定量或者一直循环执行。
8.采集范围限制 - 可以根据采集的深度和网址的标识来限制采集的范围。
9.文件下载 - 可以将采集到的二进制文件(诸如:图片、音乐、软件、文档等等)下载到本地磁盘或者采集结果数据库中。
10.结果替换 - 可以将采集的结果根据规则替换成你定义的内容。
11.条件保存 - 可以根据某个条件来决定那些信息保存,那些信息过滤。
12.过滤重复内容 - 软件可根据用户设置和实际情况对重复内容和重复网址自动删除重复内容。
13.特殊链接识别 - 运用此功能可以将用JavaScript动态生成的链接或其他更古怪的连接识别出来。
14.数据发布 - 可以通过自定义接口,将已采集的结果数据发布到任意的内容管理系统和指定数据库中。现在已支持的目标发布媒体包括:数据库(access, sql server,my sql,oracle) ,静态htm文件。
15、预留编程接口 - 定义多个编程接口,用户可以在事件中利用PHP,C#语言进行编程,扩充采集功能。
更新日志:v9.3
1.修复一个当使用火车浏览器采集cookie时,与采集器处理冲突导致程序退出的问题。
2.修复任务编辑框,当未进行任何编辑时,仍然弹出保存对话框的问题。
3.标签组合时,支持对于循环获取新纪录的支持。
4.修复列表页标签,在重新开始任务后,未能加载“探测下载”的问题。
5.在任务编辑中,编辑Web,数据库发布模块时,增加对于任务标签的支持。
6.修复边采集边发布时,对于Id标签,未能正确发布的问题。
7.修复一个任务完成之后,下载列表显示为空白的问题。
8.对于网址库增加压缩方案,修复在网址库数据过大时,任务加载很慢的问题。
9.数据库的发布模块中,现在可以支持(insert ignore)语句
10.其他一些bug修复。
相关下载
Brave浏览器下载 v0.61.52 官方中文版2.3M | v1.25
下载360安全浏览器官方下载 v10.0.1634.0 最新版2.3M | v1.25
下载京东618叠蛋糕活动自动领金币脚本下载 2020 最新可用版2.3M | v1.25
下载adsafe广告管家官方下载 v5.4.0 电脑版2.3M | v1.25
下载广告终结者插件官方下载 v3.1.4 电脑版2.3M | v1.25
下载360浏览器官方下载 v12.1.2661.0 最新版2.3M | v1.25
下载旗鱼浏览器官方下载 v2.11 免费版2.3M | v1.25
下载油猴脚本官方下载 v4.9 crx版2.3M | v1.25
下载油猴tampermonkey谷歌浏览器插件下载 V4.9 官方版2.3M | v1.25
下载Adblock Plus谷歌浏览器插件下载 v5.2.0 免费版2.3M | v1.25
下载
山东潍坊联通 网友 夜之潘多拉
下载挺快的
天津移动 网友 一剑倾城
支持支持!
新疆乌鲁木齐电信 网友 当时明月在
玩了半天有点累,休息下来评论下
河南平顶山移动 网友 梵音战阁
废话,非常好玩。
陕西西安电信 网友 至少、还有你
还在研究游戏中,很多功能不会玩~~