火车头采集器

火车头采集器

大小:53.33M

更新时间:24-11-20

系统:Pc

版本:v10.26

开始下载

火车头采集器官方版是一款功能强大且易于上手的专业采集软件,也是目前最受欢迎的网页数据采集软件,不仅可以灵活迅速地抓取网页上散乱分布的数据信息,还能够方便快捷的进行互联网上任何数据的获取、处理。

火车头采集器软件界面简洁,功能全面,配备了正文识别、中文分词识别、任意编码识别等多种识别系统,智能识别让操作更轻松,支持Access/MySQL/MsSQL/Sqlite/Oracle多种类型的数据库保存及发布,且不论是图片、压缩文件、视频等任意格式的文件都能轻松下载,还支持接口和插件扩展,满足用户各种采发需求,另外,火车采集器采用了分布式高速采集系统,多个服务端同时运作,解决工作学习中大量的数据下载及使用需求,让您能有更多时间做更多事。

软件亮点

1、几乎所有网页都能采集

无论什么语言,

无论什么编码。

2、和复制/粘贴一样准确

采集/发布如同复制/粘贴一样精准,

用户要的全都是精髓,怎能有遗漏!

3、速度是普通采集器的7倍

火车采集器采用顶级系统配置,

反复优化性能,让采集速度快到飞起来!

4、网页采集的代名词

独具十年历练,成就业界领先品牌,

想到网页采集,就想到火车采集器!

火车头采集器使用教程:

1、在本站下载解压,得到火车头采集器官方版软件包,双击运行"LocoyPlatform.exe"即可直接打开软件;

2、进入首界面之后,点击新建分组,名称和备注可随意写;

3、再点进刚才新建的分组,然后右键创建任务;

4、编辑任务名称,然后添加要采集的目标页面链接;

5、这里选择选择批量/多页采集;

6、网址采集的规则设置:

注意:采集的量根据自己的需求来改

7、点击添加采集规则;

8、然后来进行采集的第二部:内容规则的设置;

9、设置标题替换;

10、配置网站后台的登陆信息和要发布的栏目,然后保存配置 ,全部保存,就OK了,可以正式批量采集文章了。

特别提示:

1、火车头数据采集平台要求,您的电脑必须安装.net framework2.0或2.0以上框架.如果您的采集器打不开,请下载并安装该框架:

附windows .net framework 2.0

2、出现闪退的解决方案:

-火车头根目录有个文件名为AutoUpdate.exe的文件,把这个文件删除掉;

-打开C:\Windows\System32\drivers\etc,编辑hosts文件,添加以下内容:

(如果编辑hosts不生效请关闭安全卫士等软件)

功能特性

1、无限级多页采集,可以实现无限深度的采集

2、任务队列运行管理,支持Cron表达式

3、无限级分组任务管理,任务回收站功能

4、RSS地址采集功能

5、列表页分页采集获取功能

6、列表页附加参数获取功能

7、列表页及标签XPath可视化提取功能

8、标签纯正则替换功能

9、Http接口查看运行情况

10、导出记录为单个或多个Txt、html 文件

11、标签间自由组合功能

12、针对标签内容继续发送Http请求功能

13、无限级列表网址采集

14、从Http头信息中获取数据

15、标题内容正文提取功能

16、Aspx列表分页自识别

17、多网站站群式web发布

18、导出记录为Word格式

19、导出所有记录为Excel格式

20、使用随机二级代理服务器(支持Socket代理)

21、多扩展间数据交换功能

22、下载的图片自动加增强型水印功能

23、Ocr识别(图片转化为文字)

24、Http接口管理采集器运行

25、Mongodb数据库保存数据

26、主从服务器分布式采集

常见问题

1、火车采集器有什么功能?

火车采集器能够为您实现数据的采集发布、互联网数据挖掘、批量下载海量数据、舆情监控等多种功能,是助您充分利用网页数据的最佳工具。

2、什么是火车采集器的服务年限?

服务年限是指在相应的年限时间里可以免费升级到火车采集器发布的最新版本并享有VIP技术支持服务,购买火车采集器时可以依据个人需求选择服务年限为1年、2年、3年、5年,服务年限到期后用户可通过续费延长年限。

3、绑定机器码,可以随时更换吗?

免费版无需绑定机器码获得授权,基础版和旗舰版机器码版需绑定一台机器码,可免费更换一次;

旗舰版自动授权版绑定一台机器码,支持随时自动更换;

企业尊享版绑定三台机器码,可免费更换三次。另附赠两个加密狗,不限更换机器。

企业豪华版绑定六台机器码,不限更换次数。附赠四个加密狗,不限更换机器。

更新日志

v10.26版本

1、新增:文件上传支持华为云上传

2、新增:保存为本地TXT文件时,支持自定义扩展名,比如.ini,.py等等

3、新增:HTML标签过滤排除支持自定义过滤标签

4、新增:http请求头列表支持剪切板批量粘贴导入头信息设置

5、新增:POST分页设置支持日期参数[yyyyMMdd]

6、优化:火车采集器默认UA更新

7、优化:数据编辑SQL操作界面可随着编辑界面伸缩放大

8、修复:下载图片探测地址问题修复

9、修复:html标签过滤时部分标签不起效问题修复

10、修复:标签提取结果生僻字、繁体字不能查看问题修复

11、修复:数据获取中调用多个标签作为截取字符不起效问题的修复

12、修复:数据转换mysql编码设置无效问题修复

展开全部内容
厂商合肥乐维信息技术有限公司
语言简体中文

同类热门

EditorTools(全自动无人值守采集软件)EditorTools(全自动无人值守采集软件) 熊猫关键词工具熊猫关键词工具 SEO SpyGlass(网站seo分析工具)SEO SpyGlass(网站seo分析工具) rank tracker(网站关键词分析工具)rank tracker(网站关键词分析工具) 中英文长尾词猎手(长尾词挖掘工具)中英文长尾词猎手(长尾词挖掘工具) 石青建站养站大师石青建站养站大师 爱链换链神器爱链换链神器 蜗牛精灵seo工具(网站seo优化工具)蜗牛精灵seo工具(网站seo优化工具)

猜你喜欢

简单好用的数据采集工具软件

数据采集软件(采集器),就是采集的机器或者工具。采集软件就是为了解决从网页上、客户端上采集信息的需求而由专业的互联网软件公司研发的一整套工具软件。用于实现自动化采集从大批量网页上、客户端上采集数据。数据采集软件是用于网站信息采集,网站信息抓取,包括图片、文字等信息采集处理发布,这里小编整理了一些主流的数据采集软件,同时也是通用性采集软件,可以应用在各个行业,满足各种采集需求,是复杂采集需求的必选,也是采集软件使用新手的首选。

共有 18 款软件全部>>

电脑爬虫软件大全

在互联网信息时代,很多朋友们都会选择在网上收集自己需要的信息,想要快速的收集各种信息的话,就需要使用到相关爬虫工具了,通过爬虫软件我们就可以自动收集自己想要的数据信息,能够节约大量的手动时间,但是爬虫软件有哪些呢?小编今天就在此给大家提供了电脑爬虫软件大全,包括Python、杰灵采集器、火车头采集器等等,这里面的软件都是操作十分简单的,不需要用户会相关的技术就能够直接操作,无论是老手还是新手都适用,对此有兴趣的小伙伴们可以来下载体验。

共有 11 款软件全部>>

类似软件

热门标签

篆书字体大全 地图下载器软件大全 office各个版本激活工具免费版 视频分割软件大全 驱动检测软件推荐 cpu性能测试工具 视频后期制作软件 U盘杀毒软件大全 电脑上简单好上手的视频编辑软件 电脑看图软件大全 电脑考勤管理软件 电脑办公通讯软件大全

网友评论0人参与,0条评论

评论需审核后才能显示

最新排行

手游排行软件排行热门应用