善肯网页TXT采集器

善肯网页TXT采集器

大小:896K

更新时间:24-04-08

系统:Pc

版本:v1.0

开始下载

善肯网页TXT采集器是一个专业的网页文本采集工具,,可以帮助用户一键提取网页中的所有文字,总是有很多朋友喜欢在网页上看小说,看到好看的章节你可以使用善肯网页TXT采集器,它可以让你在抓取小说的时候获得更加快速的速度,让你可以在看到喜欢看的小说的时候更加的简单!

使用帮助

1、规则设置

在规则设置窗口,在网站中随便找一篇文,不写任何规则,先点击实时预览,看看能不能获取网页源代码,能获取则再写规则,不能获取就没必要继续了。

规则设置使用的是正则表达式匹配内容,有一定基础最好,没基础也可以参考给的范例,简单学习下,不需要深入学习正则。

规则设置的时候,目录页和内容页需要分开预览,也就需要两个链接,一个目录页链接、一个内容页链接。

关于替换,有通用替换和定制替换,这里目前不需要正则,普通替换就好,需要注意的是必须要输入值,空格也行。删除:选中整行,再按住delete键就行。内置\n再作为替换数据的时候代表换行。

编码,目前只设置有GBK和UFT-8,差不多大多数网站就是这两种编码其中之一。

2、解析与下载

解析请按解析地址2按钮

支持单章节下载和全文下载。

支持添加章节数【有的小说没有章节数的时候就可以勾上】

支持在线看,但是需要联网,此功能只是辅助,并非专业的看小说软件。

下载进度和总需时间显示,内置多线程。

3、关于软件

其实只要.exe就行,规则全是自己添加,commonrule.xml里面是通用替换规则。网站规则在rule文件夹下。我这边在里面放了两个网站的规则,主要是测试的时候是用的。其他网站规则,大家可以自己添加,或者支持开发者也行。

软件没加壳,c#开发的,没放病毒。不放心请不要用,我不背锅。

关于软件里面有个www.52pojie.cn跳转到论坛,我个人测试跳转的时候被360提示了,也有可能是因为跳转的是360浏览器,不知道你们会不会有这个问题。

xml里面的内容,如果不清楚的话还是不要动它,免得软件识别失败报错。

需要.net framework 4.5或者及以上版本框架支持,如果你电脑没有的话,需要下载安装,框架不大的。

软件特色

【操作简单】

完全可视化图形操作,无需专业IT人员,任何会使用电脑上网的人都可以轻松掌握。

【云采集】

采集任务自动分配到云端多台服务器同时执行,提高采集效率,可以很短的时间内 获取成千上万条信息。

【拖拽式采集流程】

模拟人的操作思维模式,可以登陆,输入数据,点击链接,按钮等,还能对不同情况采取不同的采集流程。

【图文识别】

内置可扩展的OCR接口,支持解析图片中的文字,可将图片上的文字提取出来。

【定时自动采集】

采集任务自动运行,可以按照指定的周期自动采集,并且还支持最快一分钟一次的实时采集。

【2分钟快速入门】

内置从入门到精通所需要的视频教程,2分钟就能上手使用,另外还有文档,论坛,qq群等。

展开全部内容
语言简体中文

同类热门

腾讯qq旋风电脑版腾讯qq旋风电脑版 比特彗星电脑版(bitcomet)比特彗星电脑版(bitcomet) utorrent pro中文版utorrent pro中文版 qBittorrent中文版qBittorrent中文版 free download manager for linux中文版free download manager for linux中文版 After Link Downloader中文绿色版After Link Downloader中文绿色版 阿里云盘电脑版阿里云盘电脑版 唧唧down最新版唧唧down最新版

猜你喜欢

电脑爬虫软件大全

在互联网信息时代,很多朋友们都会选择在网上收集自己需要的信息,想要快速的收集各种信息的话,就需要使用到相关爬虫工具了,通过爬虫软件我们就可以自动收集自己想要的数据信息,能够节约大量的手动时间,但是爬虫软件有哪些呢?小编今天就在此给大家提供了电脑爬虫软件大全,包括Python、杰灵采集器、火车头采集器等等,这里面的软件都是操作十分简单的,不需要用户会相关的技术就能够直接操作,无论是老手还是新手都适用,对此有兴趣的小伙伴们可以来下载体验。

共有 11 款软件全部>>

类似软件

热门标签

浏览器主页锁定软件大全 检测硬盘4k对齐的软件 可以用鼠标写字的输入法软件 压缩文件解密软件大全 钢笔字体大全 电脑lsp修复软件大全 Adobe系列软件大全 电脑线上教学软件 dll文件大全 好用的工程预算管理软件 navicat系列软件大全 超市播音软件推荐

网友评论0人参与,0条评论

评论需审核后才能显示

最新排行

手游排行软件排行热门应用