资源采集软件/页面规则设置

易语言 2020-03-12 18:12:21

资源采集软件/页面规则设置

说明:

1、刚写完的采集软件。

2、模块使用了:模块我就不打包了,增加安全度。

3、很简单的一个软件,大牛可以绕道啦

4、root\rule 目录里存放的是网站规则的配置文件,可以用记事本打开。

5、root\article 目录里存放的是爬取出来的html文件,可以用浏览器打开。(没有把图片保存到本地,省空间,省速度,哈哈)

6、tmp 目录里存放的是临时测试爬取的html文件。

7、LinkId.txt文件是取网站链接的 配置文件。

教程:

1、请新建文件夹,解压压缩包里的所有文件,并编译源码。

2、选择夹介绍:

?第一个选择夹:正式遍历文章(就是测试遍历正常,才开始正式遍历)
?第二个选择夹:测试遍历(就是自己添加完规则后,测试遍历是否正常!)
?第三个选择夹:添加规则(就是自己添加网站的采集规则,头文本,尾文本啊,那些的)

使用方法:
?请新建文件夹,解压压缩包里的所有文件,并编译源码。
?进入第三个选择夹,选择规则文件,点击载入按钮。
?载入完毕后(编辑框会出现内容),点击右下角的 “测试遍历” 按钮。
?软件自动进入第二个选择夹,这个时候可以点击 “开始遍历” 按钮。
?遍历完成后会弹出信息框,点击列表框,可以查看遍历出的内容是否正确。
?以上是临时采集,文件保存在 tmp 目录下。
?正式采集就进入第一个选择夹选择规则 开始采集 ,正式采集过程可视!