{循环递增数字=1,3,1} --标签表示采集1-3页,每次递增1。详细解释,请在规则编辑器里面点击相应标签。 例: [发布1返回编码]utf8[/发布1返回编码] --页面编码返回,本规则可删除 [发布提交网址1]http://m.admin5.com/getmore/0/1/{循环递增数字=1,3,1}?flag_id=650693[/发布提交网址1] [发布提交1参数1]article/(.*?)/[/发布提交1参数1] --参数标签只会保存第一个匹配结果,本规则可删除 [发布提交1采集1]<#li><#a href="(.*?)">[/发布提交1采集1] --采集标签可以保存所有匹配结果 (请去掉左边的2个#号再执行规则) [发布提交1采集1顺序]0[/发布提交1采集1顺序] --可以不用此标签,0=顶部结果放到顶部,1=顶部结果放到尾部。如果没有顺序标签,默认为0 [发布成功特征1]>===页面正常打开![/发布成功特征1] --成功了才会保存,新版也可以不用成功标签 [发布成功保存1]c:\m.admin5.com采集结果.txt==={发布提交1采集1}[/发布成功保存1] --保存相应结果到指定位置 Q:用发布标签如何采集多页? 答:只需要在神器首页,设置 发布x次换帐号 即可。 Q:为什么要加入这么一套采集标签呢? 答:因为之前的采集标签,不能获取相关参数,因为某些复杂的采集页面,是要带参数采集的,而且还要登录,还要协议头等。所以本次增加的这套采集标签,可以完全完全满足。 Q:采集效率高吗? 答:由于不是专业的采集功能,所以效率上肯定没有其他专业采集工具效率高。 --3.6.8.0 增加 [**提交1采集1顺序]标签; [2016-09-23更新] |
抢沙发||关于我们|手机版|营销神器 (蜀ICP备14013818号)
GMT+8, 2024-12-22 00:22