- 积分
- 24803
- 注册时间
- 2007-3-16
- 激情
- 17294
- 居住地
- 重庆市 江津市
- 在线时间
- 55718 小时
- 最佳答案
- 974
用户组:管理员
为人民服务!
|
规则工作流程图:
查看所有标签详细介绍:http://www.wzdr.cn/h/
此页面详细内容已更新到帮助中心:http://www.wzdr.cn/misc.php?mod=faq&action=faq&id=42
技巧部分:
1、获取参数时,尽可能找一个返回数据比较少的页面
比如取DZ论坛的formhash值,我们尽量在发布页、帮助页获取,而不是在首页获取,因为首页返回的源码比较多,这样影响执行速度。
2、成功特征用 >退出< 而不是 退出 。
3、不需要重复获取的参数,尽量在登录后完成。
比如DZ论坛的formhash值,我们登录成功后获取一次即可,而不是在每次发布时都去获取他,这样可以提交执行速度。
低效率写法:
[登录前参数1来源]http://www.xx.com/member.php?mod=logging&action=login[/登录前参数1来源]
[登录前参数1]<input type="hidden" name="so" value="(.*?)">[/登录前参数1]
[登录前参数2来源]http://bbs.chunqiuwang.com/member.php?mod=logging&action=login[/登录前参数2来源]
[登录前参数2]loginhash=(.*?)">[/登录前参数2]
[登录前参数3来源]http://bbs.chunqiuwang.com/member.php?mod=logging&action=login[/登录前参数3来源]
[登录前参数3]<input name="sechash" type="hidden" value="(.*?)">[/登录前参数3]
--上面这种写法,会访问3次同一个页面,执行速度慢
优化后写法:
[登录前参数1来源]http://www.xx.com/member.php?mod=logging&action=login[/登录前参数1来源]
[登录前参数1]<input type="hidden" name="so" value="(.*?)">[/登录前参数1]
[登录前参数2]loginhash=(.*?)">[/登录前参数2]
[登录前参数3]<input name="sechash" type="hidden" value="(.*?)">[/登录前参数3]
--上面这种写法,只需要访问1次,就可以获取到后面3个参数
--当有 登录前参数2 时 如果没有 登录前参数2来源 那么 就直接取 登录前参数1来源 的返回结果
--当有 登录前参数3 时 如果没有 登录前参数3来源 那么 就直接取 登录前参数1来源 的返回结果
4、有验证码的,必须填写失败特征,格式如: 您还没有输入验证码===验证码错误
注意,=== 后面必须是 验证码错误 这5个字,在规则编辑器里面,验证码错误会以蓝色显示。
5、点击抓包工具查找按钮,查询抓包时的密码,可以快速找到登录数据包。
6、点击抓包工具查找按钮,查询抓包时的标题部分(非中文),可以快速找到发布数据包。
7、成功特征 的返回值必须是200的返回内容,而不是302(跳转)301(重定向)的返回内容。(也就是302的后面一行)
8、如何取时间?
处理前:{时间=年}-{时间=月}-{时间=日} {时间=时}:{时间=分}:{时间=秒}
处理后:2013-07-08 15:33:31
9、如何取时间戳?
处理前:{时间戳}
处理后:1373268251126 (13位时间戳)
处理前:{时间戳=10}
处理后:1373268251 (10位时间戳)
另外一种时间格式为:0.4036013968689921 (通常是给浏览器看的,防止被缓存,可以不修改这个值)
处理前:{随机时间戳}
处理后:0.4036013968689921
时间戳是给浏览器防止缓存用的,规则编辑器里面可以不用理会这个数值!
10、支持随机标签,包括{随机数字=*}{帐号}{密码}{文章标题}{关键词};
11、可以用[变量1][/变量1]到[变量10][/变量10] 来自定义变量,标签中间支持随机标签,调用结果为:{变量1};
如:[变量1]{随机字母=2}{随机数字=6}[/变量1]
处理后:{变量1} 结果为:gd874654
12、正则如何取DSUGGYGR=6589758里面的数字?
正则表达式:([0-9]+) 结果为:6589758
13、正则如何取DSUGGYGR=Ks5f34f5k里面=右边 和 左边的文本?
正则表达式:=(.*)$ 结果为:Ks5f34f5k
正则表达式:^(.*)= 结果为:DSUGGYGR
取全部内容:(.*) 结果为:DSUGGYGR=Ks5f34f5k
14、规则加载顺序:
注册规则(待添加) → 登录规则 →发布规则 (如果没有,会自动跳过)
登录规则 → 采集规则
15、DX系列 UTF8编码论坛发日志编码比较特殊,应设置为 [编码]gb2312转utf8[/编码]
16、直接拖动.wzdr规则到软件首页<帐号列表框>即可快速加载;
17、你可以在首页左边【编辑器】上右键,直接打开最近的规则;
18、[编码][/编码] -- 这里留空,表示发布的标题和内容不需要任何编码转换;
19、测试的时候建议标题和内容不要设置为标签,发布成功后再修改为{文章标题}{文章内容}这样就可以排除编码等引起的问题;
20、如果提交网址返回内容里面没有成功帖子的编号,不建议在板块页面直接获取成功地址,应该在个人中心里面找到自己发布的帖子列表,在这里获取到的最新帖子才是自己发的,在板块里面获取到在最新帖子也许是别人发的;(比如某个板块发帖频率非常高)
21、正则建议这样写 pin fid=(.*?)" 不建议 bing\?chongqing pin fid=(.*?)"> </a>
22、
错误正则: bing?chongqing pin fid=(.*?)" 正确正则: bing\?chongqing pin fid=(.*?)"
错误正则: bing(chongqing) pin fid=(.*?)" 正确正则: bing\(chongqing\) pin fid=(.*?)"
错误正则:random_str=(.*?)\" 正确正则:random_str=(.*?)\\"
(有空建议花30分钟百度看下正则表达式基础教程,只需要很基础知识即可)
23、如果抓包的时候有返回数据,而规则编辑器返回为空,很可能是gzip压缩过的,这时候需要在标签后面加gzip,如: ** 提交网址1]gzip
(需要2.7.112以上版本支持,同时你也可以考虑用其他方式来判断,用gzip的情况比较少)
24、当标签 [发布提交网址1]里面有网址时,才会调用{关键词}、{文章标题}、{文章内容},如果你只是用了登录标签,可调用 {词库1}{词库2}{词库3}来调用指定文本;
25、抓包时,部分网站登录后,点击发布,是新窗口打开,这时候可以把新窗口的网址复制后,放到之前页面,就能继续抓包;
26、部分特殊网站抓不到数据时(如某些上传数据包),请使用 HTTPAnalyzer抓包工具,请百度查阅相关资料;
27、如何取最后一个成功网址编号?
[成功网址]<div class="album_list_title"><a href="http://www.b.com/photo/album/(.*?)/p1"[/成功网址]
上面这个是取第一个匹配到的网址编号!
[成功网址]<div class="album_list_title"><a href="http://www.b.com/photo/album/{取最大数字}/p1"[/成功网址]
上面这个是取匹配到的所有网址编号中,数字最大的一个!
这个是取第一个
上面那个就是最最大的一个数字 通常就是最后一个
28、如果规则标签:[登录提交网址1][/登录提交网址1]不为空,就会执行登录部分;如果[发布提交网址1][/发布提交网址1]不为空,就会执行发布部分;
如果你想让他执行,可以在里面输入百度或搜搜首页网址。
29、如果登录编码为gbk,发布编码为utf8怎么办?
[编码]utf8[/编码] --这个是全局
[登录编码]gbk[/登录编码] --这个是单独指定编码
30、国外站协议头怎么设置?
部分带有 ------------------- 的数据包,通常我们只设置了ontent-Type:
但是国外部分网站应该这样设置:
[发布协议头1]Accept: text/html, application/xhtml+xml, */*
Referer: http://wallinsidexxx.com/new_post.php
Accept-Language: zh-CN
User-Agent: Mozilla/5.0 (compatible; MSIE 9.0; Windows NT 6.1; WOW64; Trident/5.0; KB974487)
Content-Type: multipart/form-data; boundary=---------------------------7dd86e22ede (这个值和提交数据 要相同)
[/发布协议头1]
因为他们会检测来“Referer”,当然,只是部分网站。
31、规则报告 内容过多,看着头大怎么办?
通常我们需要先 【返回】内容,那么我们搜 “返回” 然后按F3 就能快速切换到相应位置;
另外,我们还需要检测 【正则结果】 看里面是否有内容,这时候我们搜 “正则” 然后按F3 就能快速切换到相应位置;
当然,也可以把内容另存为.htm 双击打开,就能看见很直观的提示。
31、在软件底部>登录报告< >发布报告< >规则报告< 上点击右键,可以以为html方式打开报告内容,方便检测失败提示;
32、遇到gbk编码数据包,如何更直观的处理?
如数据包:
Body=%CE%D2%CA%C7%C4%DA%C8%DD%A3%AChehe&Description=%CE%D2%CA%C7%C4%DA%C8%DD%A3%AChehe&UpFileID=&ThreadStyle=&ForumID=1&IsVote=0&Subject=%CE%D2%CA%C7%B1%EA%CC%E2%A3%AChehe&Category=&ThreadEmoticonID=0&StickyDate=0&BBSXPCodeForm=&Tags=&EditSubmit=+%B7%A2%B1%ED+
在数据包内容页面,我们能轻松看见他的编码为 Charset=GB2312
这时候,我们可以直接把他解码为中文,然后再修改,这样就比较直观了,gbk解码后结果:
Body=我是内容,hehe&Description=我是内容,hehe&UpFileID=&ThreadStyle=&ForumID=1&IsVote=0&Subject=我是标题,hehe&Category=&ThreadEmoticonID=0&StickyDate=0&BBSXPCodeForm=&Tags=&EditSubmit=+发表+
注:只有编码为GB2312时,才可以这样做,如果是UTF-8编码的网站,这样做可能就要出问题了。
33、如何获取 [发布提交网址1][/发布提交网址1] 返回的参数?
用:[发布提交1参数1][/发布提交1参数1]
[发布提交1参数2][/发布提交1参数2]
[发布提交1参数3][/发布提交1参数3]
如图:
34、论坛登录后才弹出验证码,如何处理?
论坛都有类似这样的页面,能一次抓到需要的数据,如:
http://bbs.28tui.com/member.php?mod=logging&action=login
35、验证码识别率低时,请设置验证码类型?
比如字母O 容易被打成 数字0
比如字母l 容易被打成 数字1
如果是纯英文验证码,那么你就需要设置验证码类型了。
又比如是 谷歌验证码,也可以单独设置为谷歌验证码类型。
36、如果更直观的查看规则报告内容?
可以在规则报告里面按F12,带哦用第2总WEB显示方式,这时候就可以很轻松的屏蔽掉返回的所有源码,方便查看各个参数。
以上技巧会归类整理到 '营销神器帮助手册.CHM' 里面,不断补充中。 |
评分
-
查看全部评分
|