通过PHP curl向腾讯微博发送广播全过程
2010-8-15
效果见这里:http://cnbang.net/lab/txwb/
由于朋友分布在不同的微博,我希望有个同步到twitter、新浪微博、腾讯微博的工具,但等这么久都没出现这样的工具,微博通似乎停工了,也不支持twitter和腾讯微博,于是想自己做个。
新浪微博和twitter都开放API,要实现同步发送很简单,腾讯微博未开放,就需要hack一下了。这次把研究过程都记录下来了,写得很长~实际上在curl实现那部分我花的时间比较多,走的弯路也多,但由于篇幅原因那部分都简省了~
0.原理
基本原理就是通过php的curl发送带cookie的请求,需要解决:
1.模拟登陆,获取cookie
2.通过curl带上cookie发送广播
最难办的就是第一个问题。
1.研究登陆方式
上http://t.qq.com/查看登录页面的源代码,看到登录表单form的onSubmit这么写:
<form id=”loginform” method=”post”>
form里没有action,说明全都是在onsubmit的js里处理的,应该找下ptui_checkValidate这里执行了啥,查看网页下面包含的js文件,搜索到ptui_checkValidate,把这一部分通过http://js.clicki.cc/美化一下,看到:
function ptui_checkValidate() { g_time.time12 = new Date(); if (f_u.value == "") { alert("您还没有输入帐号!"); f_u.focus(); return false } ..... f_p.setAttribute("maxlength", "32"); ajax_Submit(); ptui_reportNum(g_changeNum); g_changeNum = 0; return false }
这里是检查错误的,如果没有错误就跳到ajax_Submit了,继续找ajax_Submit,美化后看到
function ajax_Submit() { if (!isLoadVC) { g_uin = 0 } var D = true; var E = document.forms[0]; var B = ""; for (var A = 0; A < E.length; A++) { if (E[A].name == "fp" || E[A].type == "submit") { continue } .... B += "&" } B += "fp=loginerroralert"; var C = document.createElement("script"); C.src = "http://ptlogin2.qq.com/login?" + B; document.cookie = "login_param=" + encodeURIComponent(login_param) + ";domain=ui.ptlogin2." + g_domain + ";path=/"; document.body.appendChild(C); return }
就是给B加一堆参数然后建一个script标签去请求它,重要的几句是
var F = ""; F += E.verifycode.value; F = F.toUpperCase(); B += md5(md5_3(E.p.value) + F)
这里F是一个验证码的东西,E.p.value是用户输入的密码,先给密码用md5_3加密再串上验证码再用md5加密,就构成后台需要验证的密码了。
而这个请求其他参数可以直接在firebug的网络里看到,随便输入点东西点登录,就会出现个这样的请求
http://ptlogin2.qq.com/login?u=@name&p=1EA1F449CB05D395E148A6C949F9E1E5&verifycode=!KL1 &aid=46000101&u1=http%3A%2F%2Ft.qq.com&ptredirect=1 &h=1&from_ui=1&dumy=&fp=loginerroralert
后来发现有些参数是没用的,可以缩短成
http://ptlogin2.qq.com/login?u=@name&p=1EA1F449CB05D395E148A6C949F9E1E5&verifycode=!KL1 &aid=46000101&fp=loginerroralert
u是用户名,verifycode是验证码,p是上面说的加密过后的东西。
2.获取验证码
那就是说只要知道验证码就可以直接发送这个网址进行验证获取cookie了。
在页面源码里找到:
<input id=”verifycode” class=”inputstyle” style=”ime-mode: disabled” maxlength=”4″ name=”verifycode” value=”!LKD” tabindex=”3″ />
那验证码应该就是这个!LKD了吧?接下来在firebug里执行md5(md5_3(“password”) + “!LKD”)获得加密后的一串东西,带入上面网址的p里,把!LKD也代入verifycode,直接在浏览器打开这个网址请求,结果不行,登录失败。
啥原因?折腾了一会,发现每次点登录它都会自动请求一个地址http://ptlogin2.qq.com/check?uin=@name&appid=46000101&r=0.6614258849969921,响应的是ptui_checkVC(‘0′,’!51B’);这样的数据,喔,soga,验证码是要更新的,源码HTML里的那个验证码是没用的,这个js返回的才是最新的验证码。把这个验证码拿出来重新做一次上面的操作,在浏览器输入修改了那些参数的网址,结果成功了,cookie在这时候写入,再次打开t.qq.com已经登录了。
3.登陆总结
后来发现,不需要打开登录页面,登录过程可以简化成两步,
1.请求http://ptlogin2.qq.com/check?uin=@name&appid=46000101&r=0.6614258849969921 获取验证码
2.加密后把数据代入请求http://ptlogin2.qq.com/login?u=@name&p=1EA1F449CB05D395E148A6C949F9E1E5&verifycode=!KL1 &aid=46000101&fp=loginerroralert 就完成登录了。
4.找发送广播网址
知道怎么模拟登录了,接下来找找发送广播的网址。
发送框不是普通的表单,而是都用js处理的,得在js里去找那个网址。可以像上面寻找登陆框处理函数那样去寻找网址,这里只是寻找网址,也有另外的方法,就是随便发一条广播,在firebug的网络里看看请求了哪些网址,一看发现请求了这个网址http://t.qq.com/publish.php 带了content参数,于是测试一下看能不能在firebug的控制台发送条广播:
var b = UI.xmlHttp(), a = {data:{"content":"发广播啊发广播"},url:"publish.php"} b.onreadystatechange = function() { if (b.readyState == 4 && b.status == 200) try { console.info("df"); } catch(d) {} else return b }; b.open("POST", a.url, true); b.setRequestHeader("Content-type", "application/x-www-form-urlencoded"); var c = []; for (var e in a.data) c.push(e + "=" + encodeURIComponent(a.data[e])); a.data = c.join("&") b.send(a.data);
结果发送成功了,这个地址没错,参数也就content一个。好,接下来就用php的curl执行这整个过程。
5.用curl实现登陆
先研究半天curl怎么获取cookie和发送cookie的,最后照这里做了:http://coderscult.com/php/php-curl/2008/05/20/php-curl-cookies-example/ 不明白为啥要保存成一个文件这么麻烦,不管,先把效果做出来再再说~
照上面写的,先执行
$ch = curl_init(); curl_setopt($ch, CURLOPT_URL,"http://ptlogin2.qq.com/check?uin=@bang&appid=46000101&r=0.6614258849969921"); curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1); $response = curl_exec ($ch);
接着提取里面的验证码
$pat = '/\'(!(.*?))\'/i'; preg_match_all($pat, $response, $m); $verifycode = $m[1][0];
js里密码加密部分(B += md5(md5_3(E.p.value) + F))直接在网上找到PHP对应的加密方法,原来md5_3就是执行3次md5,囧,原来QQ其他产品也常用这种方式加密。
接着通过这个验证码和加密后的代码代入请求第二个网址
$ch = curl_init(); curl_setopt($ch, CURLOPT_COOKIEJAR, $ckfile); curl_setopt($ch, CURLOPT_URL,"http://ptlogin2.qq.com/login?u=@bang&;p=$code&verifycode=$verifycode&aid=46000101&fp=loginerroralert"); curl_setopt ($ch, CURLOPT_RETURNTRANSFER, true); $result = curl_exec ($ch);
结果发现不行,根本没登陆,怎么回事?卡了会,再到t.qq.com的登陆页面兜转一会,发现返回验证码的那个网址响应头信息里是带有SetCookie的,喔,那就得要把第一个请求的cookie也保存下来传给第二个网址了。结果试验后显示登陆成功了。
6.实现广播
接下来就可以发送广播了?
$ch = curl_init (); $params = "content=测试&;viewModel=0"; curl_setopt($ch, CURLOPT_URL,"http://t.qq.com/publish.php"); curl_setopt ($ch, CURLOPT_COOKIEFILE, $ckfile2); //获取第二个网址curl保存的cookie curl_setopt ($ch, CURLOPT_RETURNTRANSFER, true); curl_setopt($ch, CURLOPT_POST, 1); curl_setopt($ch, CURLOPT_POSTFIELDS, $params); $output = curl_exec ($ch); echo $output;
结果发现这样又不行,显示发送失败,在这里卡了很久,怎么回事呢。试验了很多很多方法,最后试验到Request Header,这里没加Header,在firebug里看到在t.qq.com发送时它附带了许多Header过去,于是加一些Header试试,结果加了”Referer:http://t.qq.com/”这个Header就大功告成了,想来后台是得判断一下Referer~~终于成功了,研究了这么久,真兴奋啊,接下来就是加加外壳了。不过以这样的方式登陆和发送,腾讯微博要是有小小的改动就挂了,希望它开放API前别改了~也希望早点开放API~
一个技术小白表示,很多技术名词不懂,想问一下,不知道能不能放出成品,谢谢!
希望腾讯能开放API,这样同步腾讯微博就容易多了。