今日头条web版的有评论,h5的没有,因此来抓web数据。
抓取数据url类似于:
其中max_behot_time是从上条数据中获取,类似于offset,as&cp比较好分析,用默认值也可以。
重点分析_signature,首先看_signature怎么来的?
chrome里进入开发者模式,然后ctrl+shift+f进入全局搜索,查找_signature出处:
image
image
首先AS & CP代码比较简单,还有默认值,试了下默认值也可以用,如果懒得话:
image
然后_signature的破解:
image
可以看出,里面有些莫名特殊字符,这些支付最后需要被置换成正常的function字符串,替换方法:
.replace(/[-]/g, function(i) { return e[15 & i.charCodeAt(0)] })
替换参数:
"v[x++]=v[--x]t.charCodeAt(b++)-32function return ))++.substrvar .length(),b+=;break;case ;break}".split("")
在js中把他们当做字符串运行一下就可知结果。
最后参数调用。
需要注意:global.navigator.userAgent 需要与请求的user-agent一致。**
详细代码: