hlzj88
发短消息
加为好友
hlzj88
当前离线
UID6278 帖子613 精华0 积分1349 PB1230 技术33 捐助20 阅读权限50 来自青海西宁 在线时间261 小时 注册时间2008-11-3 最后登录2020-5-7
上尉
帖子613 积分1349 技术33 捐助20 注册时间2008-11-3
1楼
跳转到 ?
倒序看帖
打印
字体大小: tT
发表于 2017-7-21 23:50
| 只看该作者
本帖最后由 hlzj88 于 2017-7-22 16:36 编辑
描述:地址如高中物理微课堂,头条的地址在浏览器打开后,想得到他内容的链接,但查看源文件是看不到链接的,因此我通常采用保存网页为带图片的网页,在保存的网页里可以看到内容链接。
因此请教,对于这样的网页,有没有办法在如上的地址基础上,一次得到他的内容的链接。
假设有困难,能不能通过代码自动滚动该网页的最早文章,然后自动保存为带图的网页。 提取链接的代码我自己写了,但每次要手动去开网页,并保存,这个过程是很繁琐的。
1
评分人数
bbaa:
伪-感谢给帖子标题标注[已解决]字样技术 + 1
收藏
分享
目的,学习批处理
codegay
发短消息
加为好友
codegay
当前离线
UID73953 帖子1262 精华0 积分1772 PB1286 技术162 捐助0 阅读权限60 来自伸手党去死,私信问问题的去死 在线时间3986 小时 注册时间2015-12-12 最后登录2020-4-2
少校
帖子1262 积分1772 技术162 捐助0 注册时间2015-12-12
2楼
发表于 2017-7-22 00:25
| 只看该作者
你需要这本书。Python网络数据采集 https://www.amazon.cn/dp/B01M3VN9CW/ref=cm_cr_ryp_prd_ttl_sol_1
去学去写去用才有进步。安装python3代码存为xx.py 双击运行或右键用IDLE打开按F5运行
TOP
codegay
发短消息
加为好友
codegay
当前离线
UID73953 帖子1262 精华0 积分1772 PB1286 技术162 捐助0 阅读权限60 来自伸手党去死,私信问问题的去死 在线时间3986 小时 注册时间2015-12-12 最后登录2020-4-2
少校
帖子1262 积分1772 技术162 捐助0 注册时间2015-12-12
3楼
发表于 2017-7-22 01:27
| 只看该作者
自己解析这个json吧
http://www.toutiao.com/pgc/ma/?p ... 1&callback=json
去学去写去用才有进步。安装python3代码存为xx.py 双击运行或右键用IDLE打开按F5运行
TOP
hlzj88
发短消息
加为好友
hlzj88
当前离线
UID6278 帖子613 精华0 积分1349 PB1230 技术33 捐助20 阅读权限50 来自青海西宁 在线时间261 小时 注册时间2008-11-3 最后登录2020-5-7
上尉
帖子613 积分1349 技术33 捐助20 注册时间2008-11-3
4楼
发表于 2017-7-22 07:06
| 只看该作者
谢谢 codegay ,还是算了吧,这两个回复都是我不能企及的高度。
目的,学习批处理
TOP
bbaa
发短消息
加为好友
bbaa
当前离线
UID73802 帖子316 精华0 积分275 PB179 技术32 捐助0 阅读权限20 在线时间3681 小时 注册时间2015-11-30 最后登录2020-4-18
四级士官
帖子316 积分275 技术32 捐助0 注册时间2015-11-30
5楼
发表于 2017-7-22 10:44
| 只看该作者
回复 4# hlzj88
抓包发现可以实现
不过需要第三方
http://123456
TOP
pcl_test
发短消息
加为好友
pcl_test
当前离线
UID69024 帖子3055 精华1 积分5322 PB3284 技术676 捐助0 阅读权限255 在线时间4056 小时 注册时间2014-10-19 最后登录2020-6-2
版主
帖子3055 积分5322 技术676 捐助0 注册时间2014-10-19
6楼
发表于 2017-7-22 10:45
| 只看该作者
//&cls&cscript -nologo -e:jscript "%~f0"&pause&exit
var host='http://www.toutiao.com';
var id='6607289740';
url=host+'/c/user/article/?page_type=1&user_id='+id+'&max_behot_time=0&count=1000';
var http=new ActiveXObject('Msxml2.XMLHTTP');
http.open('GET', url, false);
http.send();
json=http.ResponseText;
if(json){
var js=eval('('+json+')');
//max_behot_time=js['next']['max_behot_time'];
var data=js['data'];
if(data){
for(var i=0;i 3 评分人数 hlzj88: 不明觉厉技术 + 1 codegay: 1技术 + 1 bbaa: Javascript好评[Bat调用?]技术 + 1 TOP bbaa 发短消息 加为好友 bbaa 当前离线 UID73802 帖子316 精华0 积分275 PB179 技术32 捐助0 阅读权限20 在线时间3681 小时 注册时间2015-11-30 最后登录2020-4-18 四级士官 帖子316 积分275 技术32 捐助0 注册时间2015-11-30 7楼 发表于 2017-7-22 10:51 | 只看该作者 回复 6# pcl_test 速度啊6666 我还在研究CP和AS是不是必须..... 貌似不是。。。。 http://123456 TOP bbaa 发短消息 加为好友 bbaa 当前离线 UID73802 帖子316 精华0 积分275 PB179 技术32 捐助0 阅读权限20 在线时间3681 小时 注册时间2015-11-30 最后登录2020-4-18 四级士官 帖子316 积分275 技术32 捐助0 注册时间2015-11-30 8楼 发表于 2017-7-22 10:58 | 只看该作者 回复 6# pcl_test Count貌似是227 Hasmore刚好为false.... http://123456 TOP hlzj88 发短消息 加为好友 hlzj88 当前离线 UID6278 帖子613 精华0 积分1349 PB1230 技术33 捐助20 阅读权限50 来自青海西宁 在线时间261 小时 注册时间2008-11-3 最后登录2020-5-7 上尉 帖子613 积分1349 技术33 捐助20 注册时间2008-11-3 9楼 发表于 2017-7-22 12:38 | 只看该作者 回复 6# pcl_test 好厉害的代码,能看到窗口内容是我要的。但是,我得不到他们。还有,想收集更多的头条,因此需要能输入地址,或者从一个文件来读取地址表。 很实用的,要给孩子收集一些学习资料链接。{:2_36:} 目的,学习批处理 TOP bbaa 发短消息 加为好友 bbaa 当前离线 UID73802 帖子316 精华0 积分275 PB179 技术32 捐助0 阅读权限20 在线时间3681 小时 注册时间2015-11-30 最后登录2020-4-18 四级士官 帖子316 积分275 技术32 捐助0 注册时间2015-11-30 10楼 发表于 2017-7-22 16:26 | 只看该作者 本帖最后由 bbaa 于 2017-7-22 16:31 编辑 回复 9# hlzj88 如果都是寻找个人主页的所有见面的话 http://www.toutiao.com/c/user/6607289740/#mid=6607310215 把user/后面的数字提取出来,放到斑竹的代码里 中的id=xxxxx http://123456 TOP bbaa 发短消息 加为好友 bbaa 当前离线 UID73802 帖子316 精华0 积分275 PB179 技术32 捐助0 阅读权限20 在线时间3681 小时 注册时间2015-11-30 最后登录2020-4-18 四级士官 帖子316 积分275 技术32 捐助0 注册时间2015-11-30 11楼 发表于 2017-7-22 16:29 | 只看该作者 回复 9# hlzj88 可以把地址存到txt 把斑竹代码的第一行改为 //&cls&(cscript -nologo -e:jscript "%~f0")>输出.txt&pause&exit复制代码这样信息就会保存在 输出.txt http://123456 TOP hlzj88 发短消息 加为好友 hlzj88 当前离线 UID6278 帖子613 精华0 积分1349 PB1230 技术33 捐助20 阅读权限50 来自青海西宁 在线时间261 小时 注册时间2008-11-3 最后登录2020-5-7 上尉 帖子613 积分1349 技术33 捐助20 注册时间2008-11-3 12楼 发表于 2017-7-22 16:32 | 只看该作者 回复 11# bbaa 谢谢你,看了一下午的Wscript ,就是在寻找输出的方法。 再次谢谢版主。 目的,学习批处理 TOP