当前位置:聪少自媒体网 > 今日头条 > 正文

【已解决】如何获取今日头条网的头条号主页每条文章链接

2020-10-05 今日头条 聪少自媒体

hlzj88

发短消息

加为好友

hlzj88

当前离线

UID6278 帖子613 精华0 积分1349 PB1230 技术33 捐助20 阅读权限50 来自青海西宁 在线时间261 小时 注册时间2008-11-3 最后登录2020-5-7

上尉

帖子613 积分1349 技术33 捐助20 注册时间2008-11-3

1楼

跳转到 ?

倒序看帖

打印

字体大小: tT

发表于 2017-7-21 23:50

| 只看该作者

本帖最后由 hlzj88 于 2017-7-22 16:36 编辑

描述:地址如高中物理微课堂,头条的地址在浏览器打开后,想得到他内容的链接,但查看源文件是看不到链接的,因此我通常采用保存网页为带图片的网页,在保存的网页里可以看到内容链接。

因此请教,对于这样的网页,有没有办法在如上的地址基础上,一次得到他的内容的链接。

假设有困难,能不能通过代码自动滚动该网页的最早文章,然后自动保存为带图的网页。 提取链接的代码我自己写了,但每次要手动去开网页,并保存,这个过程是很繁琐的。

1

评分人数

bbaa:

伪-感谢给帖子标题标注[已解决]字样技术 + 1

收藏

分享

目的,学习批处理

codegay

发短消息

加为好友

codegay

当前离线

UID73953 帖子1262 精华0 积分1772 PB1286 技术162 捐助0 阅读权限60 来自伸手党去死,私信问问题的去死 在线时间3986 小时 注册时间2015-12-12 最后登录2020-4-2

少校

帖子1262 积分1772 技术162 捐助0 注册时间2015-12-12

2楼

发表于 2017-7-22 00:25

| 只看该作者

你需要这本书。Python网络数据采集 https://www.amazon.cn/dp/B01M3VN9CW/ref=cm_cr_ryp_prd_ttl_sol_1

去学去写去用才有进步。安装python3代码存为xx.py 双击运行或右键用IDLE打开按F5运行

TOP

codegay

发短消息

加为好友

codegay

当前离线

UID73953 帖子1262 精华0 积分1772 PB1286 技术162 捐助0 阅读权限60 来自伸手党去死,私信问问题的去死 在线时间3986 小时 注册时间2015-12-12 最后登录2020-4-2

少校

帖子1262 积分1772 技术162 捐助0 注册时间2015-12-12

3楼

发表于 2017-7-22 01:27

| 只看该作者

自己解析这个json吧

http://www.toutiao.com/pgc/ma/?p ... 1&callback=json

去学去写去用才有进步。安装python3代码存为xx.py 双击运行或右键用IDLE打开按F5运行

TOP

hlzj88

发短消息

加为好友

hlzj88

当前离线

UID6278 帖子613 精华0 积分1349 PB1230 技术33 捐助20 阅读权限50 来自青海西宁 在线时间261 小时 注册时间2008-11-3 最后登录2020-5-7

上尉

帖子613 积分1349 技术33 捐助20 注册时间2008-11-3

4楼

发表于 2017-7-22 07:06

| 只看该作者

谢谢 codegay ,还是算了吧,这两个回复都是我不能企及的高度。

目的,学习批处理

TOP

bbaa

发短消息

加为好友

bbaa

当前离线

UID73802 帖子316 精华0 积分275 PB179 技术32 捐助0 阅读权限20 在线时间3681 小时 注册时间2015-11-30 最后登录2020-4-18

四级士官

帖子316 积分275 技术32 捐助0 注册时间2015-11-30

5楼

发表于 2017-7-22 10:44

| 只看该作者

回复 4# hlzj88

抓包发现可以实现

不过需要第三方

http://123456

TOP

pcl_test

发短消息

加为好友

pcl_test

当前离线

UID69024 帖子3055 精华1 积分5322 PB3284 技术676 捐助0 阅读权限255 在线时间4056 小时 注册时间2014-10-19 最后登录2020-6-2

版主

帖子3055 积分5322 技术676 捐助0 注册时间2014-10-19

6楼

发表于 2017-7-22 10:45

| 只看该作者

//&cls&cscript -nologo -e:jscript "%~f0"&pause&exit var host='http://www.toutiao.com'; var id='6607289740'; url=host+'/c/user/article/?page_type=1&user_id='+id+'&max_behot_time=0&count=1000'; var http=new ActiveXObject('Msxml2.XMLHTTP'); http.open('GET', url, false); http.send(); json=http.ResponseText; if(json){ var js=eval('('+json+')'); //max_behot_time=js['next']['max_behot_time']; var data=js['data']; if(data){ for(var i=0;i

3

评分人数

hlzj88:

不明觉厉技术 + 1

codegay:

1技术 + 1

bbaa:

Javascript好评[Bat调用?]技术 + 1

TOP

bbaa

发短消息

加为好友

bbaa

当前离线

UID73802 帖子316 精华0 积分275 PB179 技术32 捐助0 阅读权限20 在线时间3681 小时 注册时间2015-11-30 最后登录2020-4-18

四级士官

帖子316 积分275 技术32 捐助0 注册时间2015-11-30

7楼

发表于 2017-7-22 10:51

| 只看该作者

回复 6# pcl_test

速度啊6666

我还在研究CP和AS是不是必须.....

貌似不是。。。。

http://123456

TOP

bbaa

发短消息

加为好友

bbaa

当前离线

UID73802 帖子316 精华0 积分275 PB179 技术32 捐助0 阅读权限20 在线时间3681 小时 注册时间2015-11-30 最后登录2020-4-18

四级士官

帖子316 积分275 技术32 捐助0 注册时间2015-11-30

8楼

发表于 2017-7-22 10:58

| 只看该作者

回复 6# pcl_test

Count貌似是227 Hasmore刚好为false....

http://123456

TOP

hlzj88

发短消息

加为好友

hlzj88

当前离线

UID6278 帖子613 精华0 积分1349 PB1230 技术33 捐助20 阅读权限50 来自青海西宁 在线时间261 小时 注册时间2008-11-3 最后登录2020-5-7

上尉

帖子613 积分1349 技术33 捐助20 注册时间2008-11-3

9楼

发表于 2017-7-22 12:38

| 只看该作者

回复 6# pcl_test 好厉害的代码,能看到窗口内容是我要的。但是,我得不到他们。还有,想收集更多的头条,因此需要能输入地址,或者从一个文件来读取地址表。

很实用的,要给孩子收集一些学习资料链接。{:2_36:}

目的,学习批处理

TOP

bbaa

发短消息

加为好友

bbaa

当前离线

UID73802 帖子316 精华0 积分275 PB179 技术32 捐助0 阅读权限20 在线时间3681 小时 注册时间2015-11-30 最后登录2020-4-18

四级士官

帖子316 积分275 技术32 捐助0 注册时间2015-11-30

10楼

发表于 2017-7-22 16:26

| 只看该作者

本帖最后由 bbaa 于 2017-7-22 16:31 编辑

回复 9# hlzj88

如果都是寻找个人主页的所有见面的话

http://www.toutiao.com/c/user/6607289740/#mid=6607310215

把user/后面的数字提取出来,放到斑竹的代码里

中的id=xxxxx

http://123456

TOP

bbaa

发短消息

加为好友

bbaa

当前离线

UID73802 帖子316 精华0 积分275 PB179 技术32 捐助0 阅读权限20 在线时间3681 小时 注册时间2015-11-30 最后登录2020-4-18

四级士官

帖子316 积分275 技术32 捐助0 注册时间2015-11-30

11楼

发表于 2017-7-22 16:29

| 只看该作者

回复 9# hlzj88

可以把地址存到txt

把斑竹代码的第一行改为

//&cls&(cscript -nologo -e:jscript "%~f0")>输出.txt&pause&exit复制代码这样信息就会保存在 输出.txt

http://123456

TOP

hlzj88

发短消息

加为好友

hlzj88

当前离线

UID6278 帖子613 精华0 积分1349 PB1230 技术33 捐助20 阅读权限50 来自青海西宁 在线时间261 小时 注册时间2008-11-3 最后登录2020-5-7

上尉

帖子613 积分1349 技术33 捐助20 注册时间2008-11-3

12楼

发表于 2017-7-22 16:32

| 只看该作者

回复 11# bbaa

谢谢你,看了一下午的Wscript ,就是在寻找输出的方法。

再次谢谢版主。

目的,学习批处理

TOP

聪少爱学堂聪少
聪少爱学堂创始人,梅州市鹏鑫网络科技有限公司CEO,09年开始踏入互联网,10年互联网行业经验,资深自媒体人,自媒体优秀导师,咪挺微商团对营销引流顾问,业务包含:精准引流技术/代引流精准粉,专业小红书,知乎,微博代运营。
  • 38988文章总数
  • 1491135访问次数
  • 建站天数
  • 合作伙伴