lovesvidon的个人博客分享 http://blog.sciencenet.cn/u/lovesvidon

博文

【python爬虫】抓取B站视频相关信息(一)

已有 9784 次阅读 2018-3-20 16:22 |系统分类:科研笔记

 昨天我在B站上写了这么一篇文章,但是被他们锁住了。无奈之下我复制到知乎上先保存起来

https://zhuanlan.zhihu.com/p/34716924


在这篇名为《三天学会用python进行简单地爬取B站网页视频数据》文章中我主要提到了两点

  • 在已知aid的情况下如何获取视频相关信息

  • 如何获取某一up的所有视频aid的思路和方法


今天下午,有朋友说可以用已经获得的aid把相对应的视频都下载下来。

在这里我使用了“lulu”这个python包,只需要子在命令行中键入:lulu http://www.bilibili.com/av... 即可


今天还发现了,B站不仅对视频有aid编号,用户有uid,对于弹幕库同样也有cid的编号。如何获取弹幕库cid的编号呢?访问下面这个链接即可,在已知aid的情况下就可以获得该aid对应的cid编号以及该视频的分P信息,这样就节省了解析html的时间:

https://www.bilibili.com/widget/getPageList?aid=?


为了获取详细的弹幕库信息,可以访问这个url:http://comment.bilibili.com/cid.xml


最后给出源码以供参考:https://github.com/JinyuGuan/JINYU.git

https://github.com/JinyuGuan/JINYU.git




https://blog.sciencenet.cn/blog-3189881-1104863.html

上一篇:【经验】如何通过WIFI连接Arduino Yun和Processing
下一篇:【python爬虫】抓取B站视频数据及相关信息(二)
收藏 IP: 114.102.147.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (3 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-27 13:19

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部