lovesvidon的个人博客分享 http://blog.sciencenet.cn/u/lovesvidon

博文

借由某视频平台出发简析一下当下网络生态环境的一角

已有 2736 次阅读 2018-3-26 22:50 |个人分类:写着玩|系统分类:观点评述

为啥我要在这里实名的发出这篇文章呢?因为我觉得如果我在BiliBili发的话有很大的可能文章会被锁住。所以借由我在科学网的上两篇关于如何利用python工具获取BiliBili相关视频数据的文章,这里就简单的总结一下获取的相关数据所得出的结论。在此之前,因为科学网的各位大佬们可能不清楚BiliBili是一个什么样的平台,就先做一个简单的背景介绍。


背景介绍

BiliBili简称B站,早期是由一小部分喜爱日本动漫文化的人支撑起来的视频分享网站。随着这几年网络速度的不断提升手机流量的越发廉价,弹幕文化的不断盛行还有BiliBili奉行不会在视频中插播任何广告的原则使其在年轻群体的网络文化中占据这越来越重要的地位。到去年,也就是2017年时,B站开始了在美国上市的准备工作时,日平均用户活跃量已经达到1.5亿,每天可以更新2W多个视频,其在视频分享的市场地位已经不容忽视。也就是B站快速发展的这几年,随着我国意识形态教育的不断深化,运用新手段,新媒体以此达到更好的宣传效果已经成为常态化。在这么一个背景下,一批以团中央,环球时报等官媒为代表的新左派媒体(新左派:以当下形势来看,这些媒体的论调显然与南方周末前几年的声音相左,这里就不展开了)开始进驻B站,以求更好的,更亲切的接近青年群体。但在这些新左派中,有一个异类,就是观察者网,也是我们今天分析的主角。

观察者网始终给我的感觉是这个媒体已经完完全全的工具化了,今天它可以在一派人的手里去捅另一派人,哪天恐怕又会到另一派人手里了。这是我感觉观察者网和团团在B站的最大不同。废话不多说,我们来看看观察者网在B站显现出了哪些明显的特征。

(以下所有分析的数据均来源于BiliBili,如何获取的?请阅读下面两篇博文:)

【python爬虫】抓取B站视频相关信息(一)

【python爬虫】抓取B站视频数据及相关信息(二)


吵架不可避免

或许我们可以用一个更书面化的词,争议参与度。对于视频内容的争议参与度在B站通常体现在视频下评论区中讨论的激烈程度。虽然B站是一个弹幕视频网站,可以通过弹幕的形式发表自己的观点,见解。但弹幕具有不能实时沟通的特点,不利于争吵,所有对于有争议性的问题,B站用户们更愿意在评论区内实时的讨论。直观看来,评论区的评论数就可以在一定程度上对争议的激烈程度有所反应。通常来说,评论数越高,问题的争议性越大,争论的激烈程度越高。但评论数与观看视频的人数也有正相关的关系,为了剔除对点击量高,评论较多,但争议参与度不高视频的误判,这里进行了对争议参与度的简单建模。

我们可以简单的认为,视频下的评论分为两个部分,争议评论数Cz与无争议评论数C0:

对于争议评论Cz来说,其受到视频观看人数影响系数为λ1,无争议评论的影响系数为λ0。可以假设视频争议参与度为α,其也与争议评论数承正相关,相关系数为K。当视频播放数为P时,我们有:


考虑到式子中的lambda和K都是常数。这里请注意一点,对于不同的视频来说,通常λ0,K值是不变的,而λ1是依据视频内容不同而变化的。当视频内容争议性大时,λ1较高,争议性评论对于播放数是较为敏感的。可以认为alpha的值是与C/P成正相关的,评论数/播放数的大小也代表了一个视频的争议参与度的大小,所以这里我们能使用C/P作为衡量标准。

首先我们来看看,观察者网从入驻B站开始到今天,所有视频的C/P值的变化图(共采集1929个视频数据,去除了某些没有点击量的视频数据):

图一、

可以看出来在2016年7月以前,观察者网经历了近一年的无人关注期,早期的观察者网不仅关注度低,而且视频更新程度也很低,很难与现在的一天数个视频相提并论。但在2016年7月至2017年初的这段时间,突然间其视频的C/P值开始上升,到2017年开始全面爆发,且视频更新密度也是与日俱增。为什么年轻人突然开始关注了呢?B站的成长是否有关?B站的用户增加,关注时政的人必然也在增加,但应该是达不到这种程度的。只有一种解释就是,在原用户与新增加的用户中,关注时政的人的比例在增加!为什么在一个以关注二次元文化为主的平台上,关注时政的人的比例在大幅增加?因为从2017年开始,风向变了!让我们看看2016年入驻B站的共青团中央视频发布时间分布图,这幅图表现了每个月团团的所发的视频个数,从一开始的每个月不到10个视频激增到每个月60~80个视频,观察者网正是乘着这股左边刮来的风发展起来的(共采集952个视频数据):

图二、

让我们回到图一,可以看到在观察者网的视频中,C/P值最高可以超过0.2,但绝大部分的C/P值都在0.1以下,这个值究竟是高还是低?我们可以通过将其与其它up主对比来一探究竟。这里我们选择对比的up主是在B站拥有180W粉丝的“山下智博”,山下智博所做的视频以娱乐性质的vlog为主,是完完全全的粉丝向视频。作为一个粉丝向up主其视频的争议参与度基本代表了原生B站视频up的较高水平。下图为观察者网与山下智博视频C/P值分布图,纵坐标为视频个数(山下智博:采集视频数据882个)

图三、

我们可以发现山下智博绝大多数的视频都是在C/P值<0.01的范围之内的,几乎没有C/P值超过0.02的视频,与观察者网的差距显而易见。这也是意料之中的结果,我们再多看几个粉丝向up的C/P分布图,可以发现敖厂长和LexBurner,位列B站粉丝最多的up主之一的两位的C/P值也极难超过0.02。对于动辄C/P值0.03以上的观察者网来说这几位up主的视频真可谓十分温和了。

图四、


最后,究竟浏览观察者网什么类型的视频容易引起争议,那些评论区的争吵又围绕者什么主题?这涉及到语义分析,当前准备工作还不足,日后有时间再写第二期吧。


给出采集数据的源码:https://github.com/JinyuGuan/JINYU.git




https://blog.sciencenet.cn/blog-3189881-1105843.html

上一篇:【python爬虫】抓取B站视频数据及相关信息(二)
下一篇:【补充】Chrome内置工具抓包分析
收藏 IP: 36.57.152.*| 热度|

2 田灿荣 刘柳

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-6-17 10:55

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部