swb0802的个人博客分享 http://blog.sciencenet.cn/u/swb0802

博文

Finding Credible Information Sources in Social Networks

已有 4094 次阅读 2013-3-16 20:20 |个人分类:信息可信度|系统分类:论文交流

Finding Credible Information Sources in Social Networks Based on Content and Social Structure.

文章概要:
    文章大致分为两大部分:首先通过一个实验模型,得出一个中间结论:“信息的内容与网络结构共同影响其可信度”(both the topical content of information sources and social network structure affect source credibility);然后提出一个算法,在某个特定话题上,对微博用户进行可信度的排名。

    第一个实验模型是这样的。用户在做一些决策的时候,会参考一定的外界信息。用户会挑选他认为可信的信息作为决策依据。根据这样的假设,考虑下面的实验模型:
    实验参与者首先对一台二手汽车进行估价,然后给他看一本市场估价的书(KBB,Kelley blue book),这本书当中已经对该车做了估价,再让他对这部车做第二次估价。最后请一位具有二手车交易经验的人给他一个建议价格,再让参与者第三次估价。这个过程可以用以下公式来抽象:
其中R代表参与者的估价,si代表外界的估价信息,wi代表权重。可以看出,参与者最终的估价是受诸多外界估价信息共同作用而给出的。其中的权重可以认为是可信度的一种表示。
    作者受该模型启发,做了如下的实验,实验的目的是探寻,Twitter哪些因素影响用户的可信度判断。
    还是二手车估价实验。给参与者提供以下信息:汽车的基本信息和KBB的估价,让他给出一个自己的估价R1。然后给他看一个微博用户的估价,并提供给他微博用户的相关信息,参与者根据微博用户的相关信息,自行判断其可信程度作为参考,给出第二个估价R2。用公式可以表示为:
其中w0和s0代表参与者内心的估价,wKBB和sKBB代表Kelley blue book上的估价。
其中wt和st代表微博用户给出的估价。
根据以上式子,可以推导出下面的式子:
w0和s0被消掉,C代表的是可信度。当C取0时,代表微博用户的估价st对参与者没有影响(R2=R1)。当C取1是代表其影响是巨大的(R2=st)。这个C作者称其为暗示的可信度(explicit credibility rating)。
    同时,参与者要给该微博用户做一个1-5的打分,来明确的表示该用户有多大的可信程度。(implicit credibility rating)。
    此处还有一个问题:微博用户的信息以什么形式呈现呢?
    分三个角度呈现:
    1、Twitter Profiles  文章选了5个不同领域的“专业人士”微博,五个领域分别是car、investigating、wine、fantasy football and dating。每一个领域选取了10个微博账户。同时另外选取10个账户,他们在任何领域都没有表现出“专业”的迹象。一共是60个微博账户。
    2、Social Status  从以下几个方面来说明Social status:粉丝和关注者的数量,发布的微博数量,list membership的数量。每一个方面分为high 和 low 两个level。并分别指派了一个区间,用来定义high和low。
    3、Word Clouds  文章从三个方面来展现,通过tf-idf模型提取的关键字,LDA模型提取的关键字以及微博内容本身。分五组,分别是:tf-idf,LDA,tweets本身,tf-idf+tweets,LDA+tweets。
    对于实验结果,文章使用了线性模型进行模拟分析。其结果如下图:
    实验结果表明:
    1、专业领域的特征具有最强的影响,其次是Word clouds,最后是social status。
    2、只有tweets或者只有word clouds不足以提供足够的可信度信息,加上tf-idf词汇或者LDA词汇更具有影响力。


https://blog.sciencenet.cn/blog-795423-670886.html

上一篇:Information Credibility on Twitter in Emergency Situation
下一篇:Reading list-2013
收藏 IP: 210.30.97.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (3 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-7-17 14:22

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部