|
话题毒性随着在线讨论时间增加
在线讨论中最突出和最持久的特征之一——有毒行为,这里定义为粗鲁、不尊重或不合理的行为。
一项雄心勃勃的调查分析了八个社交媒体平台上的话语,涵盖了广泛的主题,跨越了几十年。它表明,在线对话的毒性随着时间的延长而增加——尽管平台的商业模式、技术进步和社会规范发生了变化,但这种行为仍然存在。
因为社交媒体平台在塑造公共话语、社会动态和政治格局方面发挥着关键作用1–3,人们严重担心在线的有毒互动会侵蚀社会凝聚力,传播错误信息2,3并宣扬反社会行为4.被称为戈德温定律的互联网概念表明,随着在线讨论时间的增加,更有可能有人会提到纳粹分子。受戈德温定律的启发,我们的研究调查了在长时间的在线讨论中,有毒话语是否是不可避免的。
通过比较多个平台、广泛主题和跨越数十年的时间框架的数据,我们的研究旨在确定助长在线毒性的核心人类行为,并确定尽管平台技术、商业模式和社会规范发生了变化,但互动模式是否仍然存在。
观察结果
该领域以前的研究主要集中在单一平台上,只有少数研究提供了跨平台分析1,4.可用数据来自帖子的“喜欢”和评论,但这些互动发生在平台的内容算法过滤了用户在其提要中看到的内容之后。我们假设,几十年来,通过对几个平台上的话语进行比较而产生的任何社会动态的相似性都将是人类行为的典型特征,并且不可能来自提要的影响。因此,我们对八个社交媒体平台(从Usenet到当代系统)的广泛主题进行了比较分析,时间跨度为34年。该研究使人们能够全面了解有毒的相互作用如何持续和演变,而不受任何特定时间的特定平台动态或社会趋势的影响。
我们广泛的时间和跨平台方法揭示了在所研究的所有平台上,较长时间的对话中毒性增加的一致模式,这表明对话的长度是其毒性水平的关键预测因素(图1)。此外,我们的分析指出,两极分化是导致毒性的关键因素,突出了不同观点在助长在线不和谐中的作用。然而,有毒内容的存在并不能阻止用户参与,这表明毒性与在线话语的参与之间存在复杂的关系。
图1 |毒性随着对话规模的增加而增加。将平均话题毒性(关于某个主题的对话中有毒评论的平均数量)与各种社交媒体平台上的对话规模(话题长度)进行比较。螺纹长度被归一化为 0 到 1 的范围,以便对趋势进行可视化比较。趋势表示每个大小区间的平均毒性,阴影区域表示 95% 置信区间。
影响
我们的研究结果强调了在广泛的时间尺度上分析和比较各种平台的重要性,以揭示在线社交动态的本质,特别是有毒互动的常见情况。系统比较不仅揭示了数字环境中毒性的普遍性,而且还强调了将这些模式与平台特征直接联系起来的挑战。此外,我们的研究指出,需要复杂的方法来探索在线社会动态。这些方法必须考虑用户参与的复杂动态和在线毒性的多方面性质,以便为审核在线内容的策略提供信息。
未来,我们将使用相同的方法来调查信息的传播和用户两极分化,并评估平台特定功能对各种用户行为的潜在影响。— Walter Quattrociocchi 和 Matteo Cinelli 就职于意大利罗马罗马 Sapienza 大学计算机科学系。
专家意见
“这篇论文在提出有关在线行为的问题方面开辟了新天地,这些问题是使用大型多平台数据集探索的。它提供了重要的发现,包括一个令人惊讶和发人深省的悖论:预计会让人们离开讨论的有毒内容显然没有这种效果。苏珊·贝内施(Susan Benesch)就职于美国马萨诸塞州剑桥市哈佛大学伯克曼·克莱因互联网与社会中心(Berkman Klein Center for Internet & Society)。
论文背后
多年来,我们一直在研究在线社会动态,特别是在两极分化和信息传播领域。我们的研究利用社交媒体数据前所未有的潜力来揭示社会行为。
引起我们兴趣的一个问题是戈德温定律作为在线话语动态轨迹指标的有效性。研究在线社会动态的障碍——数据稀缺以及将用户行为与平台内容算法的影响区分开来的挑战——凸显了创新方法的必要性。
我们的目标是通过比较一系列平台和几个时间段来超越传统分析的界限。我们将新数据与其他研究收集的数据相结合,但真正的挑战是确定捕捉交互模式的指标。我们的创新方法对于我们发现数字环境中普遍存在的用户参与和毒性的潜在模式是必要的。— W.Q. 和 M.C.
编者的话
这篇论文之所以脱颖而出,是因为有大量的数据集。这些数据——跨越在线平台、对话主题和几十年——对于全面描述在线对话中语言的演变以及我们理解这些变化如何影响参与讨论都是必要的。这项研究提出了许多问题,并有望激发关于在线对话、有毒言论和相关主题的进一步工作。— 玛丽·伊丽莎白·萨瑟兰(Mary Elizabeth Sutherland),《自然》杂志编辑
Persistent interaction patterns across social media platforms and over time | Nature
人们越来越关注社交媒体平台对公共话语的影响1,2,3,4及其对社会动态的影响5,6,7,8,9,特别是在毒性方面10,11,12.在这里,为了更好地理解这些现象,我们使用比较方法来隔离多个社交媒体平台上的人类行为模式。特别是,我们分析了不同在线社区中的对话,重点是识别有毒内容的一致模式。从34年来跨越八个平台(从Usenet到当代社交媒体)的广泛数据集中,我们的研究结果显示了一致的对话模式和用户行为,无论平台,主题或时间如何。值得注意的是,尽管长时间的对话始终表现出更高的毒性,但有毒语言并不总是阻止人们参与对话,而且毒性不一定会随着讨论的发展而升级。我们的分析表明,用户之间的辩论和对比情绪极大地促成了更激烈和敌对的讨论。此外,尽管平台和社会规范发生了变化,但这些模式在三十年中持续存在,这凸显了人类行为在塑造在线话语方面的关键作用。
社交媒体平台的出现和扩散不仅改变了在线参与的格局2但也成为我们日常生活中不可或缺的一部分,是信息、娱乐和个人交流的主要来源13,14.尽管这些平台提供了前所未有的连接和信息交换机会,但它们也带来了挑战,因为它们的商业模式与复杂的社会动态纠缠在一起,引发了人们对其对社会更广泛影响的重大担忧。以前的研究广泛解决了网络空间中的两极分化、错误信息和反社会行为等问题5,7,12,15,16,17,揭示了社交媒体对公共话语影响的多面性。然而,在理解这些平台如何影响人类固有的行为方面,一个相当大的挑战在于普遍缺乏可访问的数据18.即使研究人员通过与 Meta 等公司的特殊协议获得数据,也可能不足以明确区分人类固有的行为和平台设计的影响3,4,8,9.之所以出现这种困难,是因为数据深深嵌入到平台交互中,使得将人类内在行为与平台设计和算法施加的影响区分开来变得复杂。
在这里,我们通过关注毒性来应对这一挑战,毒性是在线对话中最突出的关注方面之一。我们使用比较分析来发现不同社交媒体平台和时间范围内的一致模式,旨在阐明各种数字环境中的毒性动态。特别是,我们的目标是深入了解在线对话中固有的不变的人类模式。
与面对面的互动相比,网络上缺乏非语言提示和实际存在可能会导致在线讨论中的不文明行为增加19.这种趋势在报纸评论区和政治讨论等网络领域尤为明显,在这些领域,交流可能会沦为冒犯性评论或嘲弄,从而破坏富有成效和民主辩论的潜力20,21.当接触到这种不文明的语言时,用户更有可能将这些信息解释为敌对的,影响他们的判断,并导致他们根据自己的信仰而不是所提供的信息形成意见,并可能助长两极分化的观点,尤其是在具有不同价值观的群体之间22.事实上,在线用户有一种自然的倾向,即寻找并调整与他们先前存在的信念相呼应的信息,而往往忽略了相反的观点6,23.这种行为可能会导致回音室的产生,志同道合的人聚集在一起,相互加强共同的叙述5,24,25.这些回音室,以及两极分化的增加,在不同的社交媒体平台上,它们的流行程度和强度各不相同1,这表明这些平台的设计和算法旨在最大限度地提高用户参与度,可以极大地塑造在线社交动态。这种对参与度的关注可能会在不经意间突出某些行为,这使得区分有机用户交互和平台设计的影响变得具有挑战性。目前研究的很大一部分致力于研究社交媒体上的有害语言及其在线和离线的广泛影响10,26.这种研究至关重要,因为它揭示了社交媒体如何反映和放大社会问题,包括公共话语的恶化。通过海量数据分析分析在线毒性的兴趣日益浓厚,这与能够检测有毒语言的机器学习的进步相吻合27.尽管许多研究都集中在在线毒性上,但大多数研究都集中在特定的平台和主题上28,29.更广泛的多平台研究在规模和覆盖面上仍然有限12,30.研究碎片化使理解对在线毒性的看法是准确还是误解变得复杂31.关键问题包括在线讨论是否具有内在的毒性,以及有毒和无毒的对话有何不同。澄清这些动态以及它们如何随着时间的推移而演变,对于制定有效的战略和政策来减轻在线毒性至关重要。
我们的研究涉及对在线对话的比较分析,重点关注三个维度:时间、平台和主题。我们研究了来自八个不同平台的对话,总计约 5 亿条评论。在我们的分析中,我们采用了 Perspective API 提供的毒性定义,这是一种用于自动检测有毒言论的最先进的分类器。此 API 将毒性视为“可能使某人离开讨论的粗鲁、不尊重或不合理的评论”。我们通过确认其与其他检测工具的结果的一致性来进一步验证该定义,从而确保我们结果的可靠性和可比性。在线话语中的毒性概念在文献中差异很大,反映了其复杂性,如各种研究所见32,33,34.最近,人们一直在争论当前基于机器学习的自动毒性检测系统的功效和局限性11,35.尽管有这些讨论,自动化系统仍然是大规模分析的最实用手段。
在这里,我们分析了在线对话,挑战了关于其动态的常见假设。我们的研究结果揭示了不同平台和不同时间的一致模式,例如参与动态的重尾性质、用户参与度的下降以及较长对话中有毒言论的增加。我们的分析表明,尽管毒性和用户参与辩论是自变量,但用户之间意见和情绪的多样性可能在对话毒性升级中起着重要作用。
为了全面了解在线社交媒体对话,我们分析了来自Facebook、Gab、Reddit、Telegram、Twitter、Usenet、Voat和YouTube的约5亿条评论的数据集,涵盖了不同的主题,跨越了三十年(数据集细分见表1和补充表1;有关数据收集的详细信息,请参阅方法的“数据收集”部分)。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2025-1-5 04:51
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社