||
小编导读
用户在Twitter等社交网站上发布自己的想法和观点,这些在线互动产生的海量数据可以用于情感分析(Sentiment Analysis)和数据挖掘。来自美国西佛罗里达大学计算机科学系的研究者们在期刊Natural Language Processing Research(eISSN 2666-0512)上发表了题为“Analysis of Political Sentiment From Twitter Data”的文章,提出了一种新的情感分类方法。
要点介绍
如今,Twitter、Tumblr和Facebook等社交网站深受互联网用户欢迎。在这些热门网站上,每天都有数以百万的消息产生。这些消息的作者记录自己的生活、分享对不同话题的看法,并讨论当下的热点问题。对这些数据进行分析可以了解公众的政治情感,例如研究公众情绪是如何影响选举结果的等等。
本文提出了一种新的情感分类方法,研究了从Twitter数据中词嵌入并产生有用信息的可能性。这项工作的新颖之处在于确定短体(取自Twitter数据)如何极化到主题的多个轴,而不是使用单一的正负情绪轴来分类主题的文本。这项研究的结果表明,单轴可能不足以表达一种情绪。为了获得更好的结果,必须将各种轴组合起来。根据分类准确度、分类偏差和axis评分来综合衡量结果。
图1. 方法流程。
研究结论:本文从极化的角度出发,提出了一种新的情感分析方法。与自然语言处理领域先前的工作相比,特别是情感分析中与政治主题相关的工作,这种方法表明,严格按照“负”到“正”的静态二进制或连续尺度对语料库进行分类已不再足够。需要一种更抽象、更按需的情感表示,即描述情感的轴和。这项工作引入了通过额外计算AS来证明分类准确度的概念,AS是情绪轴准确度的度量。虽然单个轴没有给出特别好的结果,但组合轴显示出更好的结果。例如,(A3+A6)比单独取A3或A6轴的分类精度更好。未来的研究工作可能会发现更好的方法来组合轴,例如,使用权重系统,通过频率或与语料库的整体关系来筛选轴词,等等。
参考文献 References
[1] T.Mikolov,I.Sutskever,K.Chen,G.Corrado,J.Dean,Distributed representations of words and phrases and their compositionality, arXiv: 1310.4546, 2013.
[2] E. Rudkowsky, M. Haselmayer, M. Wastian, M. Jenny, S. Emrich, M. Sedlmair, More than bags of words: sentiment analysis with word embeddings, Commun. Methods Meas. 12 (2018), 140–157.
[3] X. Yang, C. Macdonald, I. Ounis, Using word embeddings in Twit- ter election classification, Inf. Retrieval J. 21 (2018), 183–207.
[4] E. Haddi, X. Liu, Y. Shi, The role of text pre-processing in sentiment analysis, Procedia Comput. Sci. 17 (2013), 26–32.
[5] H. Saif, M. Fernandez, Y. He, H. Alani, On stopwords, fil- tering and data sparsity for sentiment analysis of Twitter, in Proceedings of the Ninth International Conference on Lan- guage Resources and Evaluation (LREC’14), Reykjavik, Iceland, 2014, pp. 810–817. http://www.lrec- conf.org/proceedings/ lrec2014/pdf/292_Paper.pdf
[6] B. Duncan, Y. Zhang, Neural networks for sentiment analysis on Twitter, in IEEE 14th International Conference on Cognitive Informatics & Cognitive Computing (ICCI* CC), Beijing, China, 2015, pp. 275–278.
[7] Y. Bao, C. Quan, L. Wang, F. Ren, The role of pre-processing in Twitter sentiment analysis, in International Conference on Intel- ligent Computing, Taiyuan, China, 2014, pp. 615–624.
[8] J. Akaichi, Z. Dhouioui, M.J.L-H. Pérez, Text mining Face- book status updates for sentiment classification, in 17th Inter- national Conference on System Theory, Control and Computing (ICSTCC), Sinaia, Romania, 2013.
[9] P. Gonçalves, M. Araújo, F. Benevenuto, M. Cha, Comparing and combining sentiment analysis methods, in Proceedings of the First ACM Conference on Online Social Networks (COSN 13), Boston, MA, USA, 2013.
[10] A.K. Vishal, S.S. Sonawane, Sentiment analysis of twitter data: a survey of techniques, Int. J. Comput. Appl. 139 (2016), 5–15.
[11] B.Hamid,M.J.Islam,SentimentanalysisofTwitterdata,2017.
[12] C. Erik, B. White, Jumping NLP curves: a review of natural lan- guage processing research, IEEE Comput. Intell. Mag. 9 (2014), 48–57.
【更多参考文献信息请扫描下方二维码查看原文】
原文信息
S. Bagui, C. Wilber, K. Ren, "Analysis of Political Sentiment From Twitter Data", Natural language processing Research, 2020, DOI: 10.2991/nlpr.d.201013.001.
扫描二维码,获取英文原文
https://www.atlantis-press.com/journals/nlpr/125945413
关于期刊
自然语言处理研究(Naturnal Language Processing Research, eISSN 2666-0512)是一本国际化的,经过严格同行评审的开放获取期刊,涵盖有关计算语言学和自然语言处理的所有领域。
本刊由北京理工大学李侃教授担任主编,中科院自动化所宗成庆研究员和美国华盛顿大学Emily M. Bender担任顾问委员。
该期刊为原创性高质量的自然语言处理领域的学术研究提供了一个开放平台,旨在加深我们对这些领域基本问题的理解。NLPR上的文章通常比会议论文长,尤其关注研究方法或其理论意义。因此,本刊特别欢迎那些在其方法设置和/或理论基础方面很强的研究。除了所有文章的常规质量标准(如实质性内容、原创新和贡献意义),扎实的评价和高质量的分析是实验论文的最低要求。更多期刊主题详见:https://www.atlantis-press.com/journals/nlpr/aims-and-scope。
NLPR采用开放获取的出版形式,由作者保留版权。所有文章经过同行评审接收后,不收取任何费用。现已开放Editorial Manager线上投稿平台:
https://www.editorialmanager.com/nlpr/default.aspx。欢迎广大学者赐稿!
版权声明:
*本文内容由Atlantis Press中国办公室翻译编辑。中文内容仅供参考,一切内容以英文原版为准。如需转载,请在评论区留言,或联系xin.guo@atlantis-press.com。
Atlantis Press是科学、技术和医学(STM)领域的全球开放获取出版品牌,2006年创立于法国巴黎,在巴黎、阿姆斯特丹、北京、郑州和香港设有办事处。我们的使命是通过促进科研界和整个社会更有效地传播和交流知识来支持科学、技术和医学研究的进步。迄今,Atlantis Press的数字内容平台包含超过14万篇开放获取论文供读者免费下载阅读,每年产生2500多万下载量。Atlantis Press是施普林格·自然的一部分。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-23 02:36
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社