国际Web信息系统会议(WISE)将于2012年11月28-30日在塞浦路斯召开,大会组织的新浪微博竞赛评审结果于8月8日揭晓。来自清华大学(Tsinghua University)、巴西利亚大学(University of Brasilia)、澳洲昆士兰大学(University of Queensland)和美国北卡罗来纳大学(University of North Carolina)的团队分别胜出得奖。
附图 WISE微博竞赛 四国名校获奖
WISE竞赛的组织者从新浪微博(weibo.com)收集12.9GB的客户关系数据和61.8GB的微博信息数据,提出两个竞赛项目:1)微博海量数据查询性能分析(The performance track - T1);2)微博转发和阅读量预测 (The mining track - T2)。竞赛项目难度大,时间紧迫。仅数据的初步处理就需要花上三周以上,进一步的用户关系和微博信息查询需要外存达300GB。无论是数据查询还是微博转发预测均需要建模、编程和大量计算,是对各团队智慧、技能和耐力的检验。
巴西利亚大学计算机系TransLab团队参加本次竞赛,提交的两篇论文均通过评审入围。其中参加微博海量数据查询性能分析(T1)项目的文章是: Edans Sandes, Li Weigang and Alba Cristina de Melo, Logical model of relationship for online social networks and performance optimizing of queries, to appear in the proceedings of 13th WISE, LNCS, November 28th-30th, 2012, Paphos,Cyprus. 该文(Championship on T1: Scalability)的亮点在于推出粉丝模型(Fans model),在此基础上对海量数据咨询提出优化算法,与清华同仁(Championship on T1: Throughput and Latency)并列第一名。中科大和中科院团队也取得较好成绩。
团队参加微博转发和阅读量预测 (T2) 项目的文章是; Juarez Paulino, Lucas Almeida, Felipe Modesto, Thiago Neves and Li Weigang, An Investigation on Repost Activity Prediction for Social Media Events, to appear in the proceedings of 13th WISE, LNCS, November 28th-30th, 2012, Paphos, Cyprus. 该文的亮点在于整合微博转发预测模型,设制预测方法和程序,对近62GB数据内的6个事件中33个微博实现转发预测,预测结果获小组竞赛第五名。该项目澳洲昆士兰大学团队获得第一名(Championship on T2),北卡罗来纳大学夏洛特分校团队获第二名(Runner-Up on T2)。清华、中科大、中科院、人大和北邮等高校的团队也取得较好成绩。