shawn360的个人博客分享 http://blog.sciencenet.cn/u/shawn360

博文

互联网数据挖掘竞赛开赛!

已有 5713 次阅读 2012-11-15 16:06 |系统分类:观点评述| 互联网, 数据挖掘, 日志, 样本, 上网行为

首届互联网数据挖掘大赛隆重开赛!该大赛由中国互联网络信息中心(CNNIC)所属数据平台(中国互联网数据平台)主办、科研数据网站-数据堂承办的的全国性互联网数据竞赛活动。欢迎广大对数据挖掘和数据分析感兴趣的人员参赛,大赛设置了丰富的奖项和奖品。
 
大赛时间:2012年11月15日~2013年1月11日

参赛办法:
    (1)以个人或团队形式报名参加,其中团队成员数量不超过3名
    (2)可以同时参与竞赛命题创意评选和数据挖掘竞赛评选,也可以只参与其中一项。
    (3)参赛团队提交的成果必须是独立完成的原创作品,不得抄袭,不得违反相关法律法规。
 
 
附:竞赛数据集介绍
竞赛数据采集自CNNIC“互联网调查”客户端,数据包提供了1000个随机抽取的样本用户,在2012-05-07至2012-08-12这四周的行为日志,以及相应的样本人口属性信息。样本数据包中的数据文件分为2部分,其中behavior文件夹中是按日期归档的样本行为日志,demographic.csv是样本的人口属性信息,二者通过样本ID关联。
数据格式TXT
数据大小825M(压缩前)


https://blog.sciencenet.cn/blog-613245-632860.html

上一篇:搜狗实验室数据专区开通,提供丰富数据资源
下一篇:大数据时代下科研数据的共享及处理
收藏 IP: 119.255.44.*| 热度|

2 许培扬 李伟钢

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-24 18:19

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部