complexityworld分享 http://blog.sciencenet.cn/u/pb00011127

博文

50000元大奖的数据挖掘比赛,欢迎大家参加!

已有 26741 次阅读 2015-9-26 17:37 |系统分类:教学心得

50000元奖金职位预测竞赛【新竞赛上线】



 

全国大数据挖掘竞赛第四站:简历数据的职位预测!

以前的比赛中,例如考试成绩预测,有全球近800支队伍参赛,成绩排名靠前的团队不仅获得了奖励,还可以申请到国外很好的大学。本次竞赛是基于简历数据的职位预测,参赛者通过对训练集数据进行学习、编码与测试,挖掘出职位路径的走向与规律,形成算法模型,再对测试集数据中置空的信息进行预测,预测准确度越高的参赛者排名越高。

 

详细情况请访问:www.pkbigdata.com  

 

---- 情况简介 ----

 

【数据集描述】

训练集:匿名7万优质简历数据,标准json格式 包含字段:id,性别,年龄,专业,学历,工作经验(开始时间,结束时间,公司行业,公司规模,月薪,职位名称,部门,职位类型)

测试集:匿名2万优质简历数据,标准json格式 包含字段与测试集一样,只是将部分信息置空,需要参赛者进行预测

 

【竞赛奖励】

第1名:30000

第2名:10000

第3名:5000

第4名:3000

第5名:2000

注:本次竞赛还提供获奖证书及高级算法工程师职位

 

【作品提交】

线上环节(9月23日-12月20日)提交CSV结果文件,获得实时排名

线下答辩(12月下旬)提交算法说明文档等,并准备答辩材料进行线下答辩

 

【评分算法】

1.预测学位-A, 二值化0,1,相等给1分,否则0分;

2.预测公司规模-B,二值化0,1,相等给1分,否则0分;  

3.薪水范围预测-C,二值化0,1,相等给1分,否则0分;

4.职位名称预测-D,二值化0,1,相等给1分,否则0分;  

5.预测维度权值: wa=0.35 wb=0.86wc=0.74 wd=2.25 ;  

 

一条预测的得分:one = (A*wa + B*wb + C*wc + D*wd)/(wa+wb+wc+wd)

最终得分:sum(ones)/20000  

A,B,C,D 映射关系以及可能出现的值请参考平台“映射关系.txt”


---- 附录 ----

全国大数据挖掘竞赛第一站:个性化新闻推荐;

全国大数据挖掘竞赛第二站:图像搜索竞赛+学生成绩排名预测;

全国大数据挖掘竞赛第三站:验证码识别。




https://blog.sciencenet.cn/blog-3075-923619.html

上一篇:H++, H=53以及我30岁的时候定下的过完35岁的目标
下一篇:成为大数据企业——《数据场效应》序
收藏 IP: 218.88.78.*| 热度|

13 许雄锐 张琳艳 高见 陈玲姣 张千明 陆泽橼 李天成 杨正瓴 黄盼华 荣智海 朱郁筱 杨晓慧 sunxiaowei1993

该博文允许注册用户评论 请点击登录 评论 (23 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-19 10:01

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部