|||
中文Web信息检索评测CWIRF
资料来源:http://www.cwirf.org/Evaluation/CWT.html
2009年3月-2009年5月,SEWM2009中文Web信息检索评测
评测通知, 评测结果
海量查询 评测指南
文档集:CWT200g网页集合
查询集: 海量查询
相关结果集
2007年10月-2008年4月,SEWM2008中文Web信息检索评测
评测通知
主题型网页发现任务和网页内容信息块发现 评测指南, 附加说明, 评测结果
文档集:CWT70th网页集合, 说明
训练集:网页内容信息块训练集
相关结果集:主题网页,网页内容信息块
非网页数字资源分类 评测指南
文档集:CDAL16th中待评测数据集, 说明
训练集:CDAL16th中数字资源训练集
垃圾邮件过滤
请访问,http://www2.scut.edu.cn/antispam/
2006年10月-2007年3月,SEWM2007中文Web信息检索评测
评测通知, 评测指南 附加要求 评测结果及说明
文档集:CWT200g网页集合
查询集,包括: 主题提取, 和导航搜索
相关结果集包括:主题提取答案(docid形式) 以及 主题提取答案(url形式)(说明:总计70个任务,保留了56个主题并提供答案。) 导航搜索答案 导航搜索答案(url形式),采用pooling方法构造完成 other information.
会议报告
2006年3月-7月,SEWM2006中文Web检索评测
评测通知, 评测指南, CWT200g检索工具和浏览工具说明 评测结果及说明
文档集:CWT200g网页集合
查询集,包括: 主题提取, 和导航搜索
相关结果集包括:TD在20g上的相关结果集 以及 TD在200g上的相关结果集(说明:总计70个任务,保留了65个主题并提供答案。) 导航搜索在20g上的答案(说明:在20g上只有34个主题并提供答案。) 导航搜索在200g上的答案,采用pooling方法构造完成
会议报告
2005年4月-9月,SEWM2005中文Web检索评测
评测通知, 评测指南, 附加要求, 提交结果检查程序, 评测结果
文档集:CWT100g网页集合, CWT100g文档编号
查询集,包括: 主题提取, 和导航搜索 (导航搜索包括主页和 指定页面 查询,混合在一起是为了增加难度). 构造方法是首先从2002年4月到2004年6月天网日志中采样获得待选集合,然后人工挑选编辑完成.
相关结果集,包括: 以docid形式给出的主题提取答案, 以url形式给出的主题提取答案 (说明:总计75个主题任务,最后保留了60个主题并提供答案。原因是有2个主题没有找到相关网页,有13个主题的答案少于3个) 导航搜索(包括主页和指定页面查询)答案. (说明:没有提供网页内容一样,URL不同的答案), other information. 采用Pooling方法构造完成。
2004年6月-11月,SEWM2004中文Web检索评测
评测指南, 评测结果.
文档集:CWT100g网页集合.
查询集,包括: 主题提取和 导航搜索(包括主页和指定页面查询).
相关结果集,包括: 主题提取答案 (说明:总计70个主题任务,最后保留了50个问题并提供答案。原因是有些问题的答案过少,没有通过评测人员第二轮的检查被去掉,或者个别评测人员没有按时提交答案)和 导航搜索(包括主页和指定页面查询)答案. (说明:没有提供网页内容一样,URL不同的答案). 采用Pooling Plus方法构造完成, 即:将搜索引擎转换为虚拟参赛队,参与结果集合成。这样,即使参加队数量不多,也能合成质量较高的结果集,达到检验参与系统检索质量的目的。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-7-19 18:15
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社