shawn360的个人博客分享 http://blog.sciencenet.cn/u/shawn360

博文

搜狗实验室数据专区开通,提供丰富数据资源

已有 6990 次阅读 2012-9-5 09:29 |系统分类:科研笔记| 共享, 搜索, 自然语言处理, 科研数据, 搜狗实验室

搜狗实验室依托搜狗搜索技术研发能力和海量数据获取能力,搜狐矩阵的互联网资源,清华-搜狐搜索技术联合实验室面向产业界的研究工作,自2006年11月成立以来一直致力于推动互联网相关技术(中文处理技术、搜索引擎技术和多媒体处理技术等)发展。目标是将搜狗实验室发展成为一个提供相关技术数据资源和效果评测的平台。
 
搜狗实验室先后提供了互联网语料库、网页链接关系库、用户查询日志等海量、真实的数据资源,免费供研究机构使用。这部分数据资源现已受到研究界的普遍关注,已有200多所国内外高校实验室、企业研究机构的1000多个注册用户下载、使用。这些数据也被用到清华-搜狐联合实验室合作发表的包括WWW、SIGIR在内的多篇论文中。
 
搜狗实验室数据专区此次开通,将提供丰富的Sogou技术报告、语料数据、新闻数据、图片数据及自然语言处理相关数据,这些数据资源均以无偿的形式与业内研究人员和热爱搜索行业的有志者共同分享,以促进学术界和产业界的良好互动。
 
马上访问搜狗实验室数据专区:http://www.datatang.com/member/73042/
 


 


https://blog.sciencenet.cn/blog-613245-609369.html

上一篇:数据共享的未来趋势及面临的挑战
下一篇:互联网数据挖掘竞赛开赛!
收藏 IP: 119.255.44.*| 热度|

4 许培扬 高绪仁 吕新华 张云

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-12-23 00:06

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部