化柏林分享 http://blog.sciencenet.cn/u/huabolin

博文

中信所研究生《情报分析技术》第二次课件

已有 4873 次阅读 2011-2-28 14:24 |个人分类:情报探讨|系统分类:教学心得| 研究生, 搜索引擎, 课件, 网络信息检索

本次课程主要讲述搜索引擎使用技巧、网络信息采集方法、搜索引擎技术实现、搜索引擎发展趋势。通过这些内容的学习与讨论,关于网络搜索技术力争达到:知其然,知其所以然,使其然,即学会用现成的东西(第一、二节),理解现有的东西(第三节),改进与创造新的东西(第四节)。
 

第一节:搜索引擎使用技巧;

揭示为什么“图书馆”的检索结果比“图书”的检索结果多。除了检索词的逻辑组配外,通过范围限定、类型限定等操作,如何把搜索引擎的检索结果控制在百条之内,实现快速准确地获取所需信息。通过批量或系列检索得到综合信息,从这些信息中分析出情报。

第二讲(1)_搜索引擎使用技巧.pdf

 

第二节:网页信息采集方法

不可复制的网络页面信息该如何获取?网站下载工具获取批量信息;根据URL表达式通过for循环获取批量信息;通过自建网页浏览器构获取批量信息。

第二讲(2)_网络信息采集方法.pdf

 

第三节:搜索引擎的技术实现

搜索引擎包括三部分:网络爬行、标引入库、响应检索。通过技术实现剖析搜索引擎的检索结果为什么会这么多,速度会如此快(亚秒级)?

第二讲(3)_搜索引擎技术实现.pdf

 

第四节:搜索引擎的发展趋势

         分别从信息采集(Input)、分析标引(Process)、响应检索(Output)三个方面讨论搜索引擎的发展趋势,以及如何实现这些新型搜索?



https://blog.sciencenet.cn/blog-91591-417368.html

上一篇:中信所研究生《情报分析技术》第一次课件
下一篇:留在北京工作之我见
收藏 IP: 168.160.23.*| 热度|

4 许培扬 黄宁燕 刘林 贡金涛

发表评论 评论 (3 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-5-1 12:16

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部