duskwaitor的个人博客分享 http://blog.sciencenet.cn/u/duskwaitor

博文

按标题搜索
分享 文本挖掘实践小体会(二)
2014-7-7 14:24
说到文本挖掘,python是不得不提的部分,python有一个自然语言工具包叫gensim,里面实现了很多功能如去停用词、词干提取、词性标注,同时可以很方便地将文档转化为向量,同时它也实现了LDA、LSA、TF_IDF等模型,确实是文本挖掘的利器,不过遗憾的是,我对python不熟,虽然我不认为学习一门计算机语言需要多 ...
个人分类: 文本挖掘|3989 次阅读|没有评论
分享 文本挖掘实践小体会(一)
热度 1 2014-7-7 00:01
虽然我早先了解一些文本挖掘的知识,但实际开始着手操作也就一年多的时间,这期间有些收获,但更多的是吐槽,遇到问题很多,使用过的工具、方法也不少,但至今并没有形成一套完整的工具,还是小作坊式的在处理一些文本挖掘的事情,不能不说遗憾,今天写这些,是对我以往工作中一些心得的总结,更为自己以后 ...
个人分类: 文本挖掘|3355 次阅读|3 个评论 热度 1
分享 我就是一写综述的
热度 6 2013-8-15 10:15
作者按:写完《技术演化研究方法进展分析》后,我发誓这辈子再也不写综述类文章了,一是没什么创新性,全是体力活,而且太耽误时间,二是这类文章永远别打算上SCI,即便SSCI如果你不是大牛也上不了。但最后我还是违背自己的初衷,3月份四月份连写了两篇综述类文章,因为这类文章的一大好处是旱涝保收,只要你看的文章足够多 ...
个人分类: 我就是一写综述的|2617 次阅读|8 个评论 热度 6

Archiver|手机版|科学网 ( 京ICP备14006957 )

GMT+8, 2019-7-18 06:45

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部