科学网

 找回密码
  注册
【博士期间研究总结】共词分析方法优化的一个思路体系
热度 3 陈果 2015-5-31 01:12
马上要毕业了,趁此机会将博士期间研究做一个梳理;今后工作不知是否还可延续,因此也是一种留念。 博士期间主要研究为共词分析方法优化,在此方面发表近10篇论文,均是方法改进性质的研究,自认为都不是灌水文,对得起自己的学术理想。 论文可归纳为一个体系,包括: 1:基础研究:通过实验 ...
个人分类: 论文交流|6205 次阅读|6 个评论 热度 3
JGibbLDA做LDA中文处理时,解决乱码问题
陈果 2015-4-12 00:01
用JGibbLDA处理中文时,中文数据集不用UTF-8格式,会出现乱码;用UTF-8格式,会提示第一行数字(文档数)读取后无法转化。 经测试,可文档编辑器(如Editplus,UltraEdit之类)将数据文本保存为无bomb的UTF-8格式。 感谢毛进同学提供建议。
个人分类: 技术记录|4878 次阅读|没有评论

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-5-1 09:25

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部