科学网

 找回密码
  注册
JGibbLDA做LDA中文处理时,解决乱码问题
陈果 2015-4-12 00:01
用JGibbLDA处理中文时,中文数据集不用UTF-8格式,会出现乱码;用UTF-8格式,会提示第一行数字(文档数)读取后无法转化。 经测试,可文档编辑器(如Editplus,UltraEdit之类)将数据文本保存为无bomb的UTF-8格式。 感谢毛进同学提供建议。
个人分类: 技术记录|5475 次阅读|没有评论

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2025-1-16 08:59

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部