崔雷的窗口分享 http://blog.sciencenet.cn/u/zilu85 我在专业领域里的感受

博文

Bicomb软件处理pubmed的xml格式中出现问题的临时解决办法

已有 7372 次阅读 2018-4-2 10:44 |个人分类:生物医学文本挖掘|系统分类:科研笔记

 最近发现,提取pubmed2016年以后的记录过程中出错,如下图:


blob.png


经过反复调查,发现是因为下载的文献中,标题内容中存在<sup>或<sub>或<i>字符,导致提取意外终止。包括:

<b>    (bold)

<i>    (italic)

<sup>  (superscript)

<sub>  (subscript) 

<u>    (underline) 

临时替代的解决办法是先用记事本打开,把这些“非法字符”替换掉。


另外,在提取步骤中出现停滞的状态时,可以按“Alt+F4”组合键关闭前置窗口,不必强行关闭程序。



https://blog.sciencenet.cn/blog-82196-1106934.html

上一篇:利用文献生成耐受性细胞治疗知识图【译文】
下一篇:利用聚类树聚合方法挖掘生物医学数据特征挖掘(摘要翻译)
收藏 IP: 59.46.65.*| 热度|

1 刘继为

该博文允许注册用户评论 请点击登录 评论 (4 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-25 01:30

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部