科学网

 找回密码
  注册
共享一个用于信息抽取的专利标注数据集
陈亮 2020-9-6 07:10
最近把我们用于信息抽取的专利标注数据集放到github上共享了,地址: https://github.com/awesome-patent-mining/TFH_Annotated_Dataset 。 另外搭建了两个brat平台,其一用以浏览TFH_Annotated_Dataset标注数据, http://121.36.92.58:8001/ , 其二用于浏览TFH_Annotated_Dataset所训练模型在新专利文本上的预 ...
个人分类: 文本挖掘|2415 次阅读|没有评论
2019年工作计划的对账单
陈亮 2020-4-21 10:24
转眼2020年第二季度就到了,翻一下旧帐本对对帐,看看2019的年度计划完成情况。 1. 算法 手头上有四个算法正在弄 a.BiGRU-Attention-General CRF用于语义关系抽取; b.专利无效算法; c.科技查新相关文献探测算法; d.层次多标签自动标注算法。 2019年的任务,就是要把这四个算法弄完。 对账: a.方案失 ...
个人分类: 小体会|1472 次阅读|没有评论

本页有 8 篇博文因作者的隐私设置或未通过审核而隐藏

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-24 03:44

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部