科学网

 找回密码
  注册
共享一个用于信息抽取的专利标注数据集
陈亮 2020-9-6 07:10
最近把我们用于信息抽取的专利标注数据集放到github上共享了,地址: https://github.com/awesome-patent-mining/TFH_Annotated_Dataset 。 另外搭建了两个brat平台,其一用以浏览TFH_Annotated_Dataset标注数据, http://121.36.92.58:8001/ , 其二用于浏览TFH_Annotated_Dataset所训练模型在新专利文本上的预 ...
个人分类: 文本挖掘|2445 次阅读|没有评论
2019年工作计划的对账单
陈亮 2020-4-21 10:24
转眼2020年第二季度就到了,翻一下旧帐本对对帐,看看2019的年度计划完成情况。 1. 算法 手头上有四个算法正在弄 a.BiGRU-Attention-General CRF用于语义关系抽取; b.专利无效算法; c.科技查新相关文献探测算法; d.层次多标签自动标注算法。 2019年的任务,就是要把这四个算法弄完。 对账: a.方案失 ...
个人分类: 小体会|1489 次阅读|没有评论
捋一捋2019年剩余时间的工作计划
陈亮 2019-5-4 10:06
2019年上班伊始,我给自己定了一个年度计划 1. 算法 手头上有四个算法正在弄 a.BiGRU-Attention-General CRF用于语义关系抽取; b.专利无效算法; c.科技查新相关文献探测算法; d.层次多标签自动标注算法。 2019年的任务,就是要把这四个算法弄完。 2.专著 拿效果好的算法,再结合之前做的工作,梳理出一本 ...
个人分类: 小体会|2954 次阅读|没有评论
Mean Field Variational Inference终于在我的大马尔科夫网上work了
陈亮 2019-1-7 19:08
我在 Brown University CS242 homework 5上 花了大概20天(当然是业余时间)左右,虽然结果仍然遗留了一个小尾巴,但对Mean field variational inferece在MRF/CRF上如何应用,算有一个清晰深入的认识,同时也学到一些小trick,比如如何解决计算exp(x)和log(x)时内存溢出的问题,同时发现原来CRF/MRF在多标签分类问题上 ...
个人分类: 文本挖掘|2856 次阅读|没有评论
比较6种算法在图片中的实体识别效果
陈亮 2019-1-1 19:19
Brown University CS242 homework 5很有趣,相关链接如下: http://cs.brown.edu/courses/cs242/assignments/ 该Homework给了一个toy 的图片特征数据集,然后让学生把算法填充完整,进而预测每张图片上出现的实物类型(数据集1上一共有13种实物类型,诸如人、马、牛、羊、山峰、飞机等等,数据集2上一共23种实物类 ...
个人分类: 乱评一气|3786 次阅读|没有评论
2017年自科基金青年项目申请总结(一)
热度 3 陈亮 2017-9-28 14:58
随着 8 月 17 日评审结果发榜,今年国家自科基金的轮回又结束了,自我 2014 年入所以来,先后申请过三次,今年终于中了,细细回想这三次申请历程,尤其今年这次,无论在梳理思路、提炼问题、筹备撰写还是加工润色上,我都自认为做得很多工作(当然结果也不错),不总结一下殊为可惜,而且距离下一次自科申 ...
个人分类: 小体会|17039 次阅读|4 个评论 热度 3

本页有 4 篇博文因作者的隐私设置或未通过审核而隐藏

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-5-13 20:46

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部