duskwaitor的个人博客分享 http://blog.sciencenet.cn/u/duskwaitor

博文

按标题搜索
共享一个用于信息抽取的专利标注数据集
2020-9-6 07:10
最近把我们用于信息抽取的专利标注数据集放到github上共享了,地址: https://github.com/awesome-patent-mining/TFH_Annotated_Dataset 。 另外搭建了两个brat平台,其一用以浏览TFH_Annotated_Dataset标注数据, http://121.36.92.58:8001/ , 其二用于浏览TFH_Annotated_Dataset所训练模型在新专利文本上的预 ...
个人分类: 文本挖掘|848 次阅读|没有评论
2019年工作计划的对账单
2020-4-21 10:24
转眼2020年第二季度就到了,翻一下旧帐本对对帐,看看2019的年度计划完成情况。 1. 算法 手头上有四个算法正在弄 a.BiGRU-Attention-General CRF用于语义关系抽取; b.专利无效算法; c.科技查新相关文献探测算法; d.层次多标签自动标注算法。 2019年的任务,就是要把这四个算法弄完。 对账: a.方案失 ...
个人分类: 小体会|629 次阅读|没有评论
捋一捋2019年剩余时间的工作计划
2019-5-4 10:06
2019年上班伊始,我给自己定了一个年度计划 1. 算法 手头上有四个算法正在弄 a.BiGRU-Attention-General CRF用于语义关系抽取; b.专利无效算法; c.科技查新相关文献探测算法; d.层次多标签自动标注算法。 2019年的任务,就是要把这四个算法弄完。 2.专著 拿效果好的算法,再结合之前做的工作,梳理出一本 ...
个人分类: 小体会|2069 次阅读|没有评论
Mean Field Variational Inference终于在我的大马尔科夫网上work了
2019-1-7 19:08
我在 Brown University CS242 homework 5上 花了大概20天(当然是业余时间)左右,虽然结果仍然遗留了一个小尾巴,但对Mean field variational inferece在MRF/CRF上如何应用,算有一个清晰深入的认识,同时也学到一些小trick,比如如何解决计算exp(x)和log(x)时内存溢出的问题,同时发现原来CRF/MRF在多标签分类问题上 ...
个人分类: 文本挖掘|1880 次阅读|没有评论
比较6种算法在图片中的实体识别效果
2019-1-1 19:19
Brown University CS242 homework 5很有趣,相关链接如下: http://cs.brown.edu/courses/cs242/assignments/ 该Homework给了一个toy 的图片特征数据集,然后让学生把算法填充完整,进而预测每张图片上出现的实物类型(数据集1上一共有13种实物类型,诸如人、马、牛、羊、山峰、飞机等等,数据集2上一共23种实物类 ...
个人分类: 乱评一气|1961 次阅读|没有评论

本页有 5 篇博文因作者的隐私设置或未通过审核而隐藏

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2021-6-16 09:04

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部