科学网

 找回密码
  注册
tuple 元组条件添加解析
沙晨 2015-2-8 10:15
pairs= ',w)] 这样就将满足条件condition的a中的要素提取出来赋给b,即将 他们的组合提取出来赋给a,构成一个索引元组。可以用于提取包含某一元素的词汇或语句,并生成索引。也可以添加其他条件要素。 进而可以通过:Index对元组进行归纳索引。方便快捷。
个人分类: python|2224 次阅读|没有评论
python 链表 多重列表结构的使用
沙晨 2015-2-8 09:52
python在处理字符串时有一个比价好的手段,就是链表,临时生成列表,对列表中的元素处理。 这是一层的判断结构。 python的列表中还可以包含更多的层级, ]] 所以在方括号中的循环语句也可以是多重的 这种处理方式大大减少了数据处理的工作量。 所以,python的数据处理,要善于利用列表,更要善于在方括号中利用 ...
个人分类: python|3267 次阅读|没有评论
用于统计的哈希
沙晨 2015-2-8 09:43
dict_ = {} for i in a: res =dict_.get(i,0)+1 简单的统计,三行,一个get就完成一个自动判断统计添加。
个人分类: nltk|1837 次阅读|没有评论
文法分析中的 解析器 productions 函数
沙晨 2015-2-5 20:18
nltk grammar中的函数 | productions(self, lhs=None, rhs=None, empty=False) | Return the grammar productions, filtered by the left-hand side | or the first item in the right-hand side. | &nbs ...
个人分类: nltk|2269 次阅读|没有评论
专利分析之难—想知道谁有专利不容易
沙晨 2015-2-5 09:11
通过竞争对手的专利量来分析竞争对手的专利活动是专利分析中的重要途径,但是从刚开文献中只能得知申请专利时的申请人的信息,这给分析谁拥有专利带来了困难。比如: 专利数据中申请人的信息不是最新的,并不是所有国家都要求专利权利的变更要更新数据内容,即使有也可能要几个月甚至几年。这点我国做的很好,做了明确 ...
个人分类: 专利分析|2234 次阅读|没有评论
IPC概念桥
沙晨 2015-2-3 09:00
跨语言检索和定位相关专利文献, 文本翻译和索引集映射,两者基于大型语料库。 国际专利分类概念桥方法,进行跨语言专利匹配, 抽词建立专利文档-概念向量,TF-IDF, IPC概念向量,构建IPC概念桥,匹配专利文档概念向量与IPC向量, 赋予分析专利文档相关的IPC分类,以及根据IPC层级关系构建,一篇专利与IPC分类号的 ...
个人分类: 文本分析|2074 次阅读|没有评论
美国IFI发布2012美国授权发明专利排名中国企业第一次进入前50
热度 2 沙晨 2013-1-14 10:10
根据美国2012年公布的授权发明专利数据,IFI商业专利数据供应商发布2012年美国授权专利申请人排名情况。 2012年美国授权专利量为253155件,比2011年增长13%,为历年最高。 在获得专利授权排名中,IFI主要考虑了各专利申请人的专利包(patent portfolios),即一家企业往往会通过诸多的子公司进行专利申请(小公 ...
个人分类: 专利|4253 次阅读|3 个评论 热度 2
读”清华大学跻身2012福布斯专利实力榜第15位“
热度 1 沙晨 2013-1-3 18:59
福布斯网站2012年12月22日最新发布2012年IEEE(美国电气和电子工程师协会)大学、教育和培训机构专利实力榜,清华大学综合排名第15位,成为唯一跻身前20名的非美国高校。排在前三位的分别是哈佛大学、加州大学和麻省理工学院。 福布斯IEEE专利实力榜是对5000余家领先商业公司、学术机 ...
2991 次阅读|1 个评论 热度 1

本页有 2 篇博文因作者的隐私设置或未通过审核而隐藏

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-5-7 11:04

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部