||
重申原创!项目地址:https://github.com/bashanyeyu/hmgeo
此次发布为版本0.1.0,包括三个函数;:
rca(区位熵)区位熵是一种非常成熟的方法,其计算也不困难,但在Excel里有些麻烦,所以做成函数,方便许多。
proximy(邻近性,hidalgo,2007)起初,我是通过VBA来算,不过太过耗时,而且容易出错,索性打包好,兴许还用得上。其中关键一步用到了矩阵相乘,感兴趣的可以翻看源码。
industry_code_transfer(工业企业数据库代码转换)根据GB/02与GB/11两个标准进行对比,进行批量的加和汇总。
托管于github,需要利用devtools进行安装。
library(devtools)
install_github("https://github.com/bashanyeyu/hmgeo",force = T)
用河南省2007年工业企业数据库部分数据(ex1)为例:
注意原始数据的格式:列为地区;行为行业产值。
利用函数“rca”,求河南省2007年各个地区的四位产业区位熵。
过程和结果如下。可见平顶山的1310的区位熵约为0.25,鹤壁市为1.04。
利用函数“proximy”,计算河南省2007年四位数行业的邻近性。
需要注意的是此函数要求行为地区,列为产业指标。
所以需要对原始数据进行转置。
过程和结果如图。
可见,1310与1320的邻近性约为0.67;1331与1320的邻近性约为0.38。
暂时写这几个,也是一段时间来的工作总结。之后慢慢更新,最近忙在开题、JS,这个没太多时间来做。
此处的邻近性proximy是基于Hidalgo与2007提出的产品空间理论。(Hidalgo C A, Klinger B, Barabási A L, et al. The product space conditions the development of nations[J]. Science, 2007, 317(5837): 482-487.)
首先假设如果2个产品在一个地区同时表现出显性比较优势(RCA)的可能性较高,那么在这个地区这2个产品之间存在某种联系,则这2个产品可以被看作是相互关联的。基于条件概率,分别计算了产品i和产品j在某一地区c同时具有比较优势的条件概率,并取最小值。proximy越高,说明各区域同时出口两类产品的条件概率越大,同时也表明这2种产品生产所需的要素比较相似,在产品空间上是邻近的。(杨佳意,朱晟君,2017)
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-10-19 22:25
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社