geoRp的个人博客分享 http://blog.sciencenet.cn/u/geoRp

博文

R包“hmgeo”发布-区位熵、产业关联、工业企业数据库

已有 2977 次阅读 2019-12-10 16:13 |个人分类:R编程|系统分类:科研笔记

重申原创!项目地址:https://github.com/bashanyeyu/hmgeo


此次发布为版本0.1.0,包括三个函数;:

  • rca(区位熵)区位熵是一种非常成熟的方法,其计算也不困难,但在Excel里有些麻烦,所以做成函数,方便许多。

  • proximy(邻近性,hidalgo,2007)起初,我是通过VBA来算,不过太过耗时,而且容易出错,索性打包好,兴许还用得上。其中关键一步用到了矩阵相乘,感兴趣的可以翻看源码。

  • industry_code_transfer(工业企业数据库代码转换)根据GB/02与GB/11两个标准进行对比,进行批量的加和汇总。


托管于github,需要利用devtools进行安装。

library(devtools)

install_github("https://github.com/bashanyeyu/hmgeo",force = T)




用河南省2007年工业企业数据库部分数据(ex1)为例:

注意原始数据的格式:列为地区;行为行业产值。



利用函数“rca”,求河南省2007年各个地区的四位产业区位熵。

过程和结果如下。可见平顶山的1310的区位熵约为0.25,鹤壁市为1.04。



利用函数“proximy”,计算河南省2007年四位数行业的邻近性。

需要注意的是此函数要求行为地区,列为产业指标。

所以需要对原始数据进行转置。

过程和结果如图。

可见,1310与1320的邻近性约为0.67;1331与1320的邻近性约为0.38。



暂时写这几个,也是一段时间来的工作总结。之后慢慢更新,最近忙在开题、JS,这个没太多时间来做。



此处的邻近性proximy是基于Hidalgo与2007提出的产品空间理论。(Hidalgo C A, Klinger B, Barabási A L, et al. The product space conditions the development of nations[J]. Science, 2007, 317(5837): 482-487.)



首先假设如果2个产品在一个地区同时表现出显性比较优势(RCA)的可能性较高,那么在这个地区这2个产品之间存在某种联系,则这2个产品可以被看作是相互关联的。基于条件概率,分别计算了产品i和产品j在某一地区c同时具有比较优势的条件概率,并取最小值。proximy越高,说明各区域同时出口两类产品的条件概率越大,同时也表明这2种产品生产所需的要素比较相似,在产品空间上是邻近的。(杨佳意,朱晟君,2017)




https://blog.sciencenet.cn/blog-3343669-1209507.html

上一篇:皖江城市带创新产出增长迅速
下一篇:"hmgeo"R包更新:新增熵权法、偏离份额分析函数
收藏 IP: 211.142.109.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-28 03:32

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部