inforworld分享 http://blog.sciencenet.cn/u/rbwxy197301 教学和科研过程中的心得。

博文

《机构知识图谱的构建及其应用》相关资料

已有 10272 次阅读 2015-6-19 10:42 |个人分类:科学计量学|系统分类:科研笔记| 机构知识图谱

该书在撰写过程中,委托安徽财经大学的研究生石磊、闫莉莉和许媛媛三位同学收集了一些可视化软件及相关软件的资料。由于书稿篇幅所限等原因,书中没有附近上这部分内容。贴在下面,供大家参考。

Agna是由Sun公司借助Java语言开发的一款独立于平台的、为社会网络分析和序列分析而设计的软件,能进行中心性分析、距离相关性系数的计算,适用于社会网络、血缘关系网络、沟通关系网络等。它是一种自由可视化软件,拥有AGNCSVTXTDATTEXTSVGJPEG等多种数据格式,支持WindowsMacintoshUnixLinux等多种平台(资料来源:http://star.sgst.cn/upload/attach/attach20140129093207gfg2q50k0t.pdf)(免费)

GUESShttp://graphexploration.cond.org/)是由EytanAdar开发的一款可以定制和修改界面的软件,功能直观多样,能进行动态网络分析,通过命令和菜单进行操作,适用于社会网络、知识网络、电脑网络、生物学网络等的分析。它是一种可视化软件,拥有GDFGraphMLPajek数据、GIFPNGEPSPDFJPGSVG等多种数据格式,支持WindowsUNIXMac等多种平台。

Bibexcelhttp://www8.umu.se/inforsk/Bibexcel/)是由瑞典科学计量学家Persson开发的专门文献计量免费软件。是一种知识图谱软件,其分析功能强大,可从WoSScopus等众多数据库中读取数据,提取多种知识单元及关系数据,并通过不同方法简化和规范化数据。但是它的可视化功能弱,常常用于知识可视化前期的数据预处理,然后输出到Pajek, NetDrawSPSS进一步可视化。(离线免费)

CiteSpacehttp://cluster.cis.drexel.edu/~cchen/citespace/)为知识图谱分析工具,由美国Drexel大学信息科学与技术学院教授陈超美博士开发,是适合进行多元、分时、动态复杂网络分析的免费可视化知识分析工具。该软件运行于Java平台,可以读取几乎所有常见格式的又献数据,包括专利、医学数据和中又数据。数据关系矩阵可以使用Co-sineDiceJaccard标准化。具体的图谱有三种可视化模式!聚类视图,时间线和时间区域模式,可以聚类展示不同时间段内知识的演化;运用突变检测在知识领域对知识趋势进行展现。(在线免费)

CoPaIRedhttp://ec3.ugr.es/copalred/)由西班牙Granada大学的EC研究团队开发的商业软件,使用共词单元来分析文献,能将已有知识转化提炼,发现新知识;在数据预处理中能将关键词语规范化。它有三方面的分析:结构分析,在主题网络中展现知识,包括词语及其关系;战略分析,通过中心度和密度,在全局主题网络中为每个主题定位;动态分析,分析主题网络随时间的演变,可以鉴别出主题的路径、分支、出现和消失。(收费)

Gephihttp://gephi.org./)是由Association for the Advancementof Artificial Intelligence开发的一款开源免费跨平台基于JVM的复杂网络分析软件, 其主要用于各种网络和复杂系统,动态和分层图的交互可视化与探测开源工具。可用作:探索性数据分析,链接分析,社交网络分析,生物网络分析等。被誉为数据可视化领域的 Photoshop”,它的界面非常优美。和 pajek 一样,Gephi 能处理大量的数据,适合于绘制大型的图谱,支持的节点数达 50,000 个,支持的边达1,000,000 条之多。和 Network Workbench ToolSci2 Tool 一样,使用 Gephi 的用户可以自定义插件,在 Gephi 的官方网站插件一栏中下载研究所需要的插件,这样增强了用户的自主性。Gephi 还支持中文操作,有相关的中文视频教程,加之此软件操作简单,用户可以很容易地掌握并使用该软件。(离线)

HistCitehttp://interest.science.thomsonreuters.com/forms/HistCite/)是Garfield开发的软件包,是一种知识图谱软件,能够方便地利用WoS数据,通过某一研究领域的又献以及柜互引用情况,来分析以及判定其中的关联以及把握学科的进展,产生编年图谱;特别突出高被引又献并且按年代排列,该软件也能对原始数据中的错误及参数进行探测与编辑,还能对相关术语排序与分析。(基于浏览器)

Axiishttp://www.axiis.org/index.html是由Tom GonzalezMichael VanDaniker开发的数据可视化制作工具。其构建在Degrafa之上,完善了Degrafa不具备把数据绑定到图形的默认能力的缺陷,可以看成是Degrafa的扩展。Axiis让开发人员通过简洁直观的标记,清晰明白地定义数据可视化方式。它的设计目标是成为一个简明的、富有表现力的、模块化的框架,可以使开发者和设计人员通过组装简单而且容易理解的构图元素,就可以创建迷人的数据可视化方案。它的主要特色是富有表现力、代码简洁、模块化构建、开源项目。

BiblioToolbox是由Grauwin等人开发了开源的知识可视化的知识图谱软件,认为可以快捷、客观地展示科学机构间的合作关系,并以法国里昂一个研究机构为例,构建不同角度的科学机构图谱。(资料来源:http://www.360doc.com/content/13/0519/04/4310958_286464890.shtml

Bicomb是由中国医科大学医学信息学系开发的书目共现分析系统,采用目前技术成熟、流行的数据库语言开发,主要目标是对以生物医学文献数据库中的书目文献信息进行快速扫描,准确提取并归类存储、统计计算、矩阵分析等等,为进一步研究提供全面、准确的基础数据。其可对国际上权威的生物医学文献数据库、科学引文索引数据库的网络格式和光盘格式以及中国知网的记录进行读取分析,并允许用户对某些功能进行修改、增加等拓展,具备较强的适应性和一定的扩展性,具有共现矩阵生成功能和文献计量分析功能。(资料来源:http://wenku.baidu.com/view/2304b16a7e21af45b307a843

Bicoms是由中国医科大学崔雷教授开发的文献共现矩阵生成软件,它完成了文献外部特征的统计功能,对其中任何两个词在文献中同时出现(共现)次数进行统计,最终生成共现矩阵,对于共现矩阵中的数据是两个一定频次的词在文献中同时出现的次数,通过导出共现文献信息功能,可以掌握这些数据相应的文献的具体信息。但在生成共现矩阵时,只能按照原有关键词的词频顺序,以一定的闽值过滤关键词,没有对关键词进行修正或合并。(资料来源:http://wenku.baidu.com/view/2304b16a7e21af45b307a843

Crossfilterhttp://square.github.io/crossfilter/)是一个用来展示大数据集的 JavaScript 库,支持超快的交互,甚至在上百万或者更多数据下都很快。主要用来构建数据分析程序。是一种在浏览器中探索大型多元数据集的JavaScript库。其支持速度超快的交流与互动,甚至在上百万或者更多数据下都很快。由于大部分交互只涉及单一维度,然后只需对过滤器的值做稍微调整,增加或减少过滤就会比从头开始更快。 Crossfilter使用排序索引使这成为可能,极大地提高实时直方图和顶部-K表的性能。

D3http://d3js.org/)是支持SVG渲染的另一种JavaScript库。但是D3能够提供大量线性图和条形图之外的复杂图表样式,例如Voronoi图、树形图、圆形集群和单词云等。虽然D3能够提供非常花哨的互动图表,但你在选择数据可视化工具时,需要牢记的一点是:知道在何时保持简洁。D3 是最流行的可视化库之一,它被很多其他的表格插件所使用。它允许绑定任意数据到DOM,然后将数据驱动转换应用到Document中。你可以使用它用一个数组创建基本的HMTL表格,或是利用它的流体过度和交互,用相似的数据创建惊人的SVG条形图。

Microsoft Excelhttp://office.microsoft.com/zh-cn/excel/)是微软公司办公软件Microsoftoffice的组件之一,是由MicrosoftWindowsApple Macintosh操作系统的电脑而编写和运行的一款试算表软件。Excel 是微软办公套装软件的一个重要的组成部分,它可以进行各种数据的处理、统计分析和辅助决策操作,广泛地应用于管理、统计财经、金融等众多领域。新增功能有:可以打开或关闭表格标题行、计算列使用单个公式调整每一行、启用自动筛选以支持强大的表格数据排序和筛选功能。

Flare(http://flare.prefuse.org/)是加利福尼亚大学伯克利分校(University of CaliforniaBerkeley)可视化研究实验室所开发的一面向WEB数据可视化应用的、开源的项目,它的前身是有名的prefuse,一个用于交互式数据可视化的JAVA类库。此项目旨在使交互式数据可视化工作变得容易。与它的前身prefuse不同,flare是一个ActionScript库,运行于AdobeFlash Player之上,可以与当下十分流行的FLEX开发工具结合进行十分炫丽的数据可视化工作。从基本的图表到复杂的交互式图形,这个工具包提供包括数据管理、可视化编码、动画和交互技术等一系列支持。更重要的是,flare提供的模式化的设计可以让开发者免去很多不必要的重复性工作而建立一些定制好了的可视化技术。Flare是一个遵从BSD license的开源软件。

Gapminder http://www.gapminder.org/)是瑞士Gapminder基金会开发的一个统计软件,你可以形象地看见用世界银行提供数据绘制的的世界各国各项发展指数。它用一种新的方法动态地展示了各个国家的历年的各项发展指数,包括了二氧化碳排放量、儿童死亡率、经济增长率、每1000人网民数量、军事预算、每1000人电话用户、城市人口等等。它用一系列分散的点代表不同的国家,点的位置由轴线对应的指数决定。 2006TED大会上Hans Rosling的演讲一直令人印象深刻,其开发小组设计的Gapminder完成了一个以在线统计数据为基础的互动图表集的完美世界。2010年他们终于克服了在线的使用障碍,Gapminder以桌面软件的形式向世人发布,此版本适合目前所有操作系统。Gapminder是为顺应全球趋势而为教师和学生设计的应用软件,但其所预载的600个数据指标(健康,环境,经济,教育,贫困,技术,等等),和完美的展示效果使其在未来不会囿于教育领域的使用。

Google Chart APIhttps://developers.google.com/chart/interactive/docs/reference)是由Google 开发的并提供了动态生成图表并嵌入到Web页面中的功能。Google Chart API 为每个请求返回一个 PNG 格式图片,可以在网页中使用<img>元素插入图表,当浏览器打开该网页时,Chart API 提供即时图表。现在的版本支持一组相当多元化的图表类型,包括线条图条状图维恩图散点图等,还支持一些其它效果它是一个美观、简洁但很强大的API,使图表拥有更多有趣的可能性,其动态特性还意味着可以用它来提供(相对)实时的更新信息。

GooglePublic Data Explorerhttp://www.google.com/publicdata/directory)又称Google公共数据浏览器,其来自Google公司的公共数据团队,专为学生、记者、决策者等狂热的数据爱好者打造,能够让人们以非常直观的图表方式浏览各种公共统计数据,诸如条形图(线性/对数)、柱形图、地图、气泡图等等,而且可以随意选择要查看的统计数据类别、国家和地区、货币汇率、历史时间进行对比,更改选项的时候图表还会动态变化,最有趣的是如果历史数据充足,还能得到Flash动态演示以观察历史变化趋势。图表制作完成后,可以分享或嵌入到网站、博客中。它的数据提供机构目前有世界银行、欧洲统计局等80多个涉及各种领域的不同资源,都具有很强的权威性和参考价值。

Graphvizhttp://www.graphviz.org/)是贝尔实验室设计的一个开源的画图工具,它的强大主要体现在所思即所得,这是和office所见即所得完全不同的一种方式。它的输入是一个用dot语言编写的绘图脚本,通过对输入脚本的解析,分析出其中的点,边以及子图,然后根据属性进行绘制。用户在使用graphviz来绘图的时候,主要工作就是编写dot脚本,只要关注图中各个点之间的关系,并不需要考虑如何安排各个节点的位置,怎样布局能够所绘制的图更美观。

ImageChefhttp://www.imagechef.com/)是由来自于美国旧金山的一家科技公司创建的新型成像服务,创建于2003年。它是一个挺有趣的服务,可以生成各种类型的个性图片,在这款软件上你可以编辑自己的图片与文字描述,并且有很多不同的图片构造,比较适合喜欢图片美化的用户。它提供了大量的图像模版,包括动画图像,而图像中的文字可以由用户自定义,并且还支持中文。同时,它还提供了一个制作IM头像定制服务,支持AOLMSNYahoo三种IM的头像大小。

IN-SPIRE

IN-SPIRE是西北太平洋国家实验室开发的一款知识图谱分析软件。IN-SPIRE可读取常见的数据格式,使用向量空间模型来计算文档间相似度;常通过词语来构建图谱,具有关键词自动抽取、突变术语检测和主题聚合等新算法。它提供两种可视化:Galaxies是模仿星空的分布、Themescape是在前者基础上构建,形成三维图,将主题看成沉积层,形成自然地貌图。它也提供了系列工具来发现隐藏的知识,例如时间功能(Time slicer)可发现某个主题的增长、萎缩和融合。

Network Workbench Tool

Network Workbench Tool是由美国印第安纳大学开发的免费软件,可对大规模知识网络进行分析、建模和可视化。它提供特殊的算法来处理文献数据,可以读取几乎所有常见数据格式,来构建和分析知识网络和图谱。它可以完成数据预处理、不同类型网络构建、知识网络的分析,知识可视化整个流程;也可进行历时性分析。数据的预处理包括去重,分时间段,探测和整合同义词;可以构建多种网络:共引、合作、共词和耦合等,也可以形成作者文档网络或直接引证网络;可使用众多算法分析知识网络,并进行突变探测;具体图形可视化则是通过外部插件程序。(资料来源:http://nwb.slis.indiana.edu/

Sci2 Tool

Sci2 Tool是由美国印第安纳大学开发的免费软件,专门用于研究科学结构的模块化工具,可从时间、空间、主题、网络分析和可视化等多角度,分析微观(个体)、中观(局部)和宏观(整体)水平的知识单元。它可输入常见格式数据;提供多种方法处理数据;Sci2 Tool包括DrL等算法和一些可视化插件;可以构建常见的知识单元网络,还能形成作者引证、论文引证、作者论文等直接关系网络。它可通过多种算法可视化实现学术团体检测和骨干鉴定;历时分析可对数据进行时间段分割并突变检测;空间分析是通过地理编码和地理空间主题图完成;主题分析是对词语突变检测和共词分析来执行;网络分析则可进行统计分析和在网络上应用不同算法。

Leydesdorff’s Software

Leydesdorff’s Software是由荷兰阿姆斯特丹大学的著名科学计量学家Leydesdorff开发的,由针对特定功能而设计的系列小命令行程序组成。可以处理共词、合作、耦合、共引等知识单元关系。结果可以通过外部可视化软件展现出来;擅长分析国际和大学的合作,城市间合作。对各文献数据库批量数据的组织,设计专门程序,其中关系矩阵用 Cosine规范。该套程序对数据预处理功能不强,例如要进行历时分析,需要使用其它软件对数据分段。

Pajek

Pajek软件是可以处理结点数大于100万的大型网络,同时具有网络分析和可视化功能的软件,属于高端学术类软件,由Andrej Mrvar等于1996年开发。该软件可以从网上免费获取,限于非商业运用。在处理大量数据的复杂网络时,Pajek提供多种有效的算法,将大型的网络有效分解为几个小的子网络,很好地解决了大型网络难以可视化的问题。它不仅支持构建一些普通的网络(例如:有向网络、无向网络、混合网络),还能构建一些特殊的网络,例如:多关系网络,暂时性网络(动态图网络随时间演化)等。Pajek的不足之处是在数据的预处理和数据的规范化处理方面能力有限。

(资料来源:http: //vlado.fmf.uni-lj.si/pub/networks/pajek/default.Htm

MultiNet

MultiNet是适合分析大型数据集和稀少网络数据的工具。它是菜单驱动的,可获得高级菜单和附加菜单信息,提供结果的图像表示技术和文本输出技术。该软件能处理5,000以上的结点,它的特点主要是菜单设计合理,提供在线帮助,能够同时输出图形和文本结果,波谱分析的图形能展示链接的强度和方向及结点的属性。MultiNet不仅提供网络的图形表达,也提供柱状图,线性图表,以及所谓的面板图,网络利用特征分解可视化。它包含四种统计技术:交叉表和卡方检验,ANOVA,相关和p*指数随机图模型。

NetworkX

NetworkX是由AricHagberg等人开发的基于Python的软件包,为创建、操作、研究复杂网络的结构特性、动态特征和功能特点而设计。NetWorkX使用“dictionary of dictionaries ofdictionaries”数据格式,这使得它非常适合稀疏网络。NetWorkX提供的基本图形类型有:Graph(无向图)、DiGraph(有向图)MultiGraph(多边无向图)、DimultiGraph(多边有向图)。所有的图形都用boolean属性描述图形的有向性、权重、多边图等性质。NetWorkX可以进行最短路径计算、广度优先聚类、同构分析、社团发现、个体网络分析、差异性分析、中心性分析等。由于PajekUCINETNetMiner都是菜单驱动的,NetWorkX是通过命令行来进行操作的,所以增加了其操作的难度。

(资料来源:http://networkx.lanl.gov/

Rost

Rost是由武汉大学信息管理学院计算机学院沈阳教授虚拟学习团队开发的一系列软件。包括内容挖掘系统ROST Content Mining System、舆情监控系统ROST NewScan、图书选题软件ROST BookScan、反剽窃系统ROSTAntip、网站分析系统ROST SiteScan、暗链分析系统ROST DUA、英文试卷分析系统ROST EpaperAnalysis和投稿审稿系统ROSTJournal Review System。目前ROST虚拟学习团队理论研究重点是:微博、信息传播动力学、内容挖掘与分析、情感分析、数字出版和电子政务。

(资料来源:http://blog.sciencenet.cn/blog-239936-373828.html

NetDraw

NetDraw是简单的绘制网络图的工具,由Steve Borgatti 开发的一个免费的程序。它可以同时处理多个关系,并且可以使用节点的属性来设置颜色,形状,以及节点的大小;可以读取UNINET系统文件、UNINET DL文本文件、Pajek文本文件和自己的VNA格式(允许保存网络数据和属性数据,一起像空间坐标,颜色,布局等信息)。绘制的图片以WMFBMPJPG文件格式保存,也可直接打印。

Many eyes

Many eyes是由IBM开发的一个巨大的在线虚拟系统和平台,能够帮助创建可视化图表和分享海量的交互信息。通过这个平台,用户可以创建可视化作品,上传数据集,对其他用户所创建的可视化进行评论、分享和评分,还可以创建或者加入自己感兴趣的可视化主题中心。

Many eyes提供了数十种最受欢迎的可视化方案:显示数据之间关系的矩阵图、显示时间序列分析的堆积图、显示名词使用频率的字云图、显示层次数据的树状图、显示地理位置的世界地图。通过该平台,即使你不是专业人员,依然可以做出相当专业的、可视化程度高的图表。

 

Nano Mapper

Nano Mapper是由Dang等人开发了专门针对纳米技术领域的可视化软件。它基于网络,在数据库适应性、可视化与分析功能、算法等方面,具有许多重要特色与优点。Nano Mapper可以计算并显示在不同的分析层次选定时间段的专利/授权出版和引文的统计信息,可以可视化和比较的专利和补助金在不同的分析层次的年度出版物的趋势,用来评估知识扩散模式。用户利用Nano Mapper可以搜索:专利/授权标识符;标题中的关键字、摘要或(专利)索赔;对不同的专利/授权数据字段(即高级搜索)标准的组合。

(资料来源:http://www.ncbi.nlm.nih.gov/pmc/articles/PMC2988202/

NodeBox

NodeBoxMac OS X的应用程序,它可以让你创建2D视觉效果(静态,动画或交互)使用Python编程代码,并将其导出为PDFQuickTime影片。NodeBox是免费的开源软件,开发人员可以扩展NodeBox或改善它。NodeBox使用Python编程代码,即使对于非程序员,也很容易理解。在NodeBox中,用户可以从Adobe Illustrator中更改你的矢量图像,而且随着更多支持的SVG库,你还可以在NodeBox单独操作每一条曲线。

(资料来源:http://nodebox.net/code/index.php/Download

Palantir

Palantir创建于2004年,为政府机构和金融机构提供高级数据分析平台。Palantir的基本要点就是收集大量数据,帮助非科技用户发现关键联系,并最终找到复杂问题的答案,该产品源自PayPal,由最初反欺诈措施发展而成,主要用户来源于华盛顿,其政府业务占到了70%,其余业务主要来自私人金融机构。该平台把人工算法和强大的引擎(可以同时扫描多个数据库)整合到了几近完美的境界。Palantir有两种服务:分别面向政府和金融机构。

其基本系统可以同时处理大量数据库,并允许用户通过多种方式快速浏览相关信息,与PayPal比较Palantir安全问题敏感性更高。

(资料来源:http://www.palantirtech.com/

Processing

Processing 是一个开放原始码的程序语言及开发环境,提供给那些想要对影像、动画、声音进行程序编辑的工作者。它是 Java 语言的延伸,并支持许多现有的 Java 语言架构,不过在语法 (syntax) 上简易许多,并具有许多贴心及人性化的设计。Processing 可以在 WindowsMAC OS XMAC OS 9 Linux 等操作系统上使用。目前最新版本为2.1.1。以 Processing 完成的作品可在个人本机端作用,或以Java Applets 的模式外输至网络上发布。Processing在官方网站上可以下载到,但需要支付一定的费用。

(资料来源:http://processing.org/

1RefViz

RefViz是由Thomson ISI Research Soft OmniViz联合推出的一款可视化文本分析和数据挖掘工具软件。在RefViz中,文献按照主题内容组织并以交互视图的方式出现,使科研工作者可以方便快速的发现文献的主题和自己感兴趣的领域。RefViz可以分析文献间的相互关系,帮助了解某一领域的整体概况和研究热点,并帮助寻找新的研究方向和研究方案;可以实现与EndnoteRM的无缝连接,即我们可以将手头的Endnote数据库和RM数据库直接导入。需要强调的是,RefViz对硬件的要求比较高。

SATI

SATI(Statistical Analysis Toolkit for Informetrics)是通过对期刊全文数据库题录信息的处理,利用一般计量分析、共现分析、聚类分析、多维尺度分析、社会网络分析等数据分析方法,挖掘和呈现出美妙的可视化数据结果。并通过免费、共享软件功能及开源、增进代码实现,为学术研究提供期刊文献数据统计与分析的辅助工具。 SATI主要有以下四大功能:题录格式转换、字段信息抽取、词条频次统计和知识矩阵构建。

Jigsaw

Jigsaw是一个多维数据可视化工具集。Jigsaw不仅是一个可视化工具,更是一种分布式协作平台。用户可以浏览其他公共工程的可视化,然后将它们合并到自己的。Jigsaw没有编码,无需专业技能,可以创建专业级可视化项目,做数据分析一样容易使用Windows画图,是最易于使用的可视化工具包。

Loggly

Loggly是一个基于云监测的软件开发平台,帮助程序开发者们监测其开发程序,并提供智能解决方案。用户只需要购买该服务而不需要专门雇佣技术人员。Loggly索引应用程序可以用来诊断、监控和分析用户的习惯。Loggly可以完成应用程序的信息收集和汇总分析,在开发过程中不断地寻找和修复bug,提前监控应用程序的威胁点并设置定制警报条件,消除那些问题在萌芽状态中。用户只需要在自己的后台加一段代码就可以实时监测软件的效果。

SciMAT

SciMAT是一个用于知识图谱绘制的软件,与现有其他科学知识图谱绘制软件的不同之处有:(1)强大的前处理模块,以清洁的原始文献数据;(2)使用文献计量措施研究每个研究的元素的影响,(3)向导配置分析。(资料来源:http://sci2s.ugr.es/scimat/index.html)

Splunk

Splunk 是一个功能能强大的日志管理工具。使用 Splunk 可收集、索引和利用所有应用程序、服务器和设备(物理、虚拟和云中)生成的快速移动型计算机数据。它的主要功能特性是1、多平台支持;2、可以从任何源实时索引任何类型的计算机数据;3、可以从远程系统转发数据;4、可以跨许多数据来源关联整个工作环境中的复杂事件;5、专为大型数据构建,每天可收集和索引成千上万太字节的数据;6、在整个数据中心扩展;7、提供角色型的安全性。(资料来源:http://baike.baidu.com/view/2209060.htm?fr=aladdi下载地址http://www.splunk.com/

Spotfire

TIBCO软件公司于20101214日宣布TIBCO Spotfire analytics 中文版登陆中国市场。TIBCOSpotfire analytics软件可以再几秒钟的时间内完成信息处理过程,并理想解决方案。其适用于几乎任何信息和业务流程的处理。与传统的商业智能分析软件相比,Spotfire软件可以形象化的表现信息处理的结果,并能对未来的发展趋势进行预测分析。该软件采用内存处理模式和独特的形象化互动性数据分析手段,可以直观反映信息处理的结果,便于用户查看和理解。

(资料来源:http://download.zdnet.com.cn/files/klist-24-252930-1.htm

SPSS

SPSS(统计产品与服务解决方案)是世界上最早出现的统计分析软件,于1968年由斯坦福大学的三位学生创建,2009IBM公司将其收购,如今SPSS已出至版本21.0,而且更名为IBM SPSS。它主要包括四个部分:PASW Statisticsformerly SPSS Statistics)统计分析;PASW Modelerformerly Clementine)数据挖掘;DataCollection familyformerly Dimensions)数据收集;PASW Collaboration and Deployment Servicesformerly Predictive Enterprise Services)企业应用服务。Spss的主要功能是数据管理、结果报告、统计建模、模块和兼容性。(资料来源:http://baike.baidu.com/view/130328.htm?fr=aladdin下载地址http://www.crsky.com/soft/28528.html

STOCNET

STOCNET是个WINDOWS环境下的开放软件系统,适用于社会网络的高级统计分析。它提供了一个应用多种统计方法的平台,每种统计方法可以以单独模块的形式方便的嵌入其中。STOCNET包含六个统计模块:(1BLOCKS,随机块模块;(2ULTRAS,使用超度量(ULtrametrics)估计潜在的传递性结构(latent transitive structures);(3P2,拟合指数随机图p2模型;(4SIENA,纵向网络数据的分析;(5ZO,确定随机图统计量的分布概率;(6PACNET,构造和拟合基于偏代数结构的结构模型。(资料来源:http://blog.sina.com.cn/s/blog_5092b8e901008tli.html

Tableau Public 8.1

Tableau Public 8.1是由美国Tableau公司研发的数据理解工具。Tableau主要功能特点是(1)允许普通业务人员将表格中的数据转变成各种可视化的图形,拥有强交互性的仪表盘并可以共享给企业中的其他用户;(2)良好的数据可视化界面使得用户可以通过简单地拖拽发现数据背后所隐藏的业务问题,同时其具有内置地图引擎,可以通过省份、城市名称创建地图及通过提供经纬度自定义地图;(3)提供两种方式访问大数据量:内存计算和数据库直连(4)与R集成,Tableau现集成了一个含有统计功能、库和软件包的开源集合,可视化分析可以满足世界级数据科学研究的需要。(资料来源:http://www.tableausoftware.com/zh-cn/new-features/8.1?tid=1927#feature-list下载地址:http://www.tableausoftware.com/products/desktop/download?os=windows

TagCrowd

TagCrowd是由美国斯坦福大学的Daniel Steinbock所编写的一款在线(http://www.tagcrowd.com/)的标签云生成工具。用户通过一些设定包括标签展示数、忽略展示的关键词、忽略常用的词、是否分组相似的词等,将一段文字或者某一网页里字词出现频率以可视化的标签云的形式反映出来,生成后的标签云可以通过HTML代码放在web/blog中。(资料来源:http://www.tagcrowd.com/faq.html

Tagul

Tagul是一个Web服务,使您能够创建华丽的标签云(又名词云),您可以将您的网页或与朋友分享。 Tagul云有针对普通文字的云彩像里面的单词功能,花哨的字体,不同的云的形状,可定制的颜色等,这使得Tagul云看起来如此绚烂的诸多优势。

(资料来源:http://tagul.com/faq

Tagxedo

Tagxedo(标签云)与2010年上线,完美支持中文,并支持定义云的外型。Tagxedo将词频,主题,标签很好的结合在一起,采用Sliverlight,渲染速度快。优点是可以定制云的外形,可以提取导入的文本或URL内容个高频词作为构成元素,通过自定义配色,绘制属于完美的标签云。

(资料来源:http://www.360doc.com/content/13/0103/22/7266134_258048897.shtml

 

TDA(Thomson Data Analyzer)

Thomson Data Analyzer是由美国ThomsonReuters科技信息集团研发的一个具有强大分析功能的文本挖掘软件,可以对文本数据进行多角度的数据挖掘和可视化的全景分析。TDA能够帮助用户从大量的专利文献或科技文献中发现竞争情报和技术情报,为洞察科学技术的发展趋势、发现行业出现的新技术、寻找合作伙伴、确定研究战略和发展方向提供有价值的依据。它的使用流程是1、数据导入,可以分析多种数据库的数据,从而摆脱了过去需要选择不同软件分析相应数据库带来的不便;2、数据清理,它能够清理科研机构或作者不同的拼写方式、公司并购带来的不同名称问题、公司内部技术分类系统、将简称转换成全称及将代码转换成文本,通过这些数据清理,可极大地提高分析效率和准确性;3、数据分析,可以快速生成排名列表、揭示两公司/机构之间技术共性和独特性、显示任意两字段之间的相关性、可视化显示作者/发明人(公司/机构)之间的相互关系;4、生成报告,通过内置的宏命令,只需点击按钮就可生成公司报告、公司间的比较和对某一技术领域的分析报告。(资料来源:http://www.thomsonscientific.com.cn/productsservices/TDA/

Tulip

Ucinet

Ucinet是由加州大学欧文分校的一群网络分析者编写的用于社会网络分析的软件,目前版本已更新至Ucinet v6.415Ucinet网络分析集成软件包括一维和二维数据分析的NetDraw以及三维展示分析软件Mage等,同时集成了Pajek用于大型网络分析的Free应用软件程序。利用Ucinet软件可以读取文本文件、KrackPlotPajekNegopyVNA等格式的文件,它能处理32767个网络节点。另外,该软件包有很强的矩阵分析功能,如矩阵代数和多元统计分析。(资料来源:http://baike.baidu.com/view/2343008.htm?fr=aladdin

VOSViewer

VOSViewer是雷登大学CWTS研究机构的相关研究人员专门开发的用于科学知识图谱绘制的有效工具。主要用途是1、可以用来基于网络数据创建地图,地图创建使用VOS映射技术和VOS聚类技术,它主要用于分析文献计量学相关的网络,例如绘制基于文献共引关系的期刊、作者及出版机构的的网络地图;2、可以用来查看和探索地图,并可以各种不同的角度来展示一个地图。(资料来源:http://www.vosviewer.com/ 下载地址http://www.vosviewer.com/download/

WordItOut

这是一种标签云制作工具,它的作用是从标签转向所有的文字创建文本云,用户只需简单的输入文字,通过模板或自行设计修改来创建有标签云感觉的文字新排版样式。它的操作非常简单,用户只需进入网站(http://worditout.com/)输入一段文字,然后就可以生成各种样式的文字。除了WordItOut所提供的各种模板外,用户还可以根据自己的需要对其进行再设计,比如颜色、字符大小、字体、背景、文字相对位置等,接下来用户可以直接粘贴相关的代码,拷贝到自己的博客或网站。(资料来源http://tech.163.com/10/0209/10/5V2TK0NR000915BF.html

Wordle

Wordle是一种在线文字云制作工具(系统需预装载JAVA),它的优点是可以快速的分析文本或网站的词频,并以多种多样风格展示,且支持文字字体选择和用户自定义颜色。目前Wordlle只支持英文,所以应在Excel或记事本里先将中文信息转换成Wordlle可识别的的语言,即英文或数字。基本思路是将每一个中文字对应一个英文字母,完成其在Wordlle中的一个占位,将打印出来的文字云导入CoreIDRAWPhotoshop中进行后期处理。(资料来源:http://www.wordle.net/下载地址http://www.wordle.net/

WordSmith

WordSmith是一个在Windows下运行的用来观测文字在文本中的表现的功能强大的综合软件包。它共包含Concord(语境共现检索工具)、WordList(词频列表检索工具)、KeyWords(关键词检索工具)、Splitter(文本分割工具)、Text Converter(文本替换工具)、Viewer(文本浏览工具)等六个程序,其中前面三个程序是主要的文本检索工具,后面三个程序属于辅助性工具。这六个程序的各项设置由一个叫WordSmith Tools Controller(文字匠工具控制器)的程序来控制。(资料来源:http://www.wordsmith.org/ 下载地址http://www.cncrk.com/downinfo/507.html

 

  可视化软及相关工具不断出现,后续有新的东东,会进行更新。



https://blog.sciencenet.cn/blog-113146-899090.html

上一篇:一卡通
下一篇:百度图说试用——地图
收藏 IP: 60.170.236.*| 热度|

5 武夷山 杜建 刘桂锋 姜春林 李盛庆

该博文允许注册用户评论 请点击登录 评论 (1 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-7-28 00:48

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部