生存生活生命分享 http://blog.sciencenet.cn/u/montec007 友诤友直友谅

博文

科技论文中数据的图形表达 精选

已有 15224 次阅读 2011-3-27 06:22 |个人分类:研究方法|系统分类:科研笔记

昨天我将以前写的、后来又删了的一篇关于抄袭的博文翻出来重贴了上来。其中一个观点,就是我们在整个教育当中,没有接受正规的有关科技论文写作的训练。虽是旧文,但今天重读,觉得这个观点还是比较合理的。今天得空,下面就最近读到一篇论文中的制图问题作一番案例分析,希望对科研刚入门的研究生有所帮助,也算是我在批判的同时,做一点小小的建设性工作。

具体文章来源先不说,请看下面这张图。这张图主要是为了说明桥梁结构中的三个不同主要构件(桥塔、梁、和索)的安全性随着设计承载力的变化趋势。构件的安全性既可以用安全性指标(Safety Index),亦可用失效概率(PF)来度量(作为一个背景知识:安全指标和失效概率具有一一对应的确定性函数关系;只要知道安全指标,失效概率就能算出来,反之亦然。安全指标越大,失效概率越小)。

请看图:




在我接着往下解释之前,请你再仔细看看,再想想:如果是你自己,会如何画这个图?你觉得这张图有哪些毛病?

为了进一步帮助你理解,我把原文拷在这里:
Figure 2 demonstrate[s] the safety indices and failure probabilities of the critical members (Girder 21, Tower 189 and Cable 5) for the different designs. The values on the left axis in Figure 2 show the safety indices and those on the right axis represent the corresponding failure probabilities.




>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>
有没有觉得很乱、很拥挤?
如果把安全指标和失效概率分开会如何?









是不是觉得清爽多了?

再看一下图例。这个图例做得非常糟糕,首先,图例的顺序没有按照曲线的顺序排列,读者在读这个图时,得要全神贯注,才能找到每根曲线的对应关系。尤其是在原图中,两张图叠在一块,简直就不准备让读者看懂哪是哪。

再看一下我进一步处理的图:




这样应该清晰多了吧?读者很自然地知道每根曲线对应着哪个构件。

你还有没有发现什么问题?有没有注意到横纵坐标的问题?

我们有什么理由让纵坐标的步长为0.91~0.92?
实际上原作者可能是取了0.915这个由EXCEL或什么软件自动计算出来的“智能”步长。又有什么理由让横坐标不显示100%这个关键的数值?实际上100%是Benchmark点(Standard Design),不但应该显示出来,而且应该突出强调,下面这样应该比较理想了(虽然在我多次修改之后,图像质量差了许多;由于没有数据,纵坐标的位置也是粗略改变的;另外字体也不太协调,但是我想我的意思应该是说清楚了的)。





(说明:
yuzh  2011-3-27 18:28: 一个搞桥梁设计的人,作图应该讲究美观。美观包括,字体大小的选择,字体的位置,曲线和符号大小的选择,在坐标轴的数据表示中,根本不应该在每一个刻度上出现%符号。 总之,作图的缺乏审美观,估计他制作的设计图纸也不会美观到那里。///博主回复(2011-3-27 23:00)确实如此,这个%也算是我的失误,本来就是Percentage,谢谢指正。

至于那张失效概率的图,你认为有必要吗?增加那样一张图,能带来多少附加的信息量呢?为了进一步帮助你理解,我把原文拷在这里:
Figure 2 demonstrate[s] the safety indices and failure probabilities of the critical members (Girder 21, Tower 189 and Cable 5) for the different designs. The values on the left axis in Figure 2 show the safety indices and those on the right axis represent the corresponding failure probabilities.

注意到了这个and吗?原图中用的是Vs. (versus)。Versus是什么意思大家应该都清楚,带有比较的意思。可是看作者的本意是什么呢?他只是想列举两种结果而已。再说,两者也没有什么好比的,如果真要比,就改变了整个图片的用意了。所以,原图的标题也有问题。照我看来,整个标题就不应该要。如果读者不太熟悉这个安全指标与失效概率之间的关系,可以在正文中解释。而原文实际上确实是有更为详细的解释的。

总之,我们在得到数据之后,图形如何表达实在是大学问。从某种意义上来讲,通过冗长的计算或繁重艰苦的试验,得到一些数据,这只是说明你完成了一位农民每天干的粗活。如果再把数据用现今市面上都有的绘图软件(如EXCEL,Origin等)把数据画成图,这也只是完成了从农民到会计的转换。即便这样,如果仅仅满足于软件自动给你画的图,你可能连一个合格的会计都不算。上面讲的这些,还只是教你如何成为一名合格的会计。要想成为真正的研究人员,就得像在李泳老师新近的一篇博文(数学形式里的内容)中谈到那样,要变着法子解释这些数据。

我再向大家推荐一本书:Picturing the Uncertain World: How to Understand, Communicate, and Control Uncertainty through Graphical Display by Howard Wainer
  • Publisher: Princeton University Press (April 6, 2009)
  • Language: English
  • ISBN-10: 9780691137599
  • ISBN-13: 978-0691137599
此外,科学网上的任胜利老师曾经写过更加专业的文章,比如:科技写作漫谈 (76):图表制作----基本原则科技写作漫谈 (77):图表制作----实例分析。顺藤摸瓜,大家都去看看吧。

最后,
作为一点咖啡时间的八卦,原图是从一位国际大牛(小领域内)最新发表的期刊文章中取出来的。第一作者是大牛,第二作者大概是其博士后。如果你是做结构可靠度这个方向的,可以在我的《工程可靠度及其应用》阅读清单一文中找到原文。

>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>
后记:谢谢编辑推荐。下面有不少朋友谈及作图软件,而这一点我是最不想强调的。虽然在这些软件当中,如Excel, Matlab, Maple, SAS, S+ (R), Origin等,仅就图形美观而言,Origin大概是最好的,但这不是我这篇博文的主旨。这篇文章有两个要点:
(1)一张图不要表达太多的意思,用哪种图(散点,柱状,是否连线)这是需要反复比较的。
(2)作图不能完全依赖软件。比如图框、线型、坐标系统(线性坐标还是对数坐标)和标注、图例、字体等等。关于图例,原则上能够不用图例就不要图例,将每根曲线对应的CASE直接标出来就好了。如果不能直接标出来,图例的顺序也要和曲线的上下顺序一致。



https://blog.sciencenet.cn/blog-103568-426712.html

上一篇:国科论坛冒名发文的做法应该停止!
下一篇:我们可以要求查看自己的档案吗?
收藏 IP: 99.231.66.*| 热度|

29 武夷山 任胜利 计军平 谢鑫 吉宗祥 赵星 刘晓松 王力 丛晓男 孙庆丰 郭保华 周凤瑞 杨海涛 杨华磊 王桂颖 魏强 毛培宏 于锋 赵凤光 吕喆 王琛柱 曹尚银 柳东阳 赵明 赵丽莹 liuzhan001st zzjtcm zhucele wgq3867

发表评论 评论 (22 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-3-28 21:33

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部