|
关于可视分析应用类文章评估的基本分和加分项:
基本分:
1. 精选topic, 有数据,有domain experts。topic一般读者也会有兴趣,比如空气污染,MOOC,手机数据等。
设计展现很强的专业性。表现在我给你们的checklist上。设计过程,设计的取舍,alternative design,scalability,generalization都有讨论到。
2. Evaluation完整。尽量做非常全面的evaluation,包括case studies,expert interview,user study等。宁可多做,也不漏掉。关键是得到domain experts的背书和提供有价值的反馈。
3. 写作前后贯通,浑然一体。所有的design goals,tasks,views都有编号或命名,后面有引用和讨论,没有漏掉也没有多余。这个可以用connection graph和在正文中搜索每一个编了号的goal,task和命名的view等进行检查。
4. 图做得专业。配色和谐,疏密有度,乱中有序,复杂中见pattern。图的种类避免单调,颜色避免过于凌乱,图中的字体大小一致,比正文的字体稍大。关键的visual cues, 可以用框框或是箭头加强。caption避免过于简略。做到读者只是扫一遍图和caption,就能对文章有个大致的了解。
加分项:
5. 在设计上进行创新。设计上的创新也是有章可循的,比如三段式的integrated design, 嵌入式的embedding design,和glyph。至少在一个图上做出“疏离感”,避熟就生,产生一定的新鲜感,不给reviewer说“all the designs are well known, nothing new”的机会。
6. 和machine learning/algorithm深度结合, 提高整个解决方案的sophistication。算法虽然不是主要贡献,但找算法的合作者写一个算法的section,紧扣visual analytics (一定是visualization+mining/machine learning),提升整个系统的sophistication。
拿到完整性和专业性的基本分,努力争取novelty和sophistication的加分。
关于专业性的checklist: 可视化文章投稿的checklist
关于和可视化相关的Tasks:可视分析系统,让机器(算法)做机器(算法)擅长的,让人做人擅长的,关键是找到人和算法的boundary。如果有些tasks,算法就能解决得很好,就不需要用到可视化。可视化几个killer applications:1. Summary of a lot of items/dimensions. 数据量很大或是维度很高的时候,需要一个overview,这时候t-SnE, MDS, heatmap等都比较有用;或者是先两个维度的scatterplot, 然后每个点用glyph来展现更多的维度。2. Comparative analytics。比对A和B, 最好的方法就是可视化出来他们的异同(juxtapose, overlay, or explicit encoding); 3. Fuzzy clusters, outliers等,算法比较难选参数,可视化可以很好反映连续性的渐变过程。4. Trend。 比如反映股票走势等,可视化就必不可少。5. Correlation analysis,尤其是带地图或是时间的。可视化能帮助用户discover unexpected。如果自动方法能detect出来的correlation,最好是先算法筛选,然后再呈现。完全没有算法,靠肉眼发现correlation,不大靠谱。
关于Case Studies:做case studies,就是讲述数据里面的故事。而所谓的故事,就是黄秋生下面说的两点。
黃秋生接著帶到,「寫劇本最重要的元素是甚麽呢?第一個是『出人意表』,另一個元素是『情理之中,意料之外』」。黃秋生接著解釋,「『出人意表』是你猜想不到的,『情理之中,意料之外』就是,很合理,但你又猜想不到的。」
工科生的一大弱点,就是一直被训练做抽象,概括力强,但对数据里面的血肉和细节变得不敏感。论文的case studies里面,有些是大家都能想到的,验证系统是正确的。但也要有些“出人意表”,“情理之中,意料之外”的故事,illuminate and entertain 读者。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-22 19:02
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社