|
HKUST VisLab在疫情期间,坚持科研。同学们分散各地,有居家留守的,有在科大隔离的,在面临前所未有的挑战的情况下,齐心协力,守望相助,完成了10多篇IEEE VIS2020投稿。 投稿结束后,同学们写了不少对投稿的回顾与反思。 下面是受到广泛好评的王懿芳同学写的反思文章。王同学是浙大计算机学院高材生,很有江南才女的气质,关注人文,喜欢digital humanities。这是她第一次一作投稿,和人文学者们合作,研究清朝官员的升迁,挖掘出不少有意思的pattern。 写的反思文章可读性很强, 叙事和情感交织,理性和感性并存,记录了一次投稿过程的各种艰难时刻和灵光一闪,那些走过的弯路和心灵的挣扎,跨学科合作的不易,同学之间的温馨时刻,。。。,读过之后,令人动容,是回顾文章的典范。 懿芳同学的主页:http://wangyifang.top/about/
------
2019年11月到2020年5月。这半年似乎过得异常艰辛,天灾人祸纷至沓来。做的事情亦更加复杂,体验的情感也愈发杂陈。如今坐在房中,窗外鸟鸣不绝,清晨的细雨将初夏的燥热拍打在泥土里,空气中只剩下氤氲水汽和清凉微风。终是鼓起勇气开始翻看逝去的时光。
关于Idea
兴趣化执念,执念成夙愿——三年,南墙一直在。
1. 执念。记忆些微有些模糊了,打开BBS的project page,翻到前面几页,倒终是忆起些东西来。去年做完PQE,便开始想投稿的题目。是想做些“有用”的东西的,比如社交媒体情感分析检测潜在抑郁症患者,比如计算传播中研究谣言的扩散,比如帮助文学家进行校正,又或者是图像检测美术作品抄袭……其中包括了social media和digital humanity。两者相较于别的大火的topic,都算小众,但是DH更甚。无论是经费、数据成熟度,还是社会影响力,这仿佛是一个注定就不被看好的方向。很多朋友也曾劝诫“既然DH领域不管是数据还是资金都没有ready,那么你应该选一个能够先让你survive的topic,等几年以后他们ready了,再去研究。”可是所有理智的思考却总是被心中的执念敲散——三年了,一直想做一篇DH的VAST呀……
2. 数据成熟度。终于还是选了DH方向,缩到4个topic。此后便是跟各种domain进行交流,包括张老师、徐老师、康老师、bamboo、彦邦、四维、科科,和竹天。调查发现,其中一个topic数据结构过于简单很难深入挖掘,另一个topic方向会跟既有研究冲突,所以排除。高年级的学长们在brainstorming阶段总是会脑洞大开,印象最深的就是那次跟四维竹天讨论,“不要做纯VAST系统,找点新意出来,比如:既探索又解释(Exploration + Expandability):tell story + make decision相结合”,又或者“用data生成infographic来回答general user的对特定history或者文学的疑问”。虽然的确非常新颖有趣,但是无论是从技术本身还是出发点,都与自己想的有偏差。或许是因为,自己一直没有主导过一个VAST project吧。所以最后还是选择做历史数据已经较为成熟的一个topic。
3. 讲什么样的故事?这个故事有多新?具体idea在巫老师组组会的brainstorming的时候终于有了突破。其中两个角度的评估在于VIS领域是否有人研究过以及是否有意义。很多人(徐科,竹天,潇哥)在初期讨论的时候都给我提供了一条建议——先看想要讲什么故事,再想task。究竟什么问题是有趣的?多变量对官路的影响吗?还是anomaly detection从而进行史料的data cleaning?好像都不尽然。而屈老师提出的三个问题更为有趣也更难解:精英阶层是如何向上流动的?是否存在小团体?不同政治决策者的风格比对是否有所不同?虽然难度更大,但是这三个问题无论是从内容的有趣度还是generalization角度,都值得深入探讨。
4. Task促进idea的凝练。十二月剩下的时间,埋头于社会学paper中,寻找研究重点和motivation理论依据,决定先提炼task来让整个工作更加清楚。当时找到两套分类方式,一套是基于社会学分类的、看起来较为新颖;另一套则是偏向VIS system的三个level的、较为中规中矩。当真正开始归纳和写的时候,才发现其实之前想的东西十分凌乱。进行总结并写下来是一个不错的令idea更加清晰的方法。
5. More specific and interesting. 之后一次又一次与domain和屈老师的讨论则慢慢缩小了我们的研究范围,两个领域学者不同的关注点让我们的研究问题有了更多的探索思路和空间。保持充分的沟通是提取具体任务不可或缺的一个途径。
所以,你看到了吧,迷雾森林中,岔路口总是多的令人犯晕,能够决定我们如何往前走的,有时是我们的执念(“一定要向北走”),有时是现实本身(“有条路被急流斩断了”),但更多时候是来自老师的把关和指引(“指路牌”)。如此,虽磕磕碰碰,满怀担心,但终究,相信也会到达一个promising的终点。
关于Collaboration
跨学科的合作,作为桥梁的我们,必将经历扭曲、炼化和重生。
1. Model and background. 在12月上旬确定好topic以后,原本顺利的进程变得坎坷起来。Domain觉得以前的regression-based的方式对于他们来说并没有进展和突破,希望我们可以用可视化来直接展示信息。远程交流的困难和时间的延迟更加加剧了进展的缓慢。跟科科讨论以后,我决定不再等待回应,而是自己去找社会学的paper和书籍来看。于是,从十二月一直到一月,将近一个月,都在干三件事:找社会学paper/model;清理数据并进行简单探索;找CS领域的related work。其实到后来看了很多paper以后,才知道,大概domain并不是不愿意告知,而是少有模型能够适用在这个数据集。因为很多西方的研究都是基于income和education的,而我们数据中并没有。之后尝试在CS寻找solution,最终找到一个合适的方法得以解决。从中我感受到的一点是,对于跨学科合作而言,solution space往往比别的工作会大很多,因为往往两个领域均有涉及。我们需要用更多的经历去寻找和比较不同的solution,最终得到自己想要的结果。
2. Task confliction.跟domain的交流过程中我们发现了对于task的很多分歧。(1) domain内部的分歧。虽然对于VIS领域而言,这些domain都被称作是“社会科学家”,但是他们各自所关注的重点却不尽相同。有的更关注于这个历史数据集本身的data cleaning,期初希望我们做的是提高数据linkage准确度的事情。有的是计算社会学的专家,更关注宏观的东西;而有的则更倾向于传统历史研究,着重基于案例的考证,更喜欢一步一步narrow down自己研究对象的范围,以避免domain background的突然切换。(2) VIS领域的关注点又与domain有很大不同。社会网络、时序变化等抽象任务是他们更感兴趣的点。而其实社会关系在domain之前研究中几乎未有涉及。一方面是他们可能之前并未关注,另一方面是他们可能很难去对数据进行复杂处理得到相关的信息。而这一点,在之后的expert interview的时候,domain看到demo展示以后对此表示出了极大的兴趣(“potentially very interesting”)。由此,我发现,结合两个领域的不同的focus,其实可以对两个领域都有裨益(新的task/requirement或者更大的solution space都能促进研究)。
3. Push, push, and push.或许是围观了太久体育组的跨领域合作,以至于觉得跟domain的合作将会是双方都是积极且愉快的,但事实可能并非如此。首先,domain可能不清楚他的数据集在你的paper中起到什么作用。是仅仅作为一个case?还是作为主角?其次,他们也很难get到自己能够帮助我们做什么。而当在三月初看到paper draft以后,其实他们才真正明白他们数据的作用,变得积极起来。如今回想起来,早期的时候可能一方面是因为并没有demo可以展示,再者没有paper draft可供参考,再有就是交流沟通不够充分(一封邮件回应周期短则一天长则一周)。所以感觉还是得一方面尽早完成demo,一方面不断push,不断在邮件中解释说明,不要单单等待。
关于Design
“Bar它不香嘛?” – By Jiachen
其实并没有一个人设计过一个完整的VAST系统,以前总嚷嚷着此处自己好像有优势,但真正干起来却无处下手。打开sketch,六七个版本的system design夹杂着各种design option的side view依旧静静地躺在那里,就像一个突降灵感和杂乱思绪的见证者。
1. Novelty. 似乎一开始就进入了一个误区——为了创新而创新——总是绞尽脑汁的去想着怎么在基本可视化中做improvement,却总是很难说出为什么要这么做。似乎一个bar chart就能解决的事,为什么要用复杂的glyph呢?这样的质问被伽臣和业哥贯穿整个系统迭代。其实应该是从简单的图表做起,遇到难以用简单图表解决的才做improvement。
2. Iteration.想起伽臣有一次戏谑的说“原先搞的那个tsne现在连渣都不剩了”……很多设计,有些是因为不合理被抛弃,有些是因为实现的难度超过了任务本身而放弃。以前总想着画完一张精致的设计图再去实现会比较理想,但其实在设计之初,即使前期数据处理对pattern有所探索,但是还是很难确定设计的有效性(是否能找全pattern)。所以一开始使用一些简单设计来对数据进行初步探索,然后根据task逐步加深加难设计,如此绘画式的迭代,从草图到精修,既能保证有最小可发表子集,又可以给予一定的空间进行创新的探究。
Others
1. Writing. 不论是motivation卖点还是case的写作,依旧觉得力不从心。的确,可以模仿之前VAST paper的套路比较顺利的写下来,但是在如何“升华”方面却犯了难。例如introduction的motivation和challenge。即便是自己写出来以后自己读,都觉得不够exciting,不够challenge。可能是自己对工作不够自信,也可能是没有学会如何sell。后来在欣欢的几轮建议下,终于改好了一些,例如motivation尽量跟后面task有对应,再如challenge可以考虑数据本身的复杂情况、考虑算法、考虑系统设计的难度等等。再有比较糟糕的就是case这一块,即便是老师多次提醒“看图说话”,依旧无法很好地做到pattern–图–结论很好地对应起来。段落直接很多地方也缺少承接。这些都是需要再三检查和斟酌的地方。
2. Leadership. 第一次做leader进行项目管理,一切都很生疏。相比于接手任务按部就班去实现,分配和规划则更为困难。前期的时候,所有东西(包括算法和design)都做的很粗糙,心想着到具体实施的时候可以临场调整,因为自己去年也是这么一边开发一边调整的。但事实是,每个执行者的接受度都不一样。作为leader,需要为自己做的每一个决定负责,需要对每一步实现的过程有自己的solution,而不是给一个模糊的design和模糊的task让组员去完成。明确任务的每一步,大到功能模块的任务,小到每个view中每一个component的大小(多少pixel),都需要精确,这样执行者才可以明确执行。此外,还要兼顾队友的情绪,大家都会有失落和暴躁的时候,如何cheer up,如何让整个项目move on,都是作为leader需要handle的。
还有一些话……
1. 快乐和痛苦的交织。我不知道自己是怎么坚持下来的。自我怀疑的时候也开始谩骂,怨自己为什么不聪明点儿选个前辈们踩过坑的方向继续淌着走;但是在真正开始找case的时候又觉得研究的问题是有趣的。打开数据库,看到一条条records,似乎仅仅只是不同的属性值而已。但是当打开wiki去查阅人物的时候,这些records一下子变得鲜活了起来:人物履历、官员政绩、亲友关系……忽然恍惚——在数据库中存储着的一条一条的冰冷的数据,在此刻,变成了一个又一个人物传记——当冰冷的数字变成故事的时候,他变的有血有肉了起来。我看到了宰相刘罗锅揭发和珅贪腐受贿,我看到了林则徐愤而辞官又被请出山虎门销烟,我看到淮军湘军一干民间团派镇压太平天国,我也看到清末各种政治派别风起云涌,政府无能令许多本想一展抱负的有为青年悠悠辞官……其中,有很多事件是无法用现代的career path来解释的,例如父母丧,丁忧停职后又被重新启用等等。这是冰冷数据和鲜活故事的碰撞,也是理性的数据分析和主观的历史故事之间的碰撞。我有时候会感到很无力——两套完全不同的思维经常在打架;有时候又觉得庆幸——理性分析感觉疲乏无助的时候,可以暂时钻进一个个故事中歇一会儿,然后再回来继续。冰与火、天与地、阴与阳,虽然在两极之中周旋常常感到头疼炸裂,但是如若能够找到通信的桥梁,那也将是对两方学者都能够产生裨益的。这,或许就是交叉学科的魅力所在吧。
2. 我的疯帽子们。在面对paper这个red queen的时候,有人陪伴是令人心安的。我很感激有两位指导老师一直陪我一起,义无反顾地支持我自己想做的东西,竭尽所能的给予包括idea、技术、写作等等在内的各种指导,并在每一个我感觉身陷囹圄即将迈入万丈深渊时刻给予的鼓励。此外,又很庆幸,身边有老朋友们在一起讨论,互相嫌弃,互相鼓劲。朋友们俨然分成了两派——批判和嫌弃为主的激进派,鼓励和表扬为主的缓和派,倒也分外和谐。我已经不记得zoom里面record了多少次大小meeting的记录了,也已经不记得耳机那头传来的是欢笑多一些还是叹息和沉默多一些。此刻只记得的是,无论自己有多么糟糕,他们都没有放弃或者背离,一直都在陪着我move on。
此外,别的朋友们也在不同的时期给予了很多帮助。在最最初期的时候,四维、竹天的brainstorming真的可以用脑洞大开来形容,这种“冒险家”似的想象是谨小慎微的我所不敢想象的;二月的时候深陷model无法自救,永远不会忘记宇哲在听我描述以后,竟然半夜十二点直接打电话过来,讨论他的一些想法;乐妮这个姑娘,自己都无法自救,却还是在很多个夜晚听我诉苦,安慰几近崩溃的自己;Taylor在最后一天晚上主动来要paper进行proof reading,在第二天早晨结束的时候还来恭喜完成投稿,叫我take a rest……
我不知道该如何形容自己这次投稿的心情。似乎已经是VIS领域的小弟组老年选手了。而这一次,终于成为了leader。起初,积压在自己心头的愤怒、不甘、太过想成功的心情远远超过了这次投稿本身的训练意义。但是事实是,你不断地在摔跤——你其实什么也不会。焦虑、懊恼、埋怨曾一度笼罩在整个身体中挥之不去。直到听到林萍某一天的对我说:“可是你才二年级啊!”然后释然。哦,是啊,才二年级啊。这些人和事啊,我常常在想,我何德何能,能够结识到这样一群真挚的老师们和伙伴们呀……
以上
2020年5月10日
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-21 19:00
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社