||
2019年7月23日,对我来说,是个值得纪念的日子。清华大学出版社的胡洪涛编辑告诉我,《爱犯错的智能体》样本出来并正式开始预售了。
这是我人生第一本书,也是我写的第一本“科普”书。回想起来,多少觉得这书写得有些不可思议,我记得今年1月校稿的时候就有这种感觉了。为什么会写呢?哪来的时间写呢?怎么写出来的呢?
为什么会写呢?书里的自序讲了一点,我在2006年其实就对人工智能的发展有过一些思考,但当时时机未成熟、学识也不太够,自己又还在事业上升期,无法也没有时间把一眼能看到底的见识攒成书。所以,需要更长时间的积累。
而去年6月,一些偶然的机会,我写的关于生成对抗网的和深度学习的科普性介绍文章获得了较大的关注,也让我感觉到科普还是有些意思的。再加之下半年刚好没有课,时间有了,于是便决定接着之前讨论深度学习不足的文章,继续从视听觉、感觉、知觉、群智等方面来对人工智能,用科普的方式做一个全方位的思考和归纳总结。
说起来容易,可怎么写出来,其实就得好好琢磨了。原因有几个:
一、定位。一本人工智能科普,能有多长的生命力呢?如果是泛泛的科普,只涉及人工智能中的基本概念,也能形成一本书。但这样的话,有可能会舍弃很多前沿、点、不足和对未来潜在的研究方向的讨论。所以,我在这本书的定位上,也尽量从一线科研人员的角度,把前瞻性考虑了进来。从基础知识开始,到人工智能在机器学习、深度学习的进展,再到后面相对高阶的、悬而未决的人工智能问题,以及前沿进展都做了覆盖。不夸张地说,这本书涉及的人工智能知识点从目前来看,应该是比较完整的。我希望再隔十年甚至更久后,读者再翻翻这本科普书时,感觉里面的内容还不至于落后。
二、如何构造全书结构。关于这一点,我心中是有杆秤(有个提纲)的。2018年6月开始写的时候,大致已经知道如何收尾。可是总得一点一点、有逻辑性的循序递进。不过也并不是一直遵守了这个原则。比如有一章讲高维数据中的流形结构,本来是想作高阶内容稍后再讲的。刚好当时碰到国际上有位知名老教授说破解了几百年来数学史上的难题、黎曼猜想的证明。于是便顺便蹭了个热点,写了一篇,除了都是黎曼提出的外,讲的东西完全是两码事,但反响也不错。这大概是在网络上做科普时可以考虑的方式。建议读者感到困难的时候,不妨跳过去,也可以泛泛读读,了解大致的概念即可,如有兴趣再找参考书深入读下。
三、结合实际:做科研的都知道,写文章一定要有证据支持,否则就是纸上谈兵,无法形成可信度。所以,我结合了我们小组在人群计数、流形学习等方面的研究写了一些内容。当然,也不能没数字硬捏些虚假的数字,就像网上经常遇到的疯传的谣言,那都是精确到小数点后三位数,来增强“可信度”的谣言。
四、中国特色:人工智能是1956年左右成为一门学科,名字始于美国达特茅斯学院开的一次会议。可是能否从我国的传统文化中找到与人工智能有关的内容呢?那肯定是有的,毕竟观察是发展智能的最重要手段之一,而这些观察或多或少转化成了文字记载。所以,我在文章中也加了不少中国的古文,以增强这本人工智能科普书的中国特色,如介绍月亮大小错觉时提到了王阳明的《蔽月山房》、介绍声音的鸡尾酒效应时提及的林嗣环的《口技》、还有为了讲述最小信息压缩而描述的《三字经》等等,希望通过这些熟悉的素材来缩小人工智能的距离感。
五、幽默、故事与严谨:科普是需要严谨的,因为出了问题很有可能会被同行笑话,所以很多科学家不愿意做。另外,要做好科普,是需要能有好的故事来支持的,像“牛干巴”一样的虽然是干货,但切下来时会手痛,在科普上不见得能吸引读者。要让读者能轻松愉快地读下去,还能形成粘性阅读习惯,幽默感是需要的,从我的科普书里应该能看到不少。除此以外,这本书也写了不少有趣的故事,有我自己的、也有引经据典的。至于严谨性,当时以博文形式发表的时候,有朋友就笑称,我在拿写SCI一区论文的方式写博文。确实,这样至少能在大尺度上保证逻辑上无漏洞。基于以上几点,似乎这本书也形成了一个不同以往科普书的独特风格,就是故事+幽默+严肃科普。
六、灵光闪现。人的智能较之机器最强悍的一点是灵光一闪,能够跳过很多习惯性思维,直接找到问题的答案。可是,写科普书是个长期积累的过程,要想写得好,每一节的开头结尾都很重要。有的时候真的找不到自认为能激起读者兴趣的开头时,我就会去学校操场跑跑步,因为据说跑步中能产生多巴胺,不仅能让自己心情愉悦,也说不定能刺激灵感的产生。我甚至有过一次,跑步当中想到一个好点子,赶紧把它用手机记录下来的经历。另外,为了能保持安静独立和连续性的思考环境,我在那半年也尽可能拒绝大多数的外出活动。
七、非纯科普。大半年的写一个工作的好处在于,能让人集中精力思考。所以在写的过程中,也有不少对人工智能的个人体会和感悟,如平衡智能、平猫不确定原理、平猫测试等等。这些我都写进了这本科普书中,希望能经得住时间的考验。
现在书出版了,那这本书适用人群有哪些呢?小学生?我觉得大人可以读一些里面的小故事给他/她们听听,看看里面丰富多彩、互动性很强的图画,但不要专门去学,原因以后我会找时间单独写篇文章来解释。初中生高中生能把这本书的开脑部分读读就行了,烧脑部分留点印象即可,勿需深究。大学生?我感觉这书里的素材倒挺适合开门一学期的人工智能通识教育课,也许能激发大学生对人工智能的兴趣。研究生及人工智能相关方向的研究人员,也许能从中找到一些潜在的研究课题。认真读读,有可能会找到一些人工智能里的《九阳真经》,当然如果犯错、理解错了,说不定能读出《九阴真经》来。随便读读地话,不妨把它当成“九阳”豆浆机,也许还能榨点汁出来。另一个可能的适用人群,我觉得是考研面试、想从事人工智能相关研究的学生。如果通读几遍这书,我想应该比看临时抱某些“人工智能的在线课程”的佛脚来得快。至少不至于到研究生面试的时候,问两句“在线课程”的内容,就只能抛两个自己也不太懂的名字那么容易露馅,哈哈。
除了书的内容外,书的制作也是花了不少心思。比如两位编辑胡洪涛和王华用蓝色的矩阵框作为每个大章节的区分线,从侧面就能方便诗者快速找到之前阅读的位置。而封面设计也是花了功夫的,我邀请了美术指导徐腾赫来完成的。因为科普书是需要面向大众的,如果放在书店里,不能一眼吸引读者的注意,有可能就损失掉了不少读者。所以,我就书中的内容和徐做了深入的交流和讨论,最终选定了目前的封面,希望大家能够喜欢。可巧的是,封面的动漫人物有一个很大的步幅姿势,似乎也与我们小组做的步态识别冥冥中有些关系。而不是圆形的脑袋和泄露出来的字符和数字,也仿佛在暗示人类智能体的犯错,不完美。另外,为了能让读者把书拿到手上能有足够的质感,我们也特意选择了有磨砂感觉的环保纸来制作封面。
说到遗憾呢?也还是有的。那就是,其实还有很多没写的,这里面有考虑书厚度方便阅读的原因。我见过一些好的科普书,但因为太厚而让人无法饶有兴趣的读完,这在一定程度上会影响知识的消化和传播,所以在内容的量上做了控制。另我,也还有很多可圈可写的,因为人类和非智能体不是只会犯错,而是犯错促进了智能的发展,正如我书的英文标题所强调的,“Errors favor Intelligent Beings”。所以,如果有时间的话,我还会再写本续集。
最后再次对帮助过支持过这本书的朋友、网络和微信自媒体表示感谢,尤其是科学网,从最初对文章的精选到后来连续20余次的科学网头条,还有混合智能专委会、中国自动化学会等微信公众号,让这本书的网络版内容为不少读者所了解,也因此促成了这本书的面世。
我也希望这本书能够成为一本成功的科普书,因为只有多一些成功的科普,才能吸引更多一线的科研工作者来做科普,形成良性循环,毕竟现在写书尤其是写科普书对科研工作者来说,真的是要靠由衷的热爱和情怀。前两天偶尔看了下某网站上新书榜科普读物的前十名排名,几乎全是国外的书籍,这也说明我国的科普真的是任重而道远,需要大家一起努力,写更多适合中国国情、有中国特色又不失前瞻性、趣味性的科普书,为我国整体科学技术的发展提升、培养更多有良好科学素养和见识的群体做些微薄的贡献。
张军平
2019年8月8日
附《爱犯错的智能体》封面与封底:
延伸阅读:
24. 爱犯错的智能体(二十,完结篇) -- 平衡:机器vs智能?
16. 爱犯错的智能体 --- 听觉篇(二):视听错觉与无限音阶的拓扑
15. 爱犯错的智能体 -- 听觉篇(一):听觉错觉与语音、歌唱的智能分析
14. 爱犯错的智能体 – 视觉篇(十一):主观时间与运动错觉
11. 爱犯错的智能体--视觉篇(八):由粗到细、大范围优先的视觉
张军平,复旦大学计算机科学技术学院,教授、博士生导师,中国自动化学会混合智能专委会副主任。主要研究方向包括人工智能、机器学习、图像处理、生物认证及智能交通。至今发表论文近100篇,其中IEEE Transactions系列18篇,包括IEEE TPAMI, TNNLS, ToC, TITS, TAC等。学术谷歌引用3000余次,ESI高被引一篇,H指数28.
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-12-23 07:36
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社