|
从事科学研究20余年, 年纪渐大,有时禁不住要回忆以往。 想当初刚刚博士毕业,意气风发, 豪情满怀, 放眼四周, 青山绿水。 即使偶遇冰霜飓风, 也总是相信世界本质上还是好的。 即使世界有时表现的不那么好, 也总是相信,那只是暂时状态。 那些不好的状态, 终究会被人们变革掉。 基于这种素朴的生活信念,进入了机器学习研究领域。 据此,对于机器学习系统的一个基本假设就是: 一个理想的机器学习系统,其最坏的状态不应该是该系统的稳定状态。多么幸运,这个假设确实可以用来研究软聚类算法的参数选择问题, 得到的相关研究结果已经在TPAMI、CVPR 等期刊会议上发表。
时间飞逝, 转眼中年, 多经世事。当头上的黑发开始脱落,身材开始走形,才明白:改变外在的自己有时很容易,甚至不需要自己努力。改变内在的自己却是很难很难,即使付出许多汗水也未必能够做到。本质上,使自己变好一些,真的很难很难。如果只满足于对状态换个标签或者名字,有时就没有那么难。世上这类事情太多太多,生活中比比皆是,比如:将蛇称为龙,猫称为虎,鸡称为凤,白水称为琼浆,樱桃称为车厘子,等等。 因此,只希望名实相符,好就是好,坏就是坏。 由此研究机器学习, 基本的假设即为: 一个理想的机器学习系统应该归哪类,像哪类;像哪类,归哪类。 据此,得出了机器学习的公理体系,统一了学习算法的设计准则,在清华大学出版社印行了一本学术
专著《机器学习:从公理到算法》。
时间从来不为任何人停留。 而今,身不由己, 踏上了知天命之年的快车道。生活中有太多的无奈。画家齐白石曾经说过,“作画妙在似与不似之间,太似为媚俗,不似为欺世”。年青时以为他说的就是作画,如今才明白,这岂止于作画。人在江湖,要做到像机器一样有一是一、有二是二,对于我这样一个俗人,几乎不可能。 机器毕竟是机器,既不考虑尊严和脸面,也不担忧生命和生活。终于明白人和机器毕竟不同, 在生活中努力随遇而安。 到什么山上唱什么歌,见什么人说什么话,这境界超出能力,只能向往。
可生活毕竟是生活,从来也不曾因人无能就放行。赶鸭子上架也罢,按牛头喝水也罢, 有时也不得不在现实中说一套、做一套、想一套。虽然这样的事情不多,却严重冲击个人三观,让人身心撕裂,有时甚至痛不欲生。正是这些让人十分难堪的经历,使自己不得不反思,怎么会把事情搞成这样?
反思之后,有两点发现。 第一点发现是: 个人的修养水平远远不足。具体说来,就是做事手段不行、说话方式不好、思想目的不纯。在一把年纪的时候发现这些,想不尴尬也难。应该说,这些毛病曾经为自己和他人带来了很多的不快,未来也很难说就一定能够避免,为此希望各位新雨旧知能够原谅作为庸人的我,同时恳切期望各位新朋好友在我荒唐的时候能够及时给予批评帮助,使我不断提高个人修养。第二点发现是,语言、事实与心智三者可以各自自成一界,虽然彼此关联却存在各自独立的计算法则。在通常情形下,语言、事实与心智三者彼此之间存在明确而具体的依赖路径;可是也不排除在一些特殊条件下,这三者之间可以弱化、甚至忽略彼此的关联关系。 这些发现提供了本书写作的初始动力。
无庸讳言,维特根斯坦也是本书的源头之一。在《逻辑哲学论》里,维特根斯坦曾经言称:“凡是能够说的事情, 都能够说清楚,而凡是不能说的事情, 就应该沉默”。到了《哲学研究》中,维特根斯坦却写下了如下话语:“我本来是乐于创作出一本好书的。结果事与愿违,但是,我能改进它的时间已经过去”。天才如维特根斯坦,临终时也不得不承认,可以说的事情未必可以说清楚。因此本书并没有过高的期待, 只有一个简单的希望:如果思考过这一个问题的人依然觉得有趣,那么本书就算没有白白浪费所消耗的资源,包括读者的宝贵时间、印刷的精美纸张和编辑的认真校对;如果没有思考过这一个问题的人也能从中受益,由于本书中将以可计算的方式论述每个人所感知的词的字面语义、内在语义与外在语义并不一定一致,那么就此恭喜作者的写作水平在停滞多年之后终于有了些许提高,总算爬出了茶壶里煮饺子这一个令人郁闷至极的泥潭。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-12-23 02:30
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社