|||
计算
我们知道计算机不会思考,只能做些僵化死板不需要任何灵活性的工作,比如加减乘除的计算。当然它的工作不限于我们通常理解的计算。比如可以将一列数进行排序,3,7,4,20,6,从大到小排序。计算机将这列数扫描一遍,取出最大的数,将其放在首位。再将剩下的数扫描一次,再取出最大的数。重复多次,排序就完成了。这里说的就是一种排序算法。
什么是计算,有严格的定义,这里不展开讨论。总之,大概意思是按照某种明确的程序进行操作,不需要任何灵活性。凡是这样的工作,计算机都可以做。
学习
人工智能自60年前提出以来,突飞猛进。机器学习是人工智能中最重要的领域。计算机能学会各种各样的概念,比如什么是猫,什么是狗,什么是奔跑,什么是跳跃。
和小孩子一样,给一些水果它看,告诉它只是梨子,这是香蕉,这是苹果,见多了它就懂了。我们不用告诉它苹果有什么特征,梨子有什么特征,它自己会总结出来。
计算机不会思考,那它是如何学习的呢?它的学习本质上也是一种计算。
学习就是计算
举例子说明。现在让机器学会判断什么是好的西瓜,什么是坏的西瓜。
西瓜有各种不同的颜色,青绿、浅白、乌黑等。根蒂也分不同的情况,有的硬挺,有的蜷缩,有的稍蜷。敲声有的清脆,有的浑浊,有的沉闷。
假设西瓜的好坏完全由色泽、根蒂和敲声这三个属性确定。现在有四个西瓜。
编号 色泽 根蒂 敲声 西瓜
1 青绿 蜷缩 浑浊 是
2 乌黑 蜷缩 浑浊 是
3 青绿 硬挺 清脆 否
4 乌黑 稍蜷 沉闷 否
将这些数据输入电脑,让它自动学会区分好瓜坏瓜。现在来了一个新的西瓜,色泽青绿,根蒂蜷缩,敲声浑浊,计算机马上判断这是一个好瓜,因为它已经见过一模一样的瓜了。如果出现一个没见过的情况呢,比如颜色浅白的瓜敲声浑浊的瓜,这是好瓜还是坏瓜呢?
这里西瓜包括三种属性,色泽、根蒂和敲声。每种属性可以取不同的值。所以可以把好瓜坏瓜这些概念看做一个三元函数f(x,y,z)。x可以取青绿乌黑浅白三种值的一种,y取蜷缩稍蜷硬挺三种值的一种,z也类似。好瓜则函数值是1,坏瓜则函数值为0。比如f(青绿, 蜷缩, 浑浊)=1,f(乌黑,稍蜷,沉闷)=0。这个函数实际上是个分类函数,将不同的数据进行分类。
机器学习的任务就是求出函数f,使得它的变量取任意值时,都可以计算出f的值。
如何从有限的数据得到一个普遍的函数,使其能应用到各种各样的数据呢?有各种各样不同的算法解决这个问题。当输入数据时,计算机运行某种学习算法,就是机器学习的过程。
不同的算法有时求得的函数是不一样的,所以将学得的概念应用于新情况的时候,有时得到的结论不正确。所以计算机也会出错。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-23 12:52
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社