||
让机器真正学习
人和动物靠实践探索世界、靠学习认知世界。广义来说,学习是指人与动物在生活过程中凭借经验产生的行为或行为潜能的相对持久的变化。次广义来说,学习是指人类的学习。狭义来说,学习专指学生的学习[1]。人类不仅自己学习,也逐渐让机器替代自己学习。对于人类而言,机器往往能够学习人类所不能够学习的内容。
先下个定义,机器学习(Machine Learning)是一门多领域交叉学科,专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能(参见[2])。机器学习是人工智能(Artificial Intelligence)的一个分支,也是机器实现智能根本途径(图1)。
图1 机器学习所处的地位
如何让机器真正学习?关键在于机器学习算法。掌握基本的机器学习算法,对于理解机器如何学习和智能是非常必要的。有关机器学习书记,国外也出了不少经典书籍。本次推荐一本国内畅销书籍《机器学习》,由南京大学周志华教授编著(图2)。
图2 《机器学习》
全书分为16章,专注于基础理论和技术方法的介绍。从西瓜甜不甜出发,讲述了模型评估与选择、线性模型、决策树、神经网络、支持向量机、贝叶斯分类器、集成学习、聚类、降维与度量学习、特征选择与稀疏学习、计算学习理论、半监督学习、概率图模型、规则学习、强化学习等内容。可以说,里面的理论和方法也是数据挖掘领域的基石。正如作者所说,整本书不可能覆盖机器学习的方方面面,买回来之后,看一遍是不够的,还需要经常翻阅。当然,结合基础理论和技术方法,基于相关的平台(例如Weka、R和Python扩展包等)进行适当的实践操作将会更加有效。
后话
在机器学习领域,掌握基本概念、技术和方法非常重要,也是理解机器学习的关键。尤其是在评估模型和模型选择的时候,选择合适的评估策略和方法至关重要。比较不同模型的性能和准确性时,也要讲究公平性。不能够只用适合于自己方法的评价指标来进行模型比较。如果有意识地学习叫做真正学习,那么机器现在还没能实现真正学习。
参考链接
[1] https://baike.baidu.com/item/%E5%AD%A6%E4%B9%A0/17728119
[2] https://baike.baidu.com/item/%E6%9C%BA%E5%99%A8%E5%AD%A6%E4%B9%A0/217599?fr=aladdin
以往推荐如下:
1. 因果推理综述推荐一篇
2. 生物学家的机器学习指南
3. 基础模型的机遇与风险
4. 一份单细胞数据分析教程
8. 国外知乎:Quora
11. 预印本知多少?
14. mRNA表达无法取代蛋白质表达
15. scIB:单细胞数据融合基准框架
16. 临床医疗维修店铺
18. 怎样做好一项研究?
19. 怎样做开题报告?
20. 深度学习助力单细胞数据分析
21. Any RNA
22. 走进数据科学
23. 直抵自闭症核心
24. 癌症内RNA
25. 一对搭档:计算与生物
26. TF靶标
27. 生物组织内细胞通讯
28. 记一次主题编辑经历
29. 6个,10个,14个......
30. 你健康吗?
31. 你衰老了吗?
32. scIMC:填充单细胞转录组数据缺失值
34. 多组学的基本要素
35. 怎样开展网络数据分析?
36. miRNA组学
37. 走进数据挖掘
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-23 05:27
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社