科学网

 找回密码
  注册
机器学习笔试总结一
郗强 2018-3-27 19:13
1、机器学习分类评估指标 准确率是检索出相关文档数与检索出的文档总数的比率,衡量的是检索系统的查准率; 召回率是指检索出的相关文档数和文档库中所有的相关文档数的比率,衡量的是检索系统的查全率; 为了解决准确率和召回率冲突问 ...
个人分类: 机器学习|1669 次阅读|没有评论
机器学习之决策树
郗强 2018-3-12 19:48
决策树学习的三个步骤:特征选择、决策树的生成和决策树的修剪。其本质上是从训练数据集中归纳出一组分类规则。决策树算法通常是一个递归地选择最优特征,并根据该特征对训练数据进行分割,使得各个子集由一个最好的分类结果,这一过程对应着对特征空间的划分,也对应着决策树的构建。开始将所 ...
个人分类: 机器学习|2068 次阅读|没有评论
机器学习之SVM
郗强 2018-3-12 11:28
尝试找到一条直线,能够把二元数据隔离开。放到三维空间或者更高维的空间,尝试找到一个超平面,能够把所有的二元类别隔离开。这么多的可以分类的超平面,哪个是最好的呢?或者说哪个是泛化能力最强的呢? 感知机原理:让所有误分类的到超平面的距离最小。 SVM几个概念: 在分离超 ...
个人分类: 机器学习|2067 次阅读|没有评论
机器学习之logistic
郗强 2018-3-12 10:08
原理:二项logistic回归模型是由条件概率分布P(X|Y)表示,形式为参数化的logistic分布(实际上是一个sigmoid函数)。通过监督学习的方式来估计模型参数。然后比较两个条件概率的大小,将样本分到概率值较大的那一类。 logistic模型的特点:一个事件的几率是指该事件发生的概率与该事件不发生概率的比值,如果时间 ...
个人分类: 机器学习|1505 次阅读|没有评论
机器学习之朴素贝叶斯
郗强 2018-3-12 09:30
原理:对于给出的待分类项,求解在此项出现的条件下各个类别的概率,哪个最大就认为此项为哪个类别。 关键点:统计得到个类别下各个特征属性的条件概率。 重要假设:所有特征属性相互独立。 算法设计过程: 确定特征属性; 获取训练样本; 对每个类 ...
个人分类: 机器学习|1852 次阅读|没有评论

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-18 23:41

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部