dingsir的个人博客分享 http://blog.sciencenet.cn/u/dingsir

博文

命令直通车的巧妙利用 | 过度拟合与如何避免

已有 3909 次阅读 2020-7-27 11:22 |个人分类:软件杂谈|系统分类:教学心得| 过度拟合, 命令直通车

命令直通车的巧妙利用

为了修改Typora中的字体颜色,经常需要输入<span style=color:red></span> 这样的短代码,再在标签中插入要突出显示的文字. 每次打这么多就为了给它染个色, 麻烦也哉! 作为一个懒人, 我们怎么能快速一点呢? Typora没有,我们就不能变通一下用输入法来实现么?我的输入法是是用多多输入法生成器编译得到的五笔输入法,支持自定义编码和命令直通车.

用自定义编码的来输出这种字串, 开始有一点不完美,我想到的是,输入span编码,出来<span style=color:></span>, 这个没问题,只要先输入这些编码,再Ctrl + "="调出造词界面,指定编码是span就可. 但不完美之处在于,光标定位在标签</span>后面, 接下来输入文字之前,还需要用鼠标或光标移动到</span>标签之前, 还是有点麻烦.

能不能继续改进呢? 我想到命令直通车中还有一个模拟按钮的功能, 使用特殊的keyboard命令,例如

vkc  $$ddcmd(keyboard(<67+ctrl>),复制)

前面的vkc为编码,后面是特殊命令,$$ddcmd是多多命令的前缀, 指令为模拟按下Ctrl键和键值为67的键(即C键, C的ASCII值为十进制67). 如果输入法中设定了这样一个编码, 则输入vkc回车之后,相当于执行按下Ctrl+C.上文的复制为界面上的提示文字.

keyboard命令还可以与输入的字符串嵌套,这样我们就可以写出这样的编码:

span $ddcmd(<span\sstyle=color:#D0D0D0>DxhSay:</span>keyboard(<37><37><37><37><37><37><37>),span扩展)

上述内容中,从左边开始看, 为<span>标签; \s为输入法自动处理的转义, 表示空格;  color后面跟的是表示颜色的字符串,每两位依次表示RGB值; </span> 后面接着是特殊键盘操作, 7个连用的<37>表示按下左箭头(键值为37) 7次,使光标跳到指定位置DxSay:后面.

只要输入span这个编码,就可以生成一长串上述字符,光标自动跳到要输入的位置. 效果满意.


过度拟合与如何避免

以前在使用Excel进行多项式拟合时,我发现如果使用4次多项式,多数都能达到非常好的拟合效果.但是直觉告诉我,这种拟合曲线并不能很好的预测数据集之外的问题.

今天在阅读《模型思维》一书,读到一些相关的信息:

...模型中包含的参数越多, 就越能够很好地拟合数据.同时也越有可能过度拟合.好的拟合不一定意味着好的模型。

...冯·诺伊曼曾经说过,有4个参数,就可以拟合一头大象;有5个参数,就可以让大象摆动它的大鼻子了.

...用于"摆动大象鼻子"的估计量通常包括了更高阶的量:平方、立方,甚至四次方。高阶项的存在会带来大误差的风险,因为高阶项有很强的放大效果。10只是5的两倍,但是104 却是 的54的16倍.

...因此,由于存在过度拟合,这个模型出现了巨大的样本外误差.

为了避免过度拟合,可以避免使用高阶项.不过,一种更巧妙的解决方法是,可以采取自举聚合法(bootstrap aggregating)或装袋法(bagging)来构建模型...

看来担心过度拟合并不是多余的.但具体的还可以再学习研究下.



https://blog.sciencenet.cn/blog-1213210-1243789.html

上一篇:学习笔记: Python解析XML
下一篇:学习笔记: 用XLST将XML转换到XML表格或Excel文件
收藏 IP: 36.27.72.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2025-1-10 20:41

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部