
石自强 2016-1-15 09:10
为了方便重现我们 ECML2015 论文中提出的高速的 PROXTONE 优化方法,在这里公开我们的优化代码。 PROXTONE 可以用于优化两个凸函数的和:其中一是大量光滑凸函数的平均,另一是作为惩罚项或正则项的非光滑凸函数。 PROXTONE 通过结合目标函数的二阶信息( secondorder information )获得了更强收敛结果。在此 ...
个人分类: 论文写作|3428 次阅读|没有评论
Some practical formulas for deep neural networks
热度 1 石自强 2014-12-12 14:42
学数学的人都会有不同程度的强迫症,很多东西只有自己推导过一遍之后才会相信,才会去用。 Here are some formulas collected and derived for training neural networks。 具体内容请查看附件。 neural_networks.pdf
个人分类: 论文写作|2129 次阅读|1 个评论 热度 1
石自强 2014-8-22 10:52
1. Since gradient may be the computationally most intensive operation, for fair comparison, we compare SGD to SVRG based on the number of gradient computations. 2. For simplicity we will only consider the case that each... 3. When the number of components n is very large, each iterat ...
个人分类: 论文写作|3002 次阅读|没有评论

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-5-16 16:17

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社
