求真分享 http://blog.sciencenet.cn/u/zlyang 求真务实

博文

[求助] 时间序列预测里的回归模型“定阶”、“样本容量”的优化方法

已有 3726 次阅读 2021-6-15 18:25 |个人分类:风电功率预测|系统分类:科研笔记

“而我们自己则往往是幼稚可笑的,不了解这一点,就不能得到起码的知识。”

                                       

[求助] 时间序列预测里的回归模型“定阶”、“样本容量”的优化方法

                         

一、模型定阶:预测模型阶数的优化

   一维时间序列 ARMA 模型定阶,有 AIC: Akaike’s information criterion; BIC: Bayesian information criterion; FPE: final prediction error criterion。
   不过网传上面这些方法确定的模型阶数,在常见的时间序列里也不太好用。如:风速、风电功率、电力负荷,等。
   由N个自变量(independent variable)回归出一个函数值(因变量,dependent variable)时,回归模型的输入变量数目怎样优选?

                  

二、样本容量优化:训练预测模型的历史数据数量

   2013年 Khalid 和 Savkin 在《IEEE Transactions on Power Systems》里写明的“Therefore, the optimal number of historical data points for the given data set was chosen based on manual trial-and-error methods. 优化的历史数据样本容量只能人工试探”。
   N个自变量(independent variable)回归出一个函数值(因变量,dependent variable)的模型时,训练该回归模型的历史数据数量(样本容量),现在有没有优化的方法了?

           

三、进一步的说明

   假如使用 M 个输入自变量,这需要 S 组历史数据用于确定“回归模型 F ”:
   矩阵 M × S 个历史数据用作“回归模型 F”的输入,X
   矢量 1 × S 个历史数据用作“回归模型 F ”的输出,Y
     
   以期得到
   Y = F( X )
   的具体公式或结构。

   当自变量X 和函数Y 不同时,共计需要(M + 1 )× S历史数据,才能确定回归模型 F”的一个估计结果。

           

   上面文字里
   一、模型定阶:预测模型阶数的优化
   就是 M 的优选方法。
   二、样本容量优化:训练预测模型的历史数据数量
   就是 S 的优选方法。

                      

参考资料:
[1] Jianqing Fan, Qiwei Yao. Nonlinear Time Series: Nonparametric and Parametric Methods [M]. New York: Springer Science+Business Media, Inc, 2005.
https://fan.princeton.edu/fan/nls.html
[2] Khalid M,Savkin A V.Closure to discussion on “A method for short-term wind power prediction with multiple observation points” [J].IEEE Transactions on Power Systems,2013,28 (2):1898-1899.
https://ieeexplore.ieee.org/document/6496180
[3] Bradley Efron, Trevor Hastie. Computer Age Statistical Inference: Algorithms, Evidence and Data Science [M]. New York: Cambridge University Press, 2016.
https://web.stanford.edu/~hastie/CASI/

相关链接:
[1] 2021-02-05,[笔记] 时间序列预测里的一些“专业术语”
http://blog.sciencenet.cn/blog-107667-1270762.html
[2] 2019-06-08,[学习资料搜集] 时间序列(time series)学习书籍
http://blog.sciencenet.cn/blog-107667-1183775.html
[3] 2021-06-12,[求助] 电力负荷短期预测的经济效益、价值等积极意义
http://blog.sciencenet.cn/blog-107667-1290894.html

                                                                

感谢您的指教!

感谢您指正以上任何错误!

感谢您提供更多的相关资料!



https://blog.sciencenet.cn/blog-107667-1291316.html

上一篇:[讨论] 科学是农业,工程是工业。技术是工农结合
下一篇:最后一堂本科生课(2021春季,北洋园):卡片机Ⅱ傻拍2021(1)
收藏 IP: 202.113.11.*| 热度|

9 郑永军 李宏翰 朱晓刚 陆仲绩 杨学祥 李学宽 许培扬 尤明庆 蔡宁

该博文允许注册用户评论 请点击登录 评论 (11 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-11-21 22:40

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部