||
“而我们自己则往往是幼稚可笑的,不了解这一点,就不能得到起码的知识。”
[求助] 时间序列预测里的回归模型“定阶”、“样本容量”的优化方法
一、模型定阶:预测模型阶数的优化
一维时间序列 ARMA 模型定阶,有 AIC: Akaike’s information criterion; BIC: Bayesian information criterion; FPE: final prediction error criterion。
不过网传上面这些方法确定的模型阶数,在常见的时间序列里也不太好用。如:风速、风电功率、电力负荷,等。
由N个自变量(independent variable)回归出一个函数值(因变量,dependent variable)时,回归模型的输入变量数目怎样优选?
二、样本容量优化:训练预测模型的历史数据数量
2013年 Khalid 和 Savkin 在《IEEE Transactions on Power Systems》里写明的“Therefore, the optimal number of historical data points for the given data set was chosen based on manual trial-and-error methods. 优化的历史数据样本容量只能人工试探”。
由N个自变量(independent variable)回归出一个函数值(因变量,dependent variable)的模型时,训练该回归模型的历史数据数量(样本容量),现在有没有优化的方法了?
三、进一步的说明
假如使用 M 个输入自变量,这需要 S 组历史数据用于确定“回归模型 F ”:
矩阵 M × S 个历史数据用作“回归模型 F”的输入,X;
矢量 1 × S 个历史数据用作“回归模型 F ”的输出,Y。
以期得到
Y = F( X )
的具体公式或结构。
当自变量X 和函数Y 不同时,共计需要(M + 1 )× S 个历史数据,才能确定“回归模型 F”的一个估计结果。
上面文字里
一、模型定阶:预测模型阶数的优化
就是 M 的优选方法。
二、样本容量优化:训练预测模型的历史数据数量
就是 S 的优选方法。
参考资料:
[1] Jianqing Fan, Qiwei Yao. Nonlinear Time Series: Nonparametric and Parametric Methods [M]. New York: Springer Science+Business Media, Inc, 2005.
https://fan.princeton.edu/fan/nls.html
[2] Khalid M,Savkin A V.Closure to discussion on “A method for short-term wind power prediction with multiple observation points” [J].IEEE Transactions on Power Systems,2013,28 (2):1898-1899.
https://ieeexplore.ieee.org/document/6496180
[3] Bradley Efron, Trevor Hastie. Computer Age Statistical Inference: Algorithms, Evidence and Data Science [M]. New York: Cambridge University Press, 2016.
https://web.stanford.edu/~hastie/CASI/
相关链接:
[1] 2021-02-05,[笔记] 时间序列预测里的一些“专业术语”
http://blog.sciencenet.cn/blog-107667-1270762.html
[2] 2019-06-08,[学习资料搜集] 时间序列(time series)学习书籍
http://blog.sciencenet.cn/blog-107667-1183775.html
[3] 2021-06-12,[求助] 电力负荷短期预测的经济效益、价值等积极意义
http://blog.sciencenet.cn/blog-107667-1290894.html
感谢您的指教!
感谢您指正以上任何错误!
感谢您提供更多的相关资料!
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-21 22:40
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社