《Python数据分析与挖掘实战》数据挖掘算法基础-(5)时间序列.pptx

《Python数据分析与挖掘实战》数据挖掘算法基础-(5)时间序列.pptx

  1. 1、本文档共21页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

第5章数据挖掘算法基础;;时间序列是按照时间排序的一组随机变量,它通常是在相等间隔的时间段内依照给定的采样率对某种潜在过程进行观测的结果,是一种动态数据处理的统计方法,主要研究随机数据序列所遵从的统计规律。

常用的时间序列模型:

;时间序列算法;针对一个观察值序列后,首先要对它的白噪声和平稳性进行检验,这两个重要的检验称为序列的预处理。根据检验结果可以将序列分为不同的类型:;平稳时间序列的定义

如果时间序列在某一常数附近波动且波动范围有限,即有常数均值和常数方差,并且延迟期的序列变量的自协方差和自相关系数是相等的或者说延迟期的序列变量之间的影响程度是一样的,则称此序列为平稳序列。;平稳性检验;白噪声检验也称纯随机性检验,一般是构造检验统计量来检验序列的白噪声;常用的检验统计量有Q统计量和LB统计量,计算出统计量后再计算出对应的值,如果值显著大于显著性水平,则表示该序列不能拒绝纯随机的原假设,可以停止对该序列的分析。;自相关系数(ACF)

平稳AR(p)模型的自相关系数呈指数的速度衰减,始终有非零取值,不会在大于某个常数之后就恒等于零,这个性质就是平稳AR(p)模型的自相关系数具有拖尾性。

偏自相关系数(PACF)

对于一个平稳AR(p)模型,求出延迟期自相关系数时,实际上的得到的并不是与之间单纯的相关关系,因为同时还会受到中间个随机变量的影响,所以自相关系数里实际上掺杂了其他变量对与的相关影响,为了单纯地测度对的影响,引进偏自相关系数的概念。

拖尾与截尾

截尾是指时间序列的ACF或PACF在某阶后均为0的性质;

拖尾是ACF或PACF并不在某阶后均为0的性质。;具有结构的模型称为阶自回归模型,简记为AR(p)。即在t时刻的随机变量的取值是前p期的多元线性回归,认为主要是受过去p期的序列值的影响。误差项是当期的随机干扰,为零??值白噪声序列。

平稳AR(p)模型的性质如下表所示:

;具有结构的模型称为q阶移动平均模型,简记为MA(q)。即在t时刻的随机变量的取值是前q期的随机扰动的多元线性函数,误差项是当期的随机干扰,为零均值白噪声序列,是序列的均值。认为主要是受过去q期的误差项的影响。

平稳MA(q)模型的性质如下表所示:

;具有结构的模型称为自回归移动平均模型,简记为ARMA(p,q)。即在t时刻的随机变量的取值是前p期和前q期的多元线性函数,误差项是当期的随机干扰,为零均值白噪声序列。认为主要是受过去p期的序列值和过去q期的误差项的共同影响。特别的,当时,是AR(p)模型;当时,是MA(q)模型。

平稳ARMA(p,q)的性质如下表所示:

;平稳时间序列建模步骤:

;对非平稳时间序列的分析方法可以分为确定性因素分解的时序分析和随机时序分析两大类。

确定性因素分解的方法将所有序列的变化都归结为4个因素(长期趋势、季节变动、循环变动和随机波动)的综合影响,其中长期趋势和季节变动的规律性信息通常比较容易提取,而由随机因素导致的波动则非常难以确定和分析,对随机信息浪费严重,会导致模型拟合精度不够理想。

随机时序分析法的发展就是为了弥补确定性因素分解方法的不足。根据时间序列

您可能关注的文档

文档评论(0)

ning2021 + 关注
实名认证
内容提供者

中医资格证持证人

该用户很懒,什么也没介绍

领域认证该用户于2023年05月10日上传了中医资格证

1亿VIP精品文档

相关文档