机组耗水率影响因素的回归分析.docVIP

  1. 1、本文档共14页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
.. word教育资料 机组耗水率影响因素的回归分析 摘 要 数理统计是具有广泛应用的数学分支,在生产过程和科学实验中,总会遇到多个变量,同一过程中的这些变量往往是相互依赖,相互制约的,也就是说他们之间存在相互关系,这种相互关系可以分为确定性关系和相关关系。变量之间的确定性关系和相关关系在一定条件下是可以相互转换的。本来具有函数关系的变量,当存在试验误差时,其函数关系往往以相关的形式表现出来相关关系虽然是不确定的,却是一种统计关系,在大量的观察下,往往会呈现出一定的规律性,这种函数称为回归函数或回归方程[1]。回归分析是一种处理变量之间相关关系最常用的统计方法,用它可以寻找隐藏在随机后面的统计规律。确定回归方程,检验回归方程的可信度等是回归分析的主要内容。按回归模型类型可划分为线性回归分析和非线性回归分析。 本文运用多元线性回归分析方法建立耗水率与出库流量、库水位的模型。首先收集数据并利用MATLAB软件[2]进行数据处理,作出散点图。分析图发现耗水率与出库流量、库水位有明显的线性关系。在此基础上假设并建立模型。对回归参数做点估计及区间估计,并作出显著性检验,发现显著效果良好,然后利用残差图[3]检验回归效果,发现异常点,进而改进模型,最后利用回归方程做点预测和区间预测。 关键词:相互关系;多元线性回归分析;线性回归方程;显著性检测 目录 TOC \o "1-3" \h \u 17248 1 设计目的 1 26115 2 设计原理 1 6949 2.1 线性回归方程的建立 1 21644 2.2 参数估计 1 19996 2.3 回归模型的假设检验 2 8077 2.4 回归系数的假设检验和区间估计 3 8840 2.5 利用回归模型进行预测 3 24222 3 设计题目 3 6777 4 实现过程 4 6399 4.1 回归方程的确立 4 16346 4.2 回归方程显著性检验 6 31219 4.3 模型改进 7 15836 4.4 回归预测 8 24823 5 设计总结 11 6861 参考文献 12 word教育资料 1 设计目的 为了进一步理解概率论与数理统计的基本概念、理论和方法,基本掌握MATLAB等具有统计分析功能软件的使用,并具备初步的运用计算机完成数据处理的技能,实现理论与实践的结合。 2 设计原理 2.1 线性回归方程的建立 设Y是一个可观测的随机变量,受到P(P>0)个非随机变量因素和随机因素的影响若Y与有如下线性关系: 其中是固定的未知参数,称为回归系数,服从,Y称为被解释变量,模型(2.1.1)称为多元线性回归模型[4]。 已知 n 个独立观测数据应满足下式 其中相互独立,且设,记 2.2 参数估计 对模型中参数,使用最小二乘法进行估计,即应选取估计值,使当时,误差平方和 达到最小。为此,令 整理得 整理化为正规方程组的矩阵形式 当矩阵 X 列满秩时, 为可逆方阵,上式的解为 将代回原模型得到 y 的估计值 而这组数据的拟合值为,拟合误差 称为残差,可作为随机误差ε的估计,而残差平方和(或剩余平方和)为 2.3 回归模型的假设检验 检验因变量与自变量 之间是否存在线性关系。显然,如果所有的都很小,与 的线性关系就不明显,所以可令原假设为 当成立时由回归平方和U和残差平方和Q 满足 在显著性水平α下有上α分位数, ,若 接受 ;否则,拒绝。 2.4 回归系数的假设检验和区间估计 当上面的 被拒绝时,不全为零,但是不排除其中若干个等于零。所以应进一步作如下 m+1个检验 : 若假设成立 对给定的,若,接受;否则,拒绝。 对作区间估计,在置信水平1?α下,的置信区间为 其中。 2.5 利用回归模型进行预测 当回归模型和系数通过检验后,可由给定的 预测, 是随机的,显然其预测值(点估计)为 给定可以算出的预测区间(区间估计),结果较复杂,但当 n 较大且 x0i 接近平均值xi 时,y0 的预测区间可简化为 其中是标准正态分布的上分位数。对y0 的区间估计方法可用于给出已知数据残差 的置信区间,ei 服从均值为零的正态分布,所以若某个 ei 的置信区间不包含零点,则认为这个数据是异常的,可予以剔除。 3 设计题目 本文选用葛洲坝机组发电耗水率数据进行分析得到其主要影响因素为库水位,出库流量。数据如表3.1所示,利用多元线性回归分析方法建立耗水率与

文档评论(0)

hmwn621 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档