流域年均含沙量的PP回归预测(1)
2014-03-09 01:03
导读:计算机应用论文论文,流域年均含沙量的PP回归预测(1)在线阅读,教你怎么写,格式什么样,科教论文网提供各种参考范例:
摘要: 应用 投影寻踪回归技术,建立了流域年均含沙量的预测
摘要: 应用 投影寻踪回归技术,建立了流域年均含沙量的预测模型。用降雨量和年平均径流等4个因子建立的某流域平均含沙量的ppr预测结果的拟合合格率达100%,预留检验样本报准率为75%,表明ppr用于泥沙输移 规律 的预测 研究 是可行的。
关键词: 流域 输沙量 投影寻踪回归 预测 1 引言 我国是一个水土流失严重的国家。严重的水土流失给工农业生产和国民 经济 建设造成巨大危害。产沙量是反映水土流失的一个重要指标。而气象要素、地形、土质状况、植被系统及人类活动均对产沙量有重要的 影响 。国内外不少学者针对不同的地域特征,对流域的产沙机理,泥沙输移规律及其防治对策等进行了大量的研究 [1 , 2] ,但对诸多因子与产沙量之间的定量研究进行得较少。考虑到引起泥沙流失的诸多因子与产沙量之间的关系具有高维和非线性的特点,而传统的统计预报 方法 是采用“从某些假定出发,按照一定准则,找出最优拟合”这样一条途径,难以适应千变万化的客观世界,也就无法真正找出数据的内在规律。这种传统的预报方案往往是还原拟合较好,但预留实况检验的精度很差。近 20 年来,在
统计学中提出了一条“审视数据,模拟,预报”称为探索性数据 分析 (eda) 新途径。本文正是采用基于这种新思路,应用投影寻踪回归技术 (ppr) ,建立流域产沙量的多因子预报模型。 2 ppr 原理及算法简介 投影寻踪是国际统计界 70 年代兴起的高新技术,是应用
数学,统计学和 计算 机技术的交叉学科,属前沿领域。 pp 是用来分析和处理高维数据,尤其是来自非正态总体高维数据的一类新兴统计方法 [3] 。其基本思想是:利用
计算机技术把高维数据通过某种组合投影到低维子空间上,寻找出能反映原高维数据 结构 或特征的投影,在低维上对数据 结构 进行分析,以达到分析研究高维数据的目的。 传统的诸多线性模型通常局限于正态分布,但多数实际 问题 却不呈线性,因此勉强用线性手段进行辩识和预报,很难取得好的效果。而 pp 与其它非参数法一样,它可用来解决某些非线性问题。它虽然是以数据线性投影为基础,但它寻找的是线性投影中的非线性 结构 。因此,它可用来解决一定程度的非线性问题。 ppr 模型如下:设И x=(x1::xp) 是一 p 维随机向量, y=f(x) 是一维随机变量,为了避免线性回归不能反映实际非线性情况的矛盾, ppr 采用一系列岭函数的和来逼近回归函数的方法,即
(1)
式中 gm(z) 表示第 m 个岭函数, z=(

) 为岭函数的自变量,它是向量

在

方向上的投影,

也为某方向的 p 维向量, m 为岭函数的个数。 friedman 和 stuetzle 提出了实现 ppr 的 smart 多重平滑回归技术, smart 模型具有如下形式
И
(2)
它实际上是采用分层分组迭代交替优化方法对式 (2) 中的参数Е粒β, mu 和岭函数 gm 寻优。实现步骤为 ①给定一个初始模型; ②把数据投影到一个低维空间上,找出数据与现有模型相差最大的投影,这就表明在这个投影中含有现有模型中没有反映的 结构 ; ③把上述投影中所包含的 结构 并到现有模型上,得到改进了的新模型 ; ④再从这个新模型出发,重复以上步骤,直到数据与模型在任何投影空间都没有明显的差别为止。 模型的关键是最终估计出式 (1) 的参数:岭函数最优化项数 mu, 岭函数 gm ,系数α jm , β m 。其判别准则仍是:选择适当的参数组合,使式