论文首页哲学论文经济论文法学论文教育论文文学论文历史论文理学论文工学论文医学论文管理论文艺术论文 |
摘要:应用投影寻踪回归技术,建立了流域年均含沙量的预测模型。用降雨量和年平均径流等4个因子建立的某流域平均含沙量的PPR预测结果的拟合合格率达100%,预留检验样本报准率为75%,表明PPR用于泥沙输移规律的预测研究是可行的。
关键词:流域 输沙量 投影寻踪回归 预测
1 引言
我国是一个水土流失严重的国家。严重的水土流失给工农业生产和国民经济建设造成巨大危害。产沙量是反映水土流失的一个重要指标。而气象要素、地形、土质状况、植被系统及人类活动均对产沙量有重要的影响。国内外不少学者针对不同的地域特征,对流域的产沙机理,泥沙输移规律及其防治对策等进行了大量的研究[1,2],但对诸多因子与产沙量之间的定量研究进行得较少。考虑到引起泥沙流失的诸多因子与产沙量之间的关系具有高维和非线性的特点,而传统的统计预报方法是采用“从某些假定出发,按照一定准则,找出最优拟合”这样一条途径,难以适应千变万化的客观世界,也就无法真正找出数据的内在规律。这种传统的预报方案往往是还原拟合较好,但预留实况检验的精度很差。近20年来,在统计学中提出了一条“审视数据,模拟,预报”称为探索性数据分析(EDA)新途径。本文正是采用基于这种新思路,应用投影寻踪回归技术(PPR),建立流域产沙量的多因子预报模型。
2 PPR原理及算法简介
投影寻踪是国际统计界70年代兴起的高新技术,是应用数学,统计学和计算机技术的交叉学科,属前沿领域。
PP是用来分析和处理高维数据,尤其是来自非正态总体高维数据的一类新兴统计方法[3]。其基本思想是:利用计算机技术把高维数据通过某种组合投影到低维子空间上,寻找出能反映原高维数据或特征的投影,在低维上对数据进行分析,以达到分析研究高维数据的目的。
传统的诸多线性模型通常局限于正态分布,但多数实际问题却不呈线性,因此勉强用线性手段进行辩识和预报,很难取得好的效果。而PP与其它非参数法一样,它可用来解决某些非线性问题。它虽然是以数据线性投影为基础,但它寻找的是线性投影中的非线性。因此,它可用来解决一定程度的非线性问题。PPR模型如下:设И遆=(X1\:\:XP)是一P维随机向量,Y=f(X)是一维随机变量,为了避免线性回归不能反映实际非线性情况的矛盾,PPR采用一系列岭函数的和来逼近回归函数的方法,即
(1)
式中Gm(Z)表示第m个岭函数,Z=()为岭函数的自变量,它是向量
在
方向上的投影,
也为某方向的P维向量,M为岭函数的个数。
Friedman和Stuetzle提出了实现PPR的SMART多重平滑回归技术,SMART模型具有如下形式
И