计算机应用 | 古代文学 | 市场营销 | 生命科学 | 交通物流 | 财务管理 | 历史学 | 毕业 | 哲学 | 政治 | 财税 | 经济 | 金融 | 审计 | 法学 | 护理学 | 国际经济与贸易
计算机软件 | 新闻传播 | 电子商务 | 土木工程 | 临床医学 | 旅游管理 | 建筑学 | 文学 | 化学 | 数学 | 物理 | 地理 | 理工 | 生命 | 文化 | 企业管理 | 电子信息工程
计算机网络 | 语言文学 | 信息安全 | 工程力学 | 工商管理 | 经济管理 | 计算机 | 机电 | 材料 | 医学 | 药学 | 会计 | 硕士 | 法律 | MBA
现当代文学 | 英美文学 | 通讯工程 | 网络工程 | 行政管理 | 公共管理 | 自动化 | 艺术 | 音乐 | 舞蹈 | 美术 | 本科 | 教育 | 英语 |

基于SVM的信息融合新方法(1)

2014-08-01 02:11
导读:计算机应用论文论文,基于SVM的信息融合新方法(1)论文样本,在线游览或下载,科教论文网海量论文供你参考:摘要:利用SVM对大规模数据进行训练时,需要占用很大的内存空间,甚至会因内
摘要:利用SVM对大规模数据进行训练时,需要占用很大的内存空间,甚至会因内存不够而无法训练。为此,提出了将大规模数据分块求解,然后将分块求解的结果进行信息融合的新方法。首先训练得到各模块的支持向量,将所有支持向量进行融合,得到决策模型和一组支持向量。当有新的数据加入时,将其作为一个子模块,训练得到该模块的支持向量,与原模型中获得的支持向量进行融合,训练得到新的决策模型。利用KDD CUP99数据进行实验,结果表明该方法的测试精度与在所有数据集上训练的精度相当,花费时间少,适用于增量学习。
  关键词:支持向量机; 信息融合; 增量学习
  
  SVM[1,2]是最近发展起来的一种分类方法。它基于统计学习理论,根据结构风险最小化原则,在经验风险和模型的复杂度之间折中,有较强的泛化能力,且具有全局最优、与维数无关等特性。当数据线性不可分时,通过核函数,将数据映射到高维特征空间,使得数据线性可分。它本质上是一个凸二次规划问题,当训练规模很大时,求解此最优化问题要占用很大的内存空间,会因内存空间不够而导致无法训练。解决此类问题的有效方法是将大规模数据进行分块,然后将各模块的信息进行融合,从而得到最终结果。
  信息融合[3]又称数据融合,是利用计算机技术对获得的若干节点的观测信息在一定准则下加以自动分析、综合以完成所需的决策和估计任务而进行的信息处理过程。文献[4]提出了用神经网络的方法来实现信息融合,在预测精度上获得较好的效果。SVM是继神经网络后,分类性能较好的一种技术。它在信息融合领域也逐渐得到应用,文献[5~7]提出了多种基于SVM的信息融合方法,用各模块训练得到的模型对测试集进行判别,然后融合各模型的判别结果。但这些方法不适合增量学习。当有新的数据源加入时,融合模块需重新执行。

中国大学排名


  
  决策输出融合方法和投票数融合方法用各模块训练得到的分类器对测试集进行判别,再根据判别结果进行融合,分类精度上不如后两种方法,所花费的时间也较多。而且这两种方法在增量学习中要对信息融合模块重新处理,不能有效利用已有的信息。
  对支持向量直接融合的方法在精度、漏报率和误报率上均与在所有数据集上得到的结果相接近。说明在分类中起作用的只是其中占少数的支持向量,如表3所示。每个模块得到的支持向量是很少的,大约占0.6%。所以信息融合模块的规模相对较小,花费时间少。本文提出的方法预测精度甚至超过了对所有支持向量融合的结果,与在所有数据集上得到的结果最接近。说明本文方法在增量式学习中是有效的,具有较好的泛化能力。
  
共2页: 1 [2] 下一页 论文出处(作者):
基于PI-演算的网上并联审批业务流程建模及验证
应用于海量存储中高度容错的新编码方案
    上一篇:一个有效的电子选举方案(1) 下一篇:没有了