计算机应用 | 古代文学 | 市场营销 | 生命科学 | 交通物流 | 财务管理 | 历史学 | 毕业 | 哲学 | 政治 | 财税 | 经济 | 金融 | 审计 | 法学 | 护理学 | 国际经济与贸易
计算机软件 | 新闻传播 | 电子商务 | 土木工程 | 临床医学 | 旅游管理 | 建筑学 | 文学 | 化学 | 数学 | 物理 | 地理 | 理工 | 生命 | 文化 | 企业管理 | 电子信息工程
计算机网络 | 语言文学 | 信息安全 | 工程力学 | 工商管理 | 经济管理 | 计算机 | 机电 | 材料 | 医学 | 药学 | 会计 | 硕士 | 法律 | MBA
现当代文学 | 英美文学 | 通讯工程 | 网络工程 | 行政管理 | 公共管理 | 自动化 | 艺术 | 音乐 | 舞蹈 | 美术 | 本科 | 教育 | 英语 |

基于非负矩阵分解方法的笔迹鉴别(1)

2014-07-06 01:06
导读:计算机应用论文论文,基于非负矩阵分解方法的笔迹鉴别(1)在线阅读,教你怎么写,格式什么样,科教论文网提供各种参考范例: 摘 要 笔迹鉴别在模式识别的发展和应用中都有着重要的意义。
摘 要 笔迹鉴别在模式识别的发展和应用中都有着重要的意义。运用非负矩阵分解算法(NMF)对中文单字提取笔迹特征,并利用训练样本和测试样本之间角度的相关性和K近邻算法对笔迹进行分类。结果表明,NMF算法其分类正确率明显高于主分量分析(PCA)方法。这说明了NMF算法在手写笔迹鉴别分析中的潜力。 关键字 笔迹鉴别;非负矩阵分解;K近邻
1 引言 随着信息数字化的飞速发展,手写体笔迹鉴别[4,5]成为计算机视觉和模式识别领域中活跃的研究课题。笔迹是一种相当稳定的行为特征,不同的人有不同的笔迹,且手写笔迹易于获取。基于其种种优点,笔迹鉴别[6,8]广泛的应用于政府部门,金融,法律等领域。文献专家可以鉴别出笔迹的真伪,但计算机自动提取笔迹特征,并鉴别其真伪,特别是对少量的笔迹仍然有一定的难度。 1999年Lee和Seung在Nature上发表了非负矩阵分解算法[1,2]。非负矩阵分解(Non-negative Matrix Factorization)是目前国际上提出的一种新的矩阵分解方法,即NMF是在矩阵中所有元素均为非负数约束条件之下的矩阵分解方法。非负矩阵分解方法提供了一种新的矩阵分解思路:其分解算法实现简便,分解的结果中没有负值,矩阵具有可解释性和明确的物理意义,而且占用的存储空间较少。 本文对每个人书写的少量(如个人签名)笔迹进行鉴别。为了更好的提取笔迹特征,首次引入非负矩阵分解算法,并应用欧氏距离、Cos距离以及K近邻对测试样本进行分类。将分类结果与主成分分析算法得到的结果进行比较,得出结论。2 非负矩阵分解理论 非负矩阵分解[3]问题可描述为:已知一个非负矩阵V,要找出非负的n*r矩阵 W和非负的n*m矩阵H,使 V=WH。由上述可知,非负矩阵分解是用非负性约束来获取数据表示的一种方法。非负性是对矩阵分解非常有效的条件限制,它导致了对于原始数据的基于部分的表示形式,即样本数据只允许加性和非负的组合。算法所得到的非负基向量组 具有一定的线性无关性和稀疏性,从而使得其对原始数据的特征及结构具有相当的表达能力。这使得该算法具有很强的应用背景。 NMF的求解是一个最优化问题,可以用迭代方法求解W和H。NMF 问题的目标函数有很多种,最常用的两种目标函数为KL散度和欧几里德距离。KL散度计算公式如下: (2-1) 其中,,当且仅当A=B 时才等于0。欧几里德距离计算公式如下: (2-2) 其中, ,当且仅当 A=B时才等于0,该问题的求解过程如下: (1)初始化 W、H 矩阵为非负随即矩阵; (2)按公式(2-3)对 W、H 进行迭代运算,其中W 和 H是同步迭代,也就是说,完成 W中的一行更新之后,立即更新 H中相应的列; (2-3) (3)根据公式(2-2)计算V 和WH 之间的散度,如果大于预定订值,返回(2)继续运算;否则停止,运算结束。3 K近邻和Cos距离3.1 k近邻[6] 取未知样本x 的k个近邻,看这k个近邻中多数属于哪一类,就把x 归为哪一类。具体说就是在N个已知样本中,找出 x的k个近邻。设这N个样本中,来自w1 类的样本有N1个,来自 w2类的有N2个,…,来自 wc类的有Nc个,若k1,k2,...,kc分别是k个近邻中属于几类的样本,则我们可以定义判别函数为: (3-1) 决策规则为:若则决策。3.2 Cos距离[3] Cos距离是指向量之间角度的相关相,用公式表示为:
上一篇:城市规划信息资源的共享与服务(1) 下一篇:没有了