基于非负矩阵分解方法的笔迹鉴别(1)
2014-07-06 01:06
导读:计算机应用论文论文,基于非负矩阵分解方法的笔迹鉴别(1)在线阅读,教你怎么写,格式什么样,科教论文网提供各种参考范例:
摘 要 笔迹鉴别在模式识别的发展和应用中都有着重要的意义。
摘 要 笔迹鉴别在模式识别的发展和应用中都有着重要的意义。运用非负矩阵分解算法(NMF)对中文单字提取笔迹特征,并利用训练样本和测试样本之间角度的相关性和K近邻算法对笔迹进行分类。结果表明,NMF算法其分类正确率明显高于主分量分析(PCA)方法。这说明了NMF算法在手写笔迹鉴别分析中的潜力。 关键字 笔迹鉴别;非负矩阵分解;K近邻
1 引言 随着信息数字化的飞速发展,手写体笔迹鉴别[4,5]成为计算机视觉和模式识别领域中活跃的研究课题。笔迹是一种相当稳定的行为特征,不同的人有不同的笔迹,且手写笔迹易于获取。基于其种种优点,笔迹鉴别[6,8]广泛的应用于政府部门,金融,法律等领域。文献专家可以鉴别出笔迹的真伪,但计算机自动提取笔迹特征,并鉴别其真伪,特别是对少量的笔迹仍然有一定的难度。 1999年Lee和Seung在Nature上发表了非负矩阵分解算法[1,2]。非负矩阵分解(Non-negative Matrix Factorization)是目前国际上提出的一种新的矩阵分解方法,即NMF是在矩阵中所有元素均为非负数约束条件之下的矩阵分解方法。非负矩阵分解方法提供了一种新的矩阵分解思路:其分解算法实现简便,分解的结果中没有负值,矩阵具有可解释性和明确的物理意义,而且占用的存储空间较少。 本文对每个人书写的少量(如个人签名)笔迹进行鉴别。为了更好的提取笔迹特征,首次引入非负矩阵分解算法,并应用欧氏距离、Cos距离以及K近邻对测试样本进行分类。将分类结果与主成分分析算法得到的结果进行比较,得出结论。2 非负矩阵分解理论 非负矩阵分解[3]问题可描述为:已知一个非负矩阵V,要找出非负的n*r矩阵 W和非负的n*m矩阵H,使 V=WH。由上述可知,非负矩阵分解是用非负性约束来获取数据表示的一种方法。非负性是对矩阵分解非常有效的条件限制,它导致了对于原始数据的基于部分的表示形式,即样本数据只允许加性和非负的组合。算法所得到的非负基向量组 具有一定的线性无关性和稀疏性,从而使得其对原始数据的特征及结构具有相当的表达能力。这使得该算法具有很强的应用背景。 NMF的求解是一个最优化问题,可以用迭代方法求解W和H。NMF 问题的目标函数有很多种,最常用的两种目标函数为KL散度和欧几里德距离。KL散度计算公式如下:

(2-1) 其中,

,当且仅当A=B 时才等于0。欧几里德距离计算公式如下:

(2-2) 其中,

,当且仅当 A=B时才等于0,该问题的求解过程如下: (1)初始化 W、H 矩阵为非负随即矩阵; (2)按公式(2-3)对 W、H 进行迭代运算,其中W 和 H是同步迭代,也就是说,完成 W中的一行更新之后,立即更新 H中相应的列;

(2-3) (3)根据公式(2-2)计算V 和WH 之间的散度,如果大于预定订值,返回(2)继续运算;否则停止,运算结束。3 K近邻和Cos距离3.1 k近邻[6] 取未知样本x 的k个近邻,看这k个近邻中多数属于哪一类,就把x 归为哪一类。具体说就是在N个已知样本中,找出 x的k个近邻。设这N个样本中,来自w1 类的样本有N1个,来自 w2类的有N2个,…,来自 wc类的有Nc个,若k1,k2,...,kc分别是k个近邻中属于几类的样本,则我们可以定义判别函数为:

(3-1) 决策规则为:若

则决策

。3.2 Cos距离[3] Cos距离是指向量之间角度的相关相,用公式表示为: