计算机应用 | 古代文学 | 市场营销 | 生命科学 | 交通物流 | 财务管理 | 历史学 | 毕业 | 哲学 | 政治 | 财税 | 经济 | 金融 | 审计 | 法学 | 护理学 | 国际经济与贸易
计算机软件 | 新闻传播 | 电子商务 | 土木工程 | 临床医学 | 旅游管理 | 建筑学 | 文学 | 化学 | 数学 | 物理 | 地理 | 理工 | 生命 | 文化 | 企业管理 | 电子信息工程
计算机网络 | 语言文学 | 信息安全 | 工程力学 | 工商管理 | 经济管理 | 计算机 | 机电 | 材料 | 医学 | 药学 | 会计 | 硕士 | 法律 | MBA
现当代文学 | 英美文学 | 通讯工程 | 网络工程 | 行政管理 | 公共管理 | 自动化 | 艺术 | 音乐 | 舞蹈 | 美术 | 本科 | 教育 | 英语 |

基于字形特征的手写体汉字字库的构建VC++

2016-09-01 01:03
导读:计算机应用论文论文,基于字形特征的手写体汉字字库的构建VC++应该怎么写,有什么格式要求,科教论文网提供的这篇文章是一个很好的范例:毕业
毕业

基于字形特征的手写体汉字字库的构建
 

摘要: 良好的脱机手写体汉字样本库,是进行脱机手写体汉字识别研究的必要条件。脱机手写体汉字识别研究对汉字信息处理自动化,对开拓新1代计算机的智能输入有重要意义。本文对脱机手写体汉字字库进行了探讨研究。
首先,本文介绍了字库的1些相关知识,然后介绍了制作手写体汉字字库的原理及方法,同时给出了该方法的实现过程,并利用C++语言对主要过程算法作描述,相关程序均在Visual C++集成开发环境下编译通过。
本文提出并实现了基于字形特征的手写体汉字字库的构建方法:先将在纸上书写出的字符扫描成图像文件,然后对整幅的字符图像进行分割,将其分割成1个个的字符,再对图像进行1系列的预处理,接着抽取图像特征,写入文件。由于图像预处理技术在手写体字库制作过程中占有重要地位,文中特别研究了汉字图像预处理的几个算法,并对它们进行了比较分析,选出最适合的算法,为汉字字库后续制作打下坚实的基础。

关键词:手写体汉字;汉字字库;脱机识别;汉字字库制作


Establishment of Handwritten Chinese Character Library on Account of Feature of Characters’ Shape
 

Abstract:The sample collection is necessary for the research on the handwritten Chinese character recognition. This paper does research on the off-line handwritten Chinese character recognition, which is important to the Chinese character information processing automation and new generation of intelligent computer input.
First, this paper introduces some information in making character library, then introduces the principle and design Chinese character library. Also this article presents the procedure applied, which is described with       C ++ language and the relative program can be compiled under Visual C++ integrated development environment. 

您可以访问中国科教评价网(www.NsEac.com)查看更多相关的文章。


This dissertation brings forward and realizes one method of establishment of handwritten Chinese character library on account of feature of characters’ shape: first, scan the characters wrote on paper to the image file, then break up the whole piece of characters image to solo character, and do some feature extraction. After this, pick up the feature of the image and write in file supervened. Because the processing technology of Chinese characters images plays an important role in making handwritten character library. Here especially studies several algorithms for Chinese Characters image’s preprocessing, and analyse and compare with them, then choose the most suitable algorithm to build stable basis for the subsequent Chinese character library design. 

Keywords: Handwritten Character; Chinese character library; Database of off-line;Chinese character library design
1 绪论 1
1.1 研究课题的背景 1
1.2 研究课题的现状 1
1.3 的组织和安排 2
2 Visual C++介绍 3
2.1 Microsoft Visual C++ 6.0简介 3
2.2 Visual C++ 6.0的特色 3
2.3 Visual C++的适用范围 3
2.3 Visual C++的集成开发环境 3
3 字库知识介绍 7
3.1 汉字字库的简介 7
3.2 手写体汉字样本库 7
3.3 课题的主要任务 8
4 现有汉字字库构建算法及分析 10
4.1汉字字库构建算法的1般过程 10
4.1.1 准备阶段(确定手写体的字符集并书写) 10
4.1.2 图像获取阶段 11
4.1.3 字符图像的预处理阶段 11
4.1.4 特征抽取阶段 11
4.1.5 写入文件阶段 12
4.2 现有的几个典型算法介绍 12
4.2.1 整体阈值2值化 14
4.2.2 局部阈值2值化 15
4.2.3 动态阈值2值化 15
4.2.4 基于线密度均衡的非线性规范化 17
4.2.5 基于点密度均衡的非线性规范化 18
4.2.6 基于笔画间距和笔画宽度的非线性规范化 18 (科教作文网http://zw.NSEaC.com编辑发布)
4.3 几个算法的比较与分析 19
4.3.1 几种2值化算法的比较与分析 19
4.3.2 几种非线性规范化算法的比较 20
5 设计与实现 22
5.1 基本思想 22
5.2 具体设计 22
5.2.1 书写 22
5.2.2 扫描 22
5.2.3 字符分割 22
5.2.4 2值化 23
5.2.5 平滑 23
5.2.6 中值去噪 24
5.2.7 规范化 24
5.2.8 细化 24
5.2.9 抽取特征并写入文件 26
5.3 程序实现 26
5.3.1 CDib类 26
5.3.2 细化算法的实现 30
6 结论与展望 32
6.1 字库显示 32
6.2 总结 33
参考文献 35
致谢 36

 
1 绪论
1.1 研究课题的背景
   相关领域国内外技术现状和发展趋势根据市场调查分析资料显示,目前国内市场上做字库的公司数量并不是很多,大1点的公司如:方正、汉仪、文鼎、汉鼎等公司,它们多以做标准字体为主业,所做的字体大多大同小异,如:宋体字经过简单的修改和变形后就变成了华文中宋,新宋体等字库。
传统的电脑字库都是源自于设计字稿。所谓字稿,是指由专业字体设计师依自行创意的汉字风格、笔形特点和结构特点,在不小于1英寸的正方格子内,书写或描绘的清晰、光滑、视觉效果良好的汉字字形设计稿。
市场需求分析随着社会的进步和科学技术的发展,2101世纪的人已越来越追求个性,追求与众不同,现在人们不管是在工作时还是有休闲时都会有大量的时间是在电脑前度过的,许多的沟通也是通过电脑来实现的,千篇1律的印刷体已不能满足人们的需求了,这就为手迹产品提供了广阔的市场空间。
1.2 研究课题的现状
建立脱机手写汉字字库是研究和开发手写汉字识别技术的基础。然而,虽然汉字识别的研究己经有几10年的历史,但是国内外在手写汉字字库的研制方面却是成果有限。到目前为止,只有日本的LTL8、LTL9以及中国科学院自动化所研制的字库比较实用,在研究开发中起到了较大的作用。即使是这3个数据库,也还存在字体单1(工整楷书)、样本不足(每字几百个样本)的问题。特别是现有的字库中只有汉字样本图像信息,没有书写者信息。因此难以对汉字的书写规律、书写特点与书写者的关系等较基本的问题进行研究。 (科教作文网http://zw.ΝsΕac.cOM编辑)
经过两年的时间,中国已经基本上建立了HCL2000数据库。HCL2000数据库有1个显著的特点,就是把手写汉字图像数据库和其书写者的信息结合起来,因而既可为开发手写汉字识别算法提供训练和测试样本,也可用于研究各类人员的文字书写特征,探讨文字书写的相关因素。而正因为这个重要的特点:HCL2000数据库不仅包含手写汉字样本图像信息,还包含书写者信息,在建立数据库时,1个重要问题就是设计合理的数据库结构使得这两类信息既便于存储和维护,又能够灵活地相互沟通。汉字样本图像信息适合于采用图像文件的方式存储,其维护系统用C语言设计比较方便。而书写者信息适合于采用数据库管理系统进行存储和维护。

    上一篇:基于空域法的图像平滑VC++ 下一篇:没有了