所庆60周建

　　1960年，我从哈工大毕业后分配到当时的中国科学院黑龙江自动化研究所。1962年中国科学院机构调整，调入沈阳自动化研究所的前身——东北工业自动化研究所，主要方向是工业生产过程自动化。从那时起至上世纪七十年代初的10年间，先后主持并完成了兰州炼油厂国家自动化试点“炼油干点、闪点自动调节系统”、化工部“北京有机化工厂生产过程计算机控制与利用”、“鞍山第三炼钢厂计算机外围设备”等项目。

　　这里，主要回忆我本人有关模式识别研究的一些经历。

　　一、“模式识别”简述

　　1979年前后，在一次学术会议上讨论了这个问题，会上有两种意见，我所蒋卡林先生等少数人主张叫图形识别，多数人提议译成模式识别，因此，PR最终被译为“模式识别”。中国自动化学会有一个专业委员会叫“模式识别与机器智能委员会”，1979年成立，胡启恒院士、戴汝为院士都曾担任过该委员会的主任，从1979年至退休，我一直是其中的委员。该委员会的任务是每年主持学术论文报告会，进行学术交流，有时也集体评估申报的课题。在中国计算机学会中也有一个专业委员会，叫“人工智能与模式识别专业委员会”。大约1992年，我和宋国宁收到该委员会的通知，我们俩当选为委员，我还是文字识别组组长。由于涉足较早，先于同行研究，当年沈阳自动化所在模式识别领域有了一定的知名度。

　　何谓模式识别，模式又是什么呢？人脑的这种思维能力就构成了“模式”的概念。模式识别是人工智能（AI）重要分支，目前人工智能所指的语音识别、人脸识别、文字识别、指纹识别，都是模式识别重点研究的内容。通俗地说，文字、语音、指纹等都可称为模式。模式识别是人类“形象思维”的基本智能，日常生活中人们经常在进行“模式识别”。随着二十世纪四十年代计算机的出现，以及五十年代人工智能的兴起，人们当然也希望能用计算机来代替或扩展人类的部分脑力功能。于是，（计算机）模式识别在六十年代初迅速发展并成为一门新学科。

　　二、手写体数字识别——信函自动分检机

　　1973至1974年，我在当时的第一研究室刚完成鞍钢计算机外围设备任务，室副主任邹揆南找我们，说你们今后搞手写数字识别吧，我看有前途！

　　过了一段时间，我们找到一份很完整的日本资料，有功能框图、也有识别方法，我们边学习、边准备。此时，正赶上我国推行邮政编码并制出专用信封，在信封左上角有六个红色方框，供书写邮政编码。这就实现了信封上的汉字地址数字化了，也为识别手写数字实现信函自动分检，提供了需求基础。

　　国家确定沈阳市、上海市是全国的试点城市，推行邮政编码。辽宁省科委下达了研制信函自动分检机的任务，由三家单位联合承担。我们所负责手写体数字识别部分，经费20万元；沈阳机电学院负责机械部分——信件传输及信件格口等；邮局负责供信台制作及信件传输控制。这样，我所信函自动分检机课题组就建立起来了。用了一年多时间，完成了实用信函分捡机的光学扫描设备。

　　到1978年，在所里的实验室任务基本结束，把设备运到现场等待机械部分联调，还要解决很多相互配合协调的问题，半年之后机械设备开始联试。

　　经过半年多的调试，各种问题都解决了。联试结果表明，分捡速度2400封/小时，整体准确率98%，效果不错，达到了设计要求，几年来大家的努力看到了成果。

　　1979年，我们召开了信函自动分捡机鉴定会，参加会议的有辽宁省科委、中国科学院和邮电部。上海邮局和其他单位合作也在搞信函自动分捡机，晚我们一年并召开了鉴定会，这次也派人参加。我们提供了大批量信件的运行数据，并按着鉴定大纲内容进行了演示。通过近一天的考核，鉴定通过了，这是我国第一台信函自动分捡机设备。这个项目获得1981年度辽宁省科技成果二等奖。

　　三、印刷体汉字识别

　　手写体数字识别——信函自动分捡机项目结束后， 1982年，我们向所里正式申请立项，开始了印刷体汉字识别研究。当时，我所有一台国产DJS-130计算机，该机外设有1兆硬盘、打印机、纸带机等。硬盘的读写、打印机的输出，都要自己编程。当时只有汇编语言，我们只能用ADD（加法）MOV（移动）等最基本的指令编程，没有键盘输入，只能用纸带穿孔，然后光电机输入进行编译。尽管机器使用笨拙困难，浪费了好多时间，但很快也就适应了。这台计算机为我们搞汉字识别提供了基本条件。

　　计算机有了，但无法把印刷体汉字图像输入到计算机，当时市场上还没有合适的扫描仪，工作还是无法进行，后来在中科院沈阳计算所的帮助下，把他们计算机中的32*32点阵汉字样本通过光电机穿孔到纸带上，再通过光电机输入到我们的硬盘中，就此具备了研究、探索、试验印刷体汉字识别的条件。经过两年试验，建立起了一个印刷体汉字识别试验方案，效果还不错，正确识别率可达98%。

　　1984年，恰逢召开全国“模式识别与机器智能”学术会议，我们整理试验数据并写文章参加会议。文章题为“2500印刷体汉字识别研究”，我们阐述了粗分类和识别两级识别方案，中国科学院张玉良同志、我所吴继显先生都参加了这年的学术会议，我们在会上宣读了文章。午间休息时，老吴对我们说，你们的文章一炮打响，是这次学术会上的最大亮点！

　　随着北京中关村电子一条街的出现，电子产品丰富了。我们有了286电脑、惠普平板扫描仪，为实用研究创造了良好条件，此时课题组人员也在不断扩大，张佩芬、李伟、王城山、王俊、梁刚也都先后参加进来。

　　汉字有四种常用字体，宋体、仿宋体、楷体、黑体，同一个汉字不同字体的点阵图像是不一样的，现有的识别方法很难归于同一模式，所以就不仅仅是3755个汉字问题了。因此，实用研究不是几年就能完成的，我心想，没有经费支持是难以坚持的。

　　我们运气真好，1986年我国“七五”规划开始了，其攻关项目中就有“印刷体汉字识别”，当时国内有七、八个单位争这个任务，上边说只给三个单位。在汉字识别领域，我们算是做的不错的，估计能有我们，应当问题不大，我和杨力参加了项目争取会议。投票最终结果是沈阳自动化所、清华大学、天津大学三个单位承担。这样，我们“印刷体汉字识别”课题被纳入国家“七五”攻关课题，项目经费20万。

　　到了1987年，项目有了很大进展，已经建立起一个初步的实用系统。实用化的首要问题是对扫描输入的全幅图像进行“行切分”、“字切分”，按序提供出每个汉字及标点符号的图像，然后进入特征提取环节，另外提供软件的友好人机界面，功能模块化便于使用者操作。要考虑不同类型电脑的兼容性，还要随着用户的要求不断完善。我们这个识别系统将统计法和结构法相结合，研究出基于算法的三种统计法特征，并对大样本数据进行学习，建立起粗分类特征库。我们给软件起名叫SY-OCR，即沈阳OCR，可识别多字体排版的书刊等文本，对四种字体都可识别。1987年，迎来的第一个用户是北京二炮某国防单位，他们从北京到沈阳来看我们的汉字识别系统，对功能很满意，觉得可以用。我们把系统完善一下，第二年去北京给他们安装上，他们使用一段时间感到满意，就签了合同。1988年，为了扩大影响，我们举办了“印刷体汉字识别”鉴定会。会议认为，我们的识别系统处于国内领先水平，项目鉴定之后向科学院报了科技进步奖，我们获得了三等奖。

　　1992年，国家“七五”攻关项目在北京验收，我们做了充分准备，作了检测报告、研制报告，我和杨力带上设备去了北京。一天的验收结束了，“印刷体汉字识别”课题顺利通过验收。1992年，项目验收后向科学院申报科技进步奖，在香山一个会议室，要求申请人到评审会上宣读研制报告。那天，也是我和杨力去的，我上台宣读报告。会上有20多位领导及专家，可能来自不同行业，因此我尽量讲通俗些，叫大家听懂并认同我们的水平。讲完之后在会议室旁的小房间等候，大、小房间之间有个门，所以讨论的声音也能听到一点儿。有胡启恒副院长的声音，她可是模式识别的专家，对文字识别熟悉又关心，且是院领导，她的发言当然很关建。以后得知，我们获得了1992年科学院科技进步一等奖。但得奖并不意味着“印刷体汉字识别”课题就此可以收兵了，还有深入研究的内容。

　　1992年之后，幸运之神再次光临，我们又得到了“863计划”的支持，那是科学院计算所国家智能中心李国杰院士主持的。当时，国内从事印刷体汉字识别的有三家：沈阳自动化所、清华大学、信息工程学院，三家水平基本相同，各有特色。如信息工程学院系统对宋体文本识别率略高一些，沈阳自动化所系统识别速度较快等。那时社会上有一种思想是技术集成，发挥各家特长，建立一个优于各家的系统，在这种思想的指导下，三家共同承担“印刷体汉字识别集成”任务。计算所负责系统的总体设计和文本切分，各家依据集成的统一要求进行修改，一干就是两年。在此期间，我们还在不断提高系统性能，李伟的工作最忙，整天为系统集成而忙碌着。经过多次联试、考核，“印刷体汉字识别集成”任务完成了，系统各项指标的确优于原来各家的。

　　我同项目组成员一道，做了20多年模式识别的研究，取得了一些成果，得到了有关领导和专家同行的认可，也一直努力尝试着将研究成果应用于实际，先后曾推广国内一些用户使用。根据市场需求，后续研究又侧重于手写体数字识别，为国内税务系统研制开发了“自由手写税务报表自动识别录入系统”。我退休后，李伟、杨力等将成果推广到国内数十家国税地税系统，取得了不错的应用效果，还产生了一定的经济效益。他们后来又推出了“集装箱箱号识别系统”，也在国内许多集装箱码头得到应用，这些也都是“模式识别”研究的成果。

　　作者：

　　武裕朴，男，1935年8月出生。1962年12月至1995年8月在沈阳自动化研究所工作，研究员。现已退休。