所外网 / 所内网
   首页 通知公告 所庆安排 所庆动态 作品展示 视频留影 图像记忆 所庆寄语 联系我们   
 
武裕朴:我经历过的模式识别研究
发布时间:2018-10-12 来源: 【字号:  

  1960年,我从哈工大毕业后分配到当时的中国科学院黑龙江自动化研究所。1962年中国科学院机构调整,调入沈阳自动化研究所的前身——东北工业自动化研究所,主要方向是工业生产过程自动化。从那时起至上世纪七十年代初的10年间,先后主持并完成了兰州炼油厂国家自动化试点炼油干点、闪点自动调节系统、化工部北京有机化工厂生产过程计算机控制与利用鞍山第三炼钢厂计算机外围设备等项目。 

  这里,主要回忆我本人有关模式识别研究的一些经历。 

  一、模式识别简述 

  1979年前后,在一次学术会议上讨论了这个问题,会上有两种意见,我所蒋卡林先生等少数人主张叫图形识别,多数人提议译成模式识别,因此,PR最终被译为模式识别。中国自动化学会有一个专业委员会叫模式识别与机器智能委员会1979年成立,胡启恒院士、戴汝为院士都曾担任过该委员会的主任,从1979年至退休,我一直是其中的委员。该委员会的任务是每年主持学术论文报告会,进行学术交流,有时也集体评估申报的课题。在中国计算机学会中也有一个专业委员会,叫人工智能与模式识别专业委员会。大约1992年,我和宋国宁收到该委员会的通知,我们俩当选为委员,我还是文字识别组组长。由于涉足较早,先于同行研究,当年沈阳自动化所在模式识别领域有了一定的知名度。 

  何谓模式识别,模式又是什么呢?人脑的这种思维能力就构成了模式的概念。模式识别是人工智能(AI)重要分支,目前人工智能所指的语音识别、人脸识别、文字识别、指纹识别,都是模式识别重点研究的内容。通俗地说,文字、语音、指纹等都可称为模式。模式识别是人类形象思维的基本智能,日常生活中人们经常在进行模式识别。随着二十世纪四十年代计算机的出现,以及五十年代人工智能的兴起,人们当然也希望能用计算机来代替或扩展人类的部分脑力功能。于是,(计算机)模式识别在六十年代初迅速发展并成为一门新学科。 

  二、手写体数字识别——信函自动分检机 

  19731974年,我在当时的第一研究室刚完成鞍钢计算机外围设备任务,室副主任邹揆南找我们,说你们今后搞手写数字识别吧,我看有前途! 

  过了一段时间,我们找到一份很完整的日本资料,有功能框图、也有识别方法,我们边学习、边准备。此时,正赶上我国推行邮政编码并制出专用信封,在信封左上角有六个红色方框,供书写邮政编码。这就实现了信封上的汉字地址数字化了,也为识别手写数字实现信函自动分检,提供了需求基础。 

  国家确定沈阳市、上海市是全国的试点城市,推行邮政编码。辽宁省科委下达了研制信函自动分检机的任务,由三家单位联合承担。我们所负责手写体数字识别部分,经费20万元;沈阳机电学院负责机械部分——信件传输及信件格口等;邮局负责供信台制作及信件传输控制。这样,我所信函自动分检机课题组就建立起来了。用了一年多时间,完成了实用信函分捡机的光学扫描设备。 

  1978年,在所里的实验室任务基本结束,把设备运到现场等待机械部分联调,还要解决很多相互配合协调的问题,半年之后机械设备开始联试。 

  经过半年多的调试,各种问题都解决了。联试结果表明,分捡速度2400/小时,整体准确率98%,效果不错,达到了设计要求,几年来大家的努力看到了成果。 

  1979年,我们召开了信函自动分捡机鉴定会,参加会议的有辽宁省科委、中国科学院和邮电部。上海邮局和其他单位合作也在搞信函自动分捡机,晚我们一年并召开了鉴定会,这次也派人参加。我们提供了大批量信件的运行数据,并按着鉴定大纲内容进行了演示。通过近一天的考核,鉴定通过了,这是我国第一台信函自动分捡机设备。这个项目获得1981年度辽宁省科技成果二等奖。 

  三、印刷体汉字识别 

  手写体数字识别——信函自动分捡机项目结束后, 1982年,我们向所里正式申请立项,开始了印刷体汉字识别研究。当时,我所有一台国产DJS-130计算机,该机外设有1兆硬盘、打印机、纸带机等。硬盘的读写、打印机的输出,都要自己编程。当时只有汇编语言,我们只能用ADD(加法)MOV(移动)等最基本的指令编程,没有键盘输入,只能用纸带穿孔,然后光电机输入进行编译。尽管机器使用笨拙困难,浪费了好多时间,但很快也就适应了。这台计算机为我们搞汉字识别提供了基本条件。 

  计算机有了,但无法把印刷体汉字图像输入到计算机,当时市场上还没有合适的扫描仪,工作还是无法进行,后来在中科院沈阳计算所的帮助下,把他们计算机中的32*32点阵汉字样本通过光电机穿孔到纸带上,再通过光电机输入到我们的硬盘中,就此具备了研究、探索、试验印刷体汉字识别的条件。经过两年试验,建立起了一个印刷体汉字识别试验方案,效果还不错,正确识别率可达98% 

  1984年,恰逢召开全国模式识别与机器智能学术会议,我们整理试验数据并写文章参加会议。文章题为“2500印刷体汉字识别研究,我们阐述了粗分类和识别两级识别方案,中国科学院张玉良同志、我所吴继显先生都参加了这年的学术会议,我们在会上宣读了文章。午间休息时,老吴对我们说,你们的文章一炮打响,是这次学术会上的最大亮点! 

  随着北京中关村电子一条街的出现,电子产品丰富了。我们有了286电脑、惠普平板扫描仪,为实用研究创造了良好条件,此时课题组人员也在不断扩大,张佩芬、李伟、王城山、王俊、梁刚也都先后参加进来。 

  汉字有四种常用字体,宋体、仿宋体、楷体、黑体,同一个汉字不同字体的点阵图像是不一样的,现有的识别方法很难归于同一模式,所以就不仅仅是3755个汉字问题了。因此,实用研究不是几年就能完成的,我心想,没有经费支持是难以坚持的。 

  我们运气真好,1986年我国七五规划开始了,其攻关项目中就有印刷体汉字识别,当时国内有七、八个单位争这个任务,上边说只给三个单位。在汉字识别领域,我们算是做的不错的,估计能有我们,应当问题不大,我和杨力参加了项目争取会议。投票最终结果是沈阳自动化所、清华大学、天津大学三个单位承担。这样,我们印刷体汉字识别课题被纳入国家七五攻关课题,项目经费20万。 

  到了1987年,项目有了很大进展,已经建立起一个初步的实用系统。实用化的首要问题是对扫描输入的全幅图像进行行切分字切分,按序提供出每个汉字及标点符号的图像,然后进入特征提取环节,另外提供软件的友好人机界面,功能模块化便于使用者操作。要考虑不同类型电脑的兼容性,还要随着用户的要求不断完善。我们这个识别系统将统计法和结构法相结合,研究出基于算法的三种统计法特征,并对大样本数据进行学习,建立起粗分类特征库。我们给软件起名叫SY-OCR,即沈阳OCR,可识别多字体排版的书刊等文本,对四种字体都可识别。1987年,迎来的第一个用户是北京二炮某国防单位,他们从北京到沈阳来看我们的汉字识别系统,对功能很满意,觉得可以用。我们把系统完善一下,第二年去北京给他们安装上,他们使用一段时间感到满意,就签了合同。1988年,为了扩大影响,我们举办了印刷体汉字识别鉴定会。会议认为,我们的识别系统处于国内领先水平,项目鉴定之后向科学院报了科技进步奖,我们获得了三等奖。 

  1992年,国家七五攻关项目在北京验收,我们做了充分准备,作了检测报告、研制报告,我和杨力带上设备去了北京。一天的验收结束了,印刷体汉字识别课题顺利通过验收。1992年,项目验收后向科学院申报科技进步奖,在香山一个会议室,要求申请人到评审会上宣读研制报告。那天,也是我和杨力去的,我上台宣读报告。会上有20多位领导及专家,可能来自不同行业,因此我尽量讲通俗些,叫大家听懂并认同我们的水平。讲完之后在会议室旁的小房间等候,大、小房间之间有个门,所以讨论的声音也能听到一点儿。有胡启恒副院长的声音,她可是模式识别的专家,对文字识别熟悉又关心,且是院领导,她的发言当然很关建。以后得知,我们获得了1992年科学院科技进步一等奖。但得奖并不意味着印刷体汉字识别课题就此可以收兵了,还有深入研究的内容。   

  1992年之后,幸运之神再次光临,我们又得到了“863计划的支持,那是科学院计算所国家智能中心李国杰院士主持的。当时,国内从事印刷体汉字识别的有三家:沈阳自动化所、清华大学、信息工程学院,三家水平基本相同,各有特色。如信息工程学院系统对宋体文本识别率略高一些,沈阳自动化所系统识别速度较快等。那时社会上有一种思想是技术集成,发挥各家特长,建立一个优于各家的系统,在这种思想的指导下,三家共同承担印刷体汉字识别集成任务。计算所负责系统的总体设计和文本切分,各家依据集成的统一要求进行修改,一干就是两年。在此期间,我们还在不断提高系统性能,李伟的工作最忙,整天为系统集成而忙碌着。经过多次联试、考核,印刷体汉字识别集成任务完成了,系统各项指标的确优于原来各家的。 

  我同项目组成员一道,做了20多年模式识别的研究,取得了一些成果,得到了有关领导和专家同行的认可,也一直努力尝试着将研究成果应用于实际,先后曾推广国内一些用户使用。根据市场需求,后续研究又侧重于手写体数字识别,为国内税务系统研制开发了自由手写税务报表自动识别录入系统。我退休后,李伟、杨力等将成果推广到国内数十家国税地税系统,取得了不错的应用效果,还产生了一定的经济效益。他们后来又推出了集装箱箱号识别系统,也在国内许多集装箱码头得到应用,这些也都是模式识别研究的成果。 

  作者:

  武裕朴,男,19358月出生。196212月至19958月在沈阳自动化研究所工作,研究员。现已退休。 

关闭页面
2018 中国科学院沈阳自动化研究所 综合办公室 版权所有