模式识别人才两种培养模式的比较与思考
作者:朱宗晓 杨怡
来源:《计算机教育》2014年第10期
摘要:通过对课程教学和竞赛辅导两种模式识别人才培养模式的比较和分析,提出在网络背景下创新型人才培养应实现教师角色从知识的布道者到问题的辅导者,知识传授从教师讲、学生记到学生讲、教师评,学生学习从个体学习到团队学习3个重大转变,从而培养出符合时代需求和具有创新能力的复合型人才。
关键词:模式识别;培养模式;教师角色;组织管理 0、引言
高等教育的目的在于培养符合时代需求、具有创新能力的复合型人才。当代高等教育在互联网冲击下在全世界范围内都出现了明显两极分化的趋势。一方面,传统教育模式下培养出来的大学生越来越难以找到工作,深层次原因在于现代经济对于受教育劳工的需求正在被重新分配。计算机能做的工作越来越多,使得大量的中端职位被智能机器扼杀,而高端职位需求增长缓慢。另一方面,在互联网时代学生依靠自学,令上了锁的科学大门不断为少年敞开。因此,从事高等教育的每一位教师都应该认真思考和重新定位自己的角色,从而在网络背景下更好地完成创新型人才培养工作。
模式识别是自动化、计算机等专业的一门新兴学科,源于自动控制与计算机科学,又和机电一体化、人工生命等学科密不可分,涉及计算机技术、控制与决策、电子信息、机电一体化、生物信息等众多研究领域。人才市场对具有模式识别项目背景的求职者需求旺盛。为了适应这种人才需求,从2012年上半年开始,笔者尝试比较两种截然不同的模式识别人才培养模式,前者为2012年4-6月期间针对2009级大三30名自动化专业本科生按教学大纲规定的36课堂学时、12实验学时讲授模式识别课程,完成教学任务后收集、整理、分析学生的反馈意见;后者为从2012年3月开始,指导3名在模式识别方面零基础的2009级大三计算机科学与技术专业本科生参加2013年4月举行的代表全球手写汉字识别最高水平的自然手写汉字识别大赛,记录整理指导历程和参赛经过。通过对这两种培养模式的实践、比较与思考,笔者对培养模式识别人才中教师所应扮演的角色、知识传授的方式以及学习中人员的组织管理有了一定的新认识。
1、教师的角色——从知识的布道者到问题的辅导者
在讲授模式识别课程的过程中,笔者作为知识的布道者,尽管已经尽最大努力将该课程讲得通俗易懂,但是在课程结束后的问卷调查中,笔者发现90%的学生认为模式识别这门课程比较深奥,理论原理太多;49%的学生建议在上这门课前先复习讲解部分概率论、线性代数知识;34%的学生认为这门课有一定难度,希望增加课程学时,从而能对该课程有更透彻的理
龙源期刊网 http://www.qikan.com.cn
解;32%的学生希望能够增加实验课时,将理论与实际更好地结合起来,加深实践理解,同时希望把机器人识别、数字信号识别、人脸识别等贴近生活的、有启发性的例子加入实验。 这表明学生仅仅依靠课堂上的有限学时很难真正掌握模式识别这门课程,而教师也无法在有限学时中将模式识别全部专业知识充分有效地灌输给学生。与此不同的是在指导另外3名没学过模式识别课程的本科生参赛时,笔者从网络公开课中挑选清华大学林学闇教授为本科生录制的模式识别课程视频供其观看,并让他们自己思考要参与自然手写汉字识别大赛中的特征分类识别、脱机字符识别、脱机文本识别3个比赛项目,需要用到视频中讲过的哪些技术,经历一个怎样的流程,每一步取得一些什么样的阶段性成果。此外,学生通过上网、用智能手机或iPad聆听教学课程会有很多优势,他们用不着因为要多看几遍课程视频而感到不好意思,可以按照自己的节奏安排学习。
笔者在每周一次的讨论会上把重点放在对学生作一对一的指导上,解决那些真正阻碍学生运用这门课程的问题。类似的教学方法在比尔·盖茨资助的Khan学院中得到广泛推广,该学院免费提供从数学金融到化学历史等学科的2400多个教学视频给美国的合作学校,以一种颠覆传统教学方法的模式进行教学。这种模式是学生利用课下时间听课,用上课时间作辅导或做作业。这一教学方式正在以美国为中心向全世界传播。
2、知识传授的方式——从教师讲、学生记到学生讲、教师评
无论在网上还是在课堂上,以教师为中心的课程都只能起到有限的教学效果。研究表明,人脑主要是通过在互动中不断回忆以接受新鲜概念。这也就是说高质量的教学必须像物理学诺贝尔奖得主,也是奥巴马总统的顾问Carl Wieman说的那样,要“弱化教师授课,着重鼓励学生主动解决问题”。在讲授模式识别课程时,为了按照教学大纲要求完成规定的教学任务,笔者在课堂上只能尽可能引导学生思考、理解一些问题,无法把学生的积极性真正调动起来解决问题,而模式识别恰恰是一门实践性很强的科学,涉及大量抽象的算法、公式,如果不真正应用这些算法、公式解决一些具体的问题,很难对其有深刻的理解。
在指导学生参加自然手写汉字识别大赛的13个月中,笔者最初提供给3名参赛学生的仅仅是一套较为简单的用于印刷体彝文识别的算法平台,之后就再也没有帮助学生编过一行代码。学生要先把这套平台看懂,然后移植到手写汉字的数据库上,最后逐步改进提高。于是,每周一次的进度汇报完全以学生为中心,每名学生先对上一周的工作进行总结和汇报,把其中遇到的问题拿出来集体讨论。在项目开始的最初几个月,学生会问到在学习印刷体识别平台中一些算法的原理和实现方法时遇到的问题,如对印刷体字符如何提取特征、1024维的特征如何压缩到128维、三层欧式距离分类器如何建立等,笔者可以有针对性地对这些问题进行详细解答。到了2012年暑假,学生发现印刷体识别算法用于自然手写汉字识别,无论是字符分割还是字符识别都性能低下,与文献中代表世界先进水平的分割准确率和识别率相差很大,此时笔者就和学生一起分析原有算法用于自然手写汉字的局限性,鼓励学生阅读学习IEEE Transactions on Pattern Analysis andMachine Intelligence、Pattern Recognition、IEEETransactions
龙源期刊网 http://www.qikan.com.cn
on lmage Processing这些世界顶级期刊上相关文献所采用的方法,并把自己的理解,无论正确与否,都在进度汇报会上讲出来。
接下来的几个月,学生不断将文献中最新的方法用自己的语言讲出来,而笔者则负责指出讲述过程中存在的逻辑漏洞和没有讲清楚的地方,而这些往往恰好是学生对原文理解出现偏差的地方,从而促使学生不得不一遍一遍地重新仔细阅读论文,加深对论文思想的理解。实践证明,尽管这3名本科生不能完全达到使用这些文献中最新方法的水平,但是可以在论文思想的启发下,建立出自己能够理解的可以显著提高原有分割准确率和识别率的算法,最大程度地缩短了与世界先进水平的差距。
3、学习中的人才组织管理——从个体学习到团队学习
在模式识别课程教学中,所有学生接收到的教学内容、思考任务都是统一的,考核的载体——试卷也是统一命题的,也就是说学生接受到的是同一种教育。这种方式尽管有助于学生之间相互交流、理解知识,但却抹杀个性,短时间内难以形成一支有解决问题能力的工作团队。事实上,参与课程教学的学生也很希望以团队的方式开展学习并解决一些实际问题,如54%的学生希望增加课程设计并且能够自己选择有兴趣的题目;33%的学生希望能够以小组为单位进行实验,并且对实验原来程序进行优化,这样能够增加难度,培养学生的创新能力。 在指导学生参赛的过程中,从项目组成立开始,每名成员就有了自己明确的任务分工。整个小组要解决自然手写汉字识别这个模式识别领域里的大问题,每个成员又要解决诸如自然文本分割、字符非线性规范化、特征提取、特征压缩、分类器设计、字符识别这样一些子问题。每个成员平时针对自己的子问题展开研究,每周则把研究的成果拿到会议上让大家进行集体学习。这样既发挥了每名成员的特长,使他们对整个自然手写汉字识别项目产生了强烈的责任感,又可以增强团队解决实际问题的整体能力,拓展了每名成员的知识面,增加了间接经验,同时也符合当今社会对复合型人才专业分工、紧密合作的要求。相对于千篇一律的课堂教学,这种团队学习的模式在培养人才方面具有明显优势。最终,在参与模式识别课程教学的30名自动化专业本科生中,仅有一名学生考上模式识别方向的研究生,其他本科生均未从事与模式识别有关的工作,而在2013自然手写汉字识别大赛中,笔者指导的3名本科生成功完成了特征分类识别、脱机字符识别、脱机文本识别3个比赛项目。
国内大学中仅有清华大学和哈尔滨工业大学两支以教师为主体的队伍和我们一同参赛,其他7个参赛队伍分别来自中国、英国、法国、瑞士、日本的一些著名高校、研究所和公司。我们的特征分类识别准确率为92.44%,比最高水平的哈尔滨工业大学低2.74%;脱机字符识别为77.71%,比最高水平的Fijitsu中国公司低了17.06%。我们的脱机文本识别由于还处于起步阶段,与最好的哈尔滨工业大学相差甚远,但其中的行分割算法在HIT-MW中文自然手写文档数据库上的召回率为99.60%、错误率0.46%,与最新文献中召回率99.52%、错误率0.32%的水平基本相当,这对于一名中南民族大学的本科生来说难能可贵。 4、结语
龙源期刊网 http://www.qikan.com.cn
在目前国内的教学环境和教学条件下,类似参加自然手写汉字识别大赛这样的模式识别人才培养模式还无法完全取代模式识别的课程教学,但在课程中有意识地参考和借鉴其中的做法,以问题为牵引,鼓励学生制订目标,围绕课题组成团队主动学习,适当减少知识传授的比例,应该能够更好地激发学生学习的积极性,达到更好的学习效果。在毕业设计、课程设计以及课外学术活动指导的过程中,类似的人才培养模式有一定的实用价值和参考意义。
因篇幅问题不能全部显示,请点此查看更多更全内容