您当前所在位置: 首页 > 青春脚步 > 正文
青春脚步
次仁旦增:努力实现藏语的手写识别

致力于少数民族语言文字信息化建设

在西电的莘莘学子之中,有不少来自新疆、西藏等地的少数民族学生,藏族同学次仁旦增就是其中之一。与每一个刻苦学习的西电学学子相比,大部分少数民族学生自身理论学习基础比较薄弱,在求学的路上走的也更加艰辛。次仁旦增也不例外,但他却能借助自己熟悉藏语的优势,变劣势为优势,在指导老师卢朝阳教授的指引下,与他的团队1年时间便研发出安卓平台上的维语手写识别输入法与藏语手写输入法,并且在第十届“挑战杯”陕西省大学生课外学术科技作品竞赛上获得了“特等奖”。

次仁旦增之所以会想到做自己民族的语言文字识别,并非偶然。他一直有一个梦想,能够把自己的民族文化传承下去。在得知卢朝阳教授一直在研究维吾尔语识别技术,他便主动向卢老师讨教关于模式识别、文字识别等方面的问题,也遇到了与自己志同道合的通信院同学组队开始一起着手研究藏语的手写识别。

刚开始的时候,小组成员虽然满怀热情,但都是一筹莫展,不知从何下手。有一段时间他们没有方向,每天虽然很忙碌但并没有什么收获。次仁旦增回想说道:“当时决心很大,每天都在看各种各样的新闻与研究展望,每天都想做不同的东西。”但短时间的失败并没有把这个多民族同学们组成的小团队打败,很快又有维族同学加入。

在卢朝阳教授的指引下,次仁旦增阅读了很多文字识别领域的综述类文章,这让他们拥有了知识的基础储备,随后便开始在研究生师兄师姐的帮助下,着手自己建立藏语的手写数据库。他们首先在安卓手机上先开发了一款界面简陋但是功能完善的采集软件,并采集至少100人的书写数据。这项工作困难重重,需要不同人将藏语基础字符书写多次。尽管遭遇不少困难,次仁旦增的藏族同胞们仍十分支持他的梦想,同学们都认真地一遍遍地书写字符,为数据库贡献自己的力量。事实上,在校的藏族同学虽不少,但许多人都已经不会书写藏语了。100份的基础数据还很难收集到。次仁旦增只好发动家乡亲朋好友,终于成功把手写数据采集完毕。这样一个标准的数据库建立是他们迈向成功的第一步。

一遍遍改进完善调试识别算法,前后对比识别正确率与效率,次仁旦增与小伙伴常常在图书馆的教研室一待就是一天。对他们而言,只有调试成功、识别正确才是唯一可以让他们开心的事情。

在卢朝阳教授的帮助下,次仁旦增与同学们还去了西藏民族学院,专门向藏语言文字的教授索南才让请教文字结构等问题。同年5月,卢教授还带学生们去新疆大学参加了中国工程院院士吾守尔·斯拉木主持的多语种信息与通信技术学术会议,这使次仁旦增增长了不少见识。

校园举办的科技活动也为次仁旦增展示自己作品提供了很好的机会。就在中国工程院院士、中科院研究员倪光南来校作报告时,他自告奋勇的前去向院士展示输入法的样品,并获得了倪光南院士的鼓励与支持。

次仁旦增与小伙伴们的不断努力和钻研终于有了回报。2015年3月,团队开发的藏语手写输入法参加了第十届“挑战杯”陕西省大学生课外学术科技作品竞赛,并荣获特等奖。次仁旦增说:“获奖并不是我的目的,我希望的是让家乡的人可以一样的享受数字信息时代的便利,让亲朋好友可以更方便的书写家乡话。”

又传统又新潮的藏族同学

“入学的时候还以为次旦是少数民族,和我们在一个屋子会有很多生活习惯上的不一样。但是两三年来,发现我们考虑的根本没有发生。我们现在是哥们儿!”次旦的舍友笑着介绍到。

“他常常有不一样的点子冒出来。在文字识别方面,藏语完全处在一个空白领域,这样次旦不断的新点子对于识别算法的改进有着很大的帮助。”次旦的辅导员王艳提到。

获奖,并不是初衷

从藏区的汉语版出来的次仁旦增知道,有很多藏族同学都不会书写藏语了,他觉得长期以往下去自己民族的文化可能会丧失掉许多精髓。他一直希望为自己的民族文化贡献出自己的力量。

次仁旦增回想说 “来西电就希望把互联网的新科技带回家乡,把信息时代的产物带回家乡让每一个小朋友、叔叔阿姨、爷爷奶奶都可以享受到。很感谢老师和师兄师姐都热心的帮助我解决各方面的问题,为我指点迷津。原本很多课都听不懂,门门课挂红灯,前后学习一年多藏语手写输入法,现在可以理论联系实际,对所学的知识也能理解大半了,虽然和学院的技术大神差得很远,不过我相信不断努力坚持下去,我也将成为别人眼中的那个大神了。”次仁旦增显得十分有信心。


(文/西电新闻中心·王 艳 李时宇)

123

南校区地址:陕西省西安市西沣路兴隆段266号

邮编:710126

北校区地址:陕西省西安市太白南路2号

邮编:710071

访问量:

版权所有:米兰网页版,米兰(中国),米兰(中国)    建设与运维:信息网络技术中心     陕ICP备05016463号    陕公网安备61019002002681号