[兰州大学报]中国盲文数字平台诞生记

日期: 2019-04-20 阅读: 来源: 关键词:

作者:本报记者 任 妍 校报记者团 王曦晨 张路遥 联合采访 罗小芳 马 强

苏伟 兰州大学信息无障碍研究中心主任

2019年3月22日,在我校举行的2019人工智能西部高峰论坛上,中国盲文数字平台正式启动,这是我国首例面向中国1700万视障人群、集生活学习工作于一体的综合性公共服务平台。

中国盲文数字平台到底有哪些功能?它是怎样服务于视障人群的?在它的研发背后有着怎样的故事?平台的未来发展面临着哪些瓶颈?带着诸多疑问,近日,本报记者(以下简称“记”)专访了中国盲文数字平台的主要研发者、我校信息无障碍研究中心主任苏伟(以下简称“苏”)。

记:中国盲文数字平台的主要功能是什么?

苏:主要功能有两大块,一个是翻译功能,能够将汉语、英语、数理化公式、音乐乐谱等翻译成盲文,另一个是资源服务管理功能,能够实现海量文档资料的存储及访问,供盲人阅读。

记:有关这两大功能,具体如何操作,请您谈一下。

苏:就翻译功能而言,操作是非常简单的,以将汉语英语翻译成盲文为例,在翻译框里输入或拷入一段文字,一点击“预览盲文”,我们就能看到翻译成的盲文,再一点击“打印预览”,就能将翻译出来的盲文打印出来。对于音乐乐谱、数理化公式,也都是基本一样的操作。

就资源管理功能来说,操作有点类似百度文库,用户可以上传、下载、管理各种文档,也可以对文档资源进行打分、评论,并可以与好友分享文档。

记:只有盲人可以使用平台吗?

苏:中国盲文数字平台有一个非常重要的特点和优点,就是所有文档书籍不会涉及版权问题。因为根据《马拉喀什条约》和我国著作权法,以盲人能够感知的独特方式向其提供已经发表的文字作品,不需要征得原作者和原出版社的同意,在中国盲文数字平台上,用户可以把最新的、更多的资源放到平台上,所以理论上来讲,平台上资源的增长速度会比其他公共平台的要更快。

平台采用开放式架构,所有人都可注册使用并上传资源。视障者输入残疾人证号后,如果浏览到涉及版权的内容,系统会自动以盲文和语音的形式呈现;而明眼人在浏览到涉及版权的内容的时候需付费或通过其他方式取得版权后方可访问。

记:汉语翻译成盲文与英语翻译成盲文相比,哪个更复杂?

苏:汉语。盲块总共有64个,英语翻译成盲文的时候,一级英语盲文中26个字母每个都可以对应到一个盲块上,汉语则做不到,汉语翻译成盲文要经过机器分词、多音字标注、音盲转换、缩写和标点符号校正等步骤,每个步骤都是一个科研难题,所以说如果汉语翻译成盲文的难度是100分,那么英语翻译成盲文的难度可能只有10分。

记:盲人如何将想要翻译的文字或乐谱或数理化公式输入到翻译框里?又怎么输出出来呢?

苏:我们明眼人使用鼠标及虚拟光标定位来实现电脑操作,盲人操作电脑和手机时需借助读屏软件,读屏软件会将屏幕及键盘输入内容通过语音报给他。对于翻译成盲文的内容,盲人可通过两种方式访问,一是点显器,点显器相当于盲人的显示器,点位具有凹凸感,盲人可摸读;另外也可通过盲文刻印机将内容刻印在专用纸张上,然后再摸读。您看这本书,就是盲文版的数学书,内容和咱们九年义务教育通用教材是一模一样的,专门给盲人学生用的。

记:在咱们国家,是否有专门的出版社出版盲文教材?

苏:有,就是中国盲文出版社,但目前的实际情况是中国盲文出版社人手有限,所以他们只能保障所有盲文课本的出版,而对于教辅书及其他文档资料是存在出版空白的,我国每六万个盲人一年平均占有一种出版物,而每位明眼人平均每年就占有10种出版物;中国残联和中国盲人协会为解决这一难题,委托我们开发了中国盲文数字平台,这是为了解决全国视障者盲文资源短缺问题。

记:平台翻译的准确率怎么样?

苏:根据我们的测试,准确率大概在90%到95%之间,对于要正式出版的还要经过人工“三校”。即便如此,也节省了大量前期的工作。以前像数理化公式、音乐乐谱等,都是纯人工翻译的,如果要翻译一首乐谱,翻译人员不仅要懂盲文,还要懂盲文乐谱、五线谱、简谱,这在全国都没有几个人能翻译,所以以前中国盲文出版社真正出版的盲文乐谱非常少,大概一年也就翻译几十首,现在一年翻译好几百首都没有问题。

记:平台的使用是否与盲校的教学已实现对接?

苏:这也是我们正在做的事。因为盲校师资招聘相对困难,所以很多盲校招聘老师的时候并不要求老师一定懂盲文。老师不懂盲文,那么对老师而言最快捷有效的办法就是说出来,学生用专门的盲文写字板和厚纸记笔记,在纸上扎出来,然后摸读,我们叫“正扎反摸”。如果是老师讲课、学生记笔记,这当然没问题;但如果是老师布置作业、学生把作业“扎”出来,这个就要花费较长的时间。现在,兰州盲聋哑学校的老师们借助中国盲文数字平台,把作业自动翻译成盲文,然后刻印出来,老师的工作量降低了,学生也节约了大量扎写作业时间。

记:您前面说到的读屏软件可以访问一切网络资源吗?

苏:读屏软件能把屏幕上的内容转换成语音,视障人士只需点击键盘按键,滑动手指或双击屏幕就能获取相关的信息。现在读屏软件的功能已经比较成熟,但有些问题是读屏软件无法解决的。网站和软件代码书写不规范会导致读屏软件读不出信息或读出错误信息,影响盲人的判断,会导致信息障碍问题。

近两年,我们与中国残联、中国盲文协会一起,正在开展信息无障碍相关工作。信息无障碍就是让任何人,无论是健全人还是残疾人,无论是年轻人还是老年人,在任何情况下都能平等地、方便地、无障碍地获取信息、利用信息。当前我们国家的很多网站、软件、手机APP在开发时并没有考虑盲人访问的问题,不符合信息无障碍的标准,读屏软件就无法读出内容,对盲人而言就是有障碍。

在这方面,现在我们着力开展两项工作,一是从2018年开始,我们和中国残联、中国盲人协会联合策划,一起倡议在全国高校里推广信息无障碍的课程;第二是我们正在研究人工智能算法,实现全国网站信息无障碍的自动检测系统,利用机器学习算法对网站进行自动修订,以促进网站信息的无障碍。

记:咱们国家是否有对网站和软件的开发要符合信息无障碍标准的规定?

苏:我们国家在这方面做了很多努力,制定了一系列的政策和标准,2016年中国残联、国家网信办出台《关于加强网络无障碍服务能力建设的指导意见》,2017年国务院又印发了《“十三五”推进基本公共服务均等化规划》。在标准方面,有2012年制定的《网站设计无障碍技术要求》和《网站设计无障碍评级测试方法》。但这些标准不是强制标准,现在很多网站并没有做到位。当然,这里面有一些做的比较好的公司,例如腾讯公司和阿里巴巴公司,他们都有专门的部门负责信息无障碍开发与测试。

记:在信息无障碍课程的推广上我们做了哪些尝试?

苏:当前,我国信息无障碍专业人才严重匮乏,从事信息行业的专业人员没有无障碍理念和技术,开发的产品缺乏这方面的功能考虑。造成这一问题的根本原因在于信息无障碍教育体系缺失,师资及科研力量薄弱,高等院校电子信息类专业学科缺乏信息无障碍内容,学生作为未来的工程师接触不到信息无障碍的知识、方法和技术。因此推进信息无障碍发展,高校必需先行。

所以目前我们正与中国残联、中国盲文协会、中国聋人协会一起,在全国发起“高等院校信息无障碍课程建设与人才培养的倡议”。当然,推广信息无障碍课程仅靠几所高校和中国残联的力量是远远不够的,所以在刚刚过去的两会上,全国政协委员、中国盲人协会主席李庆忠就提了一个有关在高校推广信息无障碍课程的提案,力求联合教育部开展此项工作。提案建议“尽快加强信息无障碍课程建设和人才培养,在相关高校增加信息无障碍或通用设计的通识课,组织编写不同层级的信息无障碍教材,建立信息无障碍硕士、博士专业方向,尽快建立我国信息无障碍专业教育体系。加大高校开展助残与助老理论及技术的研究,倡导高校通过专家讲座、社团活动等途径开展信息无障碍的科普工作和教学技术交流”,得到了与会代表的热烈讨论。

记:具体到咱们学校来说,在信息无障碍的课程建设方面做了哪些事情?

苏:第一就是在部分课程,如《软件技术基础》《网页设计与编程》中增加信息无障碍的内容,其实经过系统的信息专业的课程学习,学生在技术层面上实现信息无障碍并不是很大的问题,关键还是意识问题,开发软件时考虑到信息无障碍,编写程序的时候就会更规范、更完整。例如访问网站输入验证码是盲人上网最头疼的问题之一,常见的验证码是文字、数字和图片形式的,盲人看不到,如果同时提供声音的验证码,对盲人来说这个问题就迎刃而解了。公共服务性质的网站,如银行网站、购票网站、购物网站等都应该提供两种验证码。欧美国家都是法律明文规定公共网站要同时有图像和声音验证码供用户选择。

第二就是编写信息无障碍的教材和专著,现在正在编写的有 《信息无障碍导论》教材和《盲文信息化研究》专著,后续也会启动《网站信息无障碍技术》、《信息无障碍检测技术》等教材的编写工作。

第三就是开展有关信息无障碍的科普活动,通过讲座、社团活动、竞赛等途径开展信息无障碍的科普工作。另外,对有些学校而言,在课程里增加信息无障碍的内容或增设信息无障碍的课程短期内有困难,科普作为一个初期的临时措施弥补一点空白吧。

记:我国1700万视障人群对上网的需求量有多大?

苏:具体数据还不太掌握,但是有这样一个情况,就是盲人出行不方便,接触外界就更多地会借助信息手段,他们比明眼人每天上网的时间更多。

记:在高校推广信息无障碍课程,目前遇到的最大的瓶颈是什么?

苏:各个高校对信息无障碍这件事情的认可程度参次不齐。尽管全国有1700万视障人群,但相比总人数来说还是一个小众。在欧美国家有法律的强制规定要求网站软件等实现信息无障碍,否则就得下线,咱们国家没有这方面的硬性规定,公司招聘员工也不做这方面的要求,所以总体上还是意识不到位。我们联系了一些高校做推广,其中有些很配合,有些就不太积极。

记:目前国内信息无障碍的研究方面的发展情况是什么样的?

苏:清华大学等高校有无障碍发展相关研究,主要从事建筑和公共设施无障碍研发;南京大学有残疾人事业发展研究中心,主要从事残疾人社会保障与社会福利相关研究。在信息无障碍研究方面,全国比较少,主要有浙江大学的中国残疾人信息和无障碍技术研究中心,深圳的信息无障碍研究会,腾讯、百度、阿里巴巴、IBM、微软(中国)、小米、中国平安、饿了么等平台联合成立的中国信息无障碍产品联盟。

记:您是从什么时候关注并开始做盲文方面的工作的?

苏:我2005年-2007年在美国读联合培养博士期间,跟着我的导师PaulS.Wang做数学知识管理方向,经常参加一些国际学术会议,在会上听到一些专家作数学公式到盲文转换的报告。因为每个国家的数学盲文标准不一样,我就受到了启发,看看国内有没有这方面的研究,发现当时国内基本还是个空白,就开始尝试着做了。

2007年,我就据此写了一个国家自然科学基金的本子,获批立项了,然后就开始做数学公式的转换。

做了两三年之后有了一点结果,我就找了一些盲人去试用、测试,在这之中认识了中国盲人协会的李伟洪主席。李主席对我们做的这个事非常感兴趣,鼓励我说你别光做数学公式的,把物理化学公式、音乐乐谱也都做一做,因为音乐是盲人从事的第二大职业。中国盲人协会和中国残疾人联合会也非常支持我们的工作,不久就给兰州大学立了一个信息专项,委托我们做数理化公式的转换。

到了2012年,我们在这一块又有了一些进展,在这过程中我们就发现歌曲的词还不能转换,不论是汉语的还是英语的。我们通过调研了解到中国盲文出版社有个阳光软件,能把汉语转换成盲文,但他存在的分词问题、多音字问题比较普遍,转换的正确率大概在70%左右,如果是正式出版物,校对的工作量就非常大。中国盲人协会进一步大力支持我们开始做汉语英语到盲文的转换工作,2013年成立了联合实验室,2014年我们开始研发中国盲文数字平台,到2018年底正式上线运行,而且我们实现了中国盲文数字平台和阳光软件的对接,弥补了阳光软件单机版的缺陷,更加开放,更加方便。

这几年人工智能的飞速发展也促进了我们对自然语言的处理,可以通过深度学习把一些新的算法用到了盲文的分词连写上,这样尝试的效果还是比较好的,现在我们转换的准确率能达到90%-95%之间。

记:在中国盲文数字平台的整个研发过程中,您们的核心技术是什么?遇到的最大难题是什么?

苏:核心技术主要有三个,一是盲人数理化公式完整解决方案,在国际上也能够算是领先的;二是基于深度学习的盲文翻译方法,我们第一个采用直译方法实现汉盲翻译,改进了以往多步翻译的效率和准确率;三是简谱乐谱到盲文翻译技术,在全球也未发现其他研究团队能够实现简谱乐谱到盲文的翻译。在这三个核心技术上,我们都申请到了软件著作权和专利。

遇到的最大难题有两个。第一是要盲文语料库极度缺乏。第二就是转换中算法的准确度问题。我们现在的算法都是基于目前机器学习领域中先进的深度学习模型的算法,而深度学习模型的应用效果与领域知识极其相关,因此在盲文信息处理问题上的深度学习的建模与模型优化需要长期的探索研究工作,才能达到落地应用的性能要求。

记:语料库怎么建?主要难题在哪?

苏:语料库的建立就是往这个库里添加汉字。我们依据的是《人民日报》的数据,人工地把每一期《人民日报》的内容进行分词,然后添加到库里。语料库就相当于机器的一个知识库,知识库容量越大,那么机器能学到的知识就越多,能翻译的内容就越多,翻译的准确率也就越高,也就是语料库的大小直接决定了翻译的准确率。建好语料库之后让机器去深度学习,它学会了,在翻译的时候就知道该在哪个地方进行分词了。我们的目标是把近10年的《人民日报》都添加到库里,但目前我们只做了三四年的,人力有限。

建语料库的人必须是既懂盲文、又懂盲文分词连写的,这方面的人太少了。现在这方面的人才基本都集中在中国盲文出版社,所以我们和中国残疾人联合会、中国盲人协会还有中国盲文出版社联合,返聘了中国盲文出版社的两位退休人员,让他们来帮助我们建语料库。

记:请您解释一下盲文分词连写。

苏:汉语的字与字之间是没有空格的,但汉语拼音之间是有空格的,盲文是基于汉语拼音的,所以盲文之间一定是要有空格的,这与汉语不同。所以要把汉语转换成盲文,首先就要把分词分好,这看起来很简单,但实际上挺难的。例如南京市长江大桥,有些分词不准确的软件就会转换成南京、市长、江大桥,这对人工阅读不是什么问题,通过上下文的阅读就能识别清楚,但怎么能让机器自动把这个分词分出来,这在自然语言的处理上是一个比较难、也比较热门的问题,因为无论是做搜索引擎,还是做语音合成、语音识别,分词都是一个最基本的步骤。

另外一个,一般大家研究的都是标准分词,而盲文分词和标准分词还是不太一样的。在汉语里我们认为是一个词的,在盲文里就要分开,反过来说,在汉语里我们认为应该分开的,在盲文里却又要连在一起,比如说四字成语,在汉语里我们认为四字成语就是一个词,但在盲文里要把四字成语按照音节分开,分成两部分、三部分,这就增大了算法的难度。

记:平台的研发团队有哪些人?

苏:有四位老师,屈志毅老师,许存禄老师,林和老师,还有我;有这些年毕业的、在读的二三十个研究生;还有做创新创业项目、 政学者项目的一些本科生。

记:平台研发、运行的经费来源是什么?

苏:之前最主要就是中国残疾人联合会、中国盲人协会、中国盲文出版社的经费,大概资助了300多万。但从长远来看,这不能作为唯一的经费来源,所以我们也正在沟通,试图吸收民间资本,然后共同运营。

记:共同运营的模式是什么样的?

苏:平台能把英语、汉语、乐谱等转换成盲文,这个转换过程是免费的,任何访问网站的人都可以使用这个功能。但要把翻译出来的盲文刻印出来,这个就是我们和公司共同运营的合作点所在,例如给餐馆翻译刻印盲文菜单,给盲校翻译刻印教辅书,给制药厂翻译刻印药品说明书,等等,市场是很广大的。这应该是我们可持续发展的一个比较好的方向。

记:平台未来努力的目标是什么?

苏:第一就是进一步提高转换的准确率,现在我们在90%-95%之间,力争以后达到更高吧。第二就是目前我们网站同时访问的最大承受能力是1千到1万人,如果将来有更多的盲人同时访问,恐怕我们系统的承受能力有限,所以要努力提高系统的承受能力。

记:咱们信息无障碍研究中心有没有瞄准未来其他的发展方向?

苏:有三个。第一是盲人电影,专业术语叫口述影像,解决盲人看电影的问题。现在盲人看电影需要旁边有人给他解说,我们尝试着要做的是通过人工智能技术自动给电影增加旁白,解说画面。

第二是研发报障信息系统。大家在访问一些网站或手机APP的时候会发现一些问题,但没有反馈渠道,这些网站和手机APP也不知道它自己存在哪些问题,这时候大家可以登录报障信息系统反馈问题,我们在平台上会定期总结发布,A网有多少个问题,B网有多少个问题,C网有多少个问题,以供网站改进。

第三是围绕信息无障碍做大数据白皮书。比如旅游类的网站信息无障碍做到什么程度了,购物类网站做到什么程度了,新闻类网站,等等,然后出一个总体的白皮书。

记:要做这么多的事,还存在哪些困难?

苏:就是资金支持较为有限。我前面也说了,中国盲文数字平台的研发花费了300多万,就这么一个大工程而言不算多,更重要的是要想做的更好离不开资金支持。资金的很大一部分用来建语料库,建语料库开销很大,我们现在只能返聘两位老师,如果有更多资金的支持就可以返聘更多人,那语料库的建立速度和质量都会大幅提升;资金的另外一个开销是购置高性能服务器,刚开始我们有五台服务器,后来满足不了我们的需要了,就开始购买阿里云服务,但也还无法满足研发及平台需求。

苏伟简介

苏伟,男,1977年生,中共党员,博士,河北省保定市望都县人,兰州大学信息无障碍研究中心主任,兰州大学文交奇誉人工智能实验室执行主任,兼任中国盲协国家通用盲文推广与研究委员会委员、中国盲协信息无障碍促进委员会委员、兰州市欧美同学会副会长。2001年本科毕业于兰州大学并留校工作,2004年开始在职攻读硕士研究生并硕博连读,2007-2009年在美国肯特州立大学进行联合博士培养,2010年获理学博士学位。2015-2017年在美国北卡州立大学进行科研访问交流。

苏伟先后主持国家自然科学基金、教育部-英特尔信息技术专项科研基金、美国肯特州立大学国际合作项目、中国盲人协会委托项目、中国盲文出版社委托等项目11项。2012年获人力资源部“留学人员科技活动项目择优资助”;2013年入选第二批 “兰州市急需紧缺高层次创新创业人才”。曾先后发表高水平科研论文50多篇,申请发明专利4项,获得软件著作权11项。先后主持开发了中国盲文数字平台 (服务全国1700万盲人)、基于Web数学公式编辑器MathEdit(10多个国家用户近5万人)、智能数学测试系统MathPASS(美国高校用户达1万多人)。主要研究方向为:信息无障碍方法、深度学习、知识工程、物联网。

(《兰州大学报》 2019年4月15日 第934期 第01版:新闻综合)

 

发现错误?报错
文:
图:
视频:
编辑:赵洋

推荐关注

阅读下一篇