阅读新闻

少数民族文字可自动识别输入电脑

[日期:2007-01-31] 来源:  作者:丹青 [字体: ]
全球首款在统一平台上支持中国几个少数民族文字文档的识别系统,于周一(29日)在北京清华大学通过专家鉴定。

  这种少数民族文字文档识别系统通过一种叫做OCR的光学字符识别手段,利用光学技术对文字或字符进行扫描识别,并转换成计算机内码。

  该系统能将用汉语、蒙语、藏语、韩语、维吾尔语、哈萨克语和吉尔吉斯语写成的文字,转化成一种能够让计算机"认识"、"理解"的信息。

  清华大学丁晓青教授介绍说,这个系统可扩展到各少数民族文字和文档的自动识别及计算机输入问题,基本能够解决少数民族文字文档识别问题。同时该系统还支持阿拉伯文的识别。

  丁教授说,这种少数民族文字文档识别系统能够处理多种少数民族文字,文本切分识别率可达96.2%。

  目前,这项技术已经通过中国科学院和中国工程学院及多家学术机构的评估和鉴定。

  参加评估的一位中国工程学院专家表示,这项技术可以大大加快少数名族文字资料的保护进程,并促进中国少数名族对信息技术的运用。

  据悉,清华大学、内蒙古大学、内蒙古师范大学、新疆大学、西北民族大学的40多位科研人员参与了这套系统的研制,前后历时八年。



阅读:
录入:丹青

评论 】 【 推荐 】 【 打印
上一篇:76GS遇强敌 高频X1650XT偷袭666元市场
下一篇:Windows Vista OEM版只需300元?
本文评论       全部评论
发表评论

字数
姓名:

 
新闻查询