
能够“读懂”甲骨文的智能文字识别技术在世界人工智能大会上被展示出来。甲骨文是中国迄今发现的最早年代的成熟文字,是汉字的源头,是中华优秀传统文化的根脉。目前甲骨文大多以图片的形式出现在出版物中,这给文字检索带来了困难,今天的年轻人对甲骨文的意义却知之甚少。
智能文字识别技术,可以识别甲骨文,将形象丰富的甲骨文复制到龟甲上,再重新排列组合,“单身狗”“白富美”“买它买它”等网络热词被一一识别。
目前,行业内的的智能文字识别技术主要包括智能图像处理、基于深度学习的复杂场景文字识别、自然语言处理三个核心层。智能化图像处理技术主要对用户拍摄的复杂文档图像进行预处理,大大提高了文档图像质量。以深度学习为基础的复杂场景文字识别技术,主要利用该公司自主研发的手写印刷混排识别、抗强干扰识别、扭曲文字识别、复杂印章和手写识别等一系列先进的深度学习识别技术,解决各种不同复杂场景下文字识别问题。
甲骨文鉴定的难点在于甲骨残缺严重、材料难以获取、拓片清晰度低等难点,需要通过技术手段加以解决。比如,样本量少,从技术层面来看,需要解决训练样本少的问题。现在主要是初步研究,还有很多工作还在进行中。
据悉,目前的智能文字识别技术支持中、英、俄等56种语言的文件图像,快读智能100多种证件的智能分类,以及全球不同国家、不同行业的多种AI场景的产品和解决方案。






