艾巴生活网

您现在的位置是:主页>科技 >内容

科技

ai识别系统 AI中神奇的智能识别系统

2024-04-11 16:49:51科技帅气的蚂蚁
目前,智能OCR识别技术已经成功应用到生活的方方面面,比如小区出入口的车牌识别机,银行开户使用的银行卡识别,名片管理中的名片识别工具

ai识别系统 AI中神奇的智能识别系统

目前,智能OCR识别技术已经成功应用到生活的方方面面,比如小区出入口的车牌识别机,银行开户使用的银行卡识别,名片管理中的名片识别工具等等。智能OCR识别技术正在影响我们的生活。

那么我们来看看,OCR阅读的流程有哪些?

1.图像输入和预处理。

2.图像输入:对于不同的图像格式,有不同的存储格式和不同的压缩方法。预处理:主要包括二值化、去噪、倾斜校正等。

3.二值化:相机拍摄的大部分图片都是彩色图像,彩色图像包含了巨大的信息量。对于图片的内容,我们可以简单的分为前景和背景。为了让计算机更快更好地识别字符,我们需要先对彩色图像进行处理,只保留前景信息和背景信息。我们可以简单的定义前景信息为黑色,背景信息为白色,这是一个二值图像。

4.去噪:对于不同的文档,我们可以有不同的干噪定义。根据干噪的特点,称之为去噪。

5.倾斜校正:由于普通用户在拍摄文档时比较随意,拍摄的图片不可避免地会发生倾斜,这就需要文字识别软件进行校正。

6.版面分析:将文档图片分成段落和线条的过程称为版面分析。由于实际文档的多样性和复杂性,目前还没有固定的最优切割模型。

7.字符切割:由于拍照条件的限制,字符经常粘在一起,断笔,大大限制了识别系统的性能,这就需要字符识别软件的字符切割功能。

8.字符识别:这个研究是很久以前的事了。早先有模板匹配,后来以特征提取为主。由于受字符位移、笔画粗细、断笔、粘连、旋转等因素的影响,特征提取的难度受到很大影响。

9.版面恢复:人们希望识别出的文字仍然像原始文档图片一样排列,段落相同,位置相同,顺序相同输出到word文档,pdf文档等。这个过程称为布局恢复。

10.后处理和校对:根据特定语言语境的关系,对识别结果进行校正,即后处理。