OCR

2023-08-29

OCR(Optical Character Recognition)全称光学字符识别,是指通过检测图片中文字暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程;即针对印刷体字符,采用光学的方式将纸质文档中的文字转换成为黑白点阵的图像文件,并通过识别软件将图像中的文字转换成文本格式,供文字处理软件进一步编辑加工的技术。衡量一个OCR系统性能好坏的主要指标有:拒识率、误识率、识别速度、用户界面的友好性,产品的稳定性,易用性及可行性等。

OCR在识别文字的同时还包括下面一些功能:

• 能处理不同的图像格式,不同的存储格式,不同的压缩方式的图像;

• 对于不同的文档,根据不同的噪声的定义可以方法对图像进行噪声去除;

• 由于一般用户,在拍摄文档时,都比较随意,因此拍照出来的图片不可避免的产生倾斜,OCR可以对图像进行倾斜较正;

• 对图片识别内容进行分段落,分行等版面分析。

预约演示

扫码关注

电话咨询

返回顶部