2024/11/14
请收藏本页。如果阁下可以点击广告支持我们,我们将不胜感激。
光学字符识别 (OCR)
是将打字、手写或打印文本的图像以电子或机械方式转换为机器编码的文本,无论是来自扫描文档、文档照片还是场景照片(例如,风景中的标志和广告牌上的文本)照片),或来自叠加在图像上的字幕文本(例如:来自电视广播)。
广泛用于从打印的纸质记录中输入数据——无论是护照、发票、银行对账单、计算机化收据、名片、邮件、静态数据的打印件或任何其他合适的文档——它是一种将打印文本数字化的常用方法,因此它们可以以电子方式编辑、搜索、更紧凑地存储、在线显示以及用于机器过程,例如认知计算、机器翻译和(提取)文本到 sp OCR 是模式识别研究的一个子领域,包括人工智能和计算机视觉。
早期版本需要使用单个字符的照片进行培训,并且一次使用一种字体。能够为大多数字体提供高度识别精度的高级系统现在已广泛使用,接受多种数字图片文件格式作为输入的系统也是如此。某些系统能够复制与原始页面尽可能相似的格式化输出,包括图形、列和其他非文本组件。