1974年,雷·库兹韦尔创立了库兹韦尔计算机产品公司(Kurzweil Computer Products, Inc.),该公司研发的全字体OCR产品几乎可以识别任何字体的文本。他认为这项技术的最佳应用是 为视障人士开发机器学习 (ML)设备,于是他创造了一台能够以文本转语音格式朗读文本的阅读机。1980年,库兹韦尔将公司出售给了施乐公司,后者当时正致力于进一步将纸质文本转换为计算机文本的商业化。

光学字符识别(OCR)技术在20世纪90年代初随着历史报纸的数字化而开始流行。此后,该技术经历了多次改进。如今,相关产品能够提供近乎完美的OCR识别精度。先进的方法还可以实现复杂 文档处理工作流程的自动化。

在OCR技术出现之前,对文档进行数字化格式化的唯一方法是手动重新输入文本。这种重复输入不仅耗时,而且不可避免地会出现不准确和拼写错误。如今,OCR服务已广泛普及。例如,可以使用Google Cloud Vision OCR扫描文档并将其存储在智能手机上。