这项技术解锁了全球档案,让那些早已被遗忘的尘封典籍触手可及,任何拥有联网设备的人都能触及。比如看看谷歌图书或古腾堡计划。

银行业使用OCR处理贷款文件、存入支票及处理其他金融交易。医院使用OCR管理患者记录和保险付款。物流公司使用OCR来跟踪包裹标签、发票和收据。

虽然付费OCR工具提供最准确的处理量和处理大量文本的能力,但网上有许多免费的OCR工具可供选择。例如,Google Drive有OCR功能,可以用来将图片转换为文本。如果你需要经常使用OCR,有付费的更准确服务,比如Adobe Acrobat Pro或Nitro PDF Pro。

OCR今天有什么相关性?
随着生成式人工智能席卷经济,大型语言模型(LLM)如ChatGPT需要大量数字化文本进行训练——模型本质上是“阅读”文本,学习词语之间的关系并内化其中的知识。

早期的大型语言模型主要基于已在互联网上以数字格式公开获取的文本进行训练。但OCR过程的数字化文本也可以用于训练大型语言模型和其他大型人工智能系统。构建专业LLM的公司正在利用OCR将技术手册和其他印刷材料转换为数字化文本,用于训练或微调模型。

底线

OCR已成为数字化、归档、搜索和共享大量文本信息的不可或缺技术,使此前手动数据录入实现自动化,同时解锁了对历史档案的访问,丰富了日益强大的人工智能系统。

虽然没有技术是完美的,但如今的OCR工具为大规模企业数据处理和个人数字化需求提供了高效、节约成本和便利。随着技术的不断进步,OCR有望进一步打破无障碍障碍,彻底改变我们与周围海量文本的界面方式。