自1974年首个商业系统问世以来, OCR技术已 取得了显著进步,并且仍在不断发展。优秀的OCR程序即使在字体不规则、分辨率不足、移动设备拍摄光线不佳以及颜色和背景复杂等不利条件下,也能从文档中提取关键信息。

通过融合 计算机视觉 和 自然语言处理技术,并改进信息表示和模型优化,企业如今可以享受到最先进的文档理解能力。这些改进包括分析复杂文档的布局和阅读顺序,理解视觉元素并将其表示为图表。一些OCR程序现在由生成式人工智能驱动,以更快地构建文档数据。一项“老”技术也在不断学习新的技巧。