OCR并非百分之百准确,文本提取过程中可能出现错误。像画质差、格式复杂、字体花哨等都会影响准确性。文档中的非文本元素——如图片、图表、标志、签名等——如果不含可解读文本,OCR会忽略它们。与此同时,通过OCR从大量文档中提取文本,如果没有自动化,可能会变得耗时且成本高昂。大量工作量可能需要额外的工作流程管理。