开源OCR产品的劣势
发表时间:2024-10-31 14:29:27
文章来源:超级管理员
浏览次数:2
开源OCR项目虽然提供了灵活性和成本效益,但它们也有一些劣势和限制,以下是一些常见的问题:
PaddleOCR
使用的训练模型基于百度公司自己的PaddlePaddle框架,对于小公司来说并不主流(对比于TensorFlow或者PyTorch),这可能限制了后续其他深度学习工作的铺垫。
项目整体比较复杂,学习成本较高。
对于部分符号识别效果一般,如将'|'识别为'1'。
对于部分加粗字体可能出现误识别,需要自己补充训练。
偶尔会出现部分内容丢失的情况。
劣势:
Tesseract OCR
不是专门针对中文场景,中文识别效果差。
相关文档主要是英文,对于阅读和理解起来有一定困难。
学习成本比较高,源码较多,并且部分源码是C++,学习起来难度比较大。
劣势:
EasyOCR
从官方的页面体验来说识别的速度较慢。
相关的官方文档是基于英文的,学习难度较高,对于新手不太友好。
由于模型较大,EasyOCR的内存占用较高。
劣势:
chineseocr_lite
不支持补充训练。
对大图片识别速度较慢。
文本位置识别略差。
类手写字体识别效果一般。
部分场景下会出现误识别竖版文字的情况。
劣势:
CnOCR
部分符号识别效果差。
部分场景下会出现空格丢失情况。
模型补充训练没有PaddleOCR方便。
劣势:
chineseocr
项目较老,使用的三方库较老,部分三方库已废弃,环境配置困难。
中文ocr识别效果一般。
不支持pip安装。
劣势: