ocr识别开源项目汇总
发表时间:2024-10-31 14:29:25
文章来源:超级管理员
浏览次数:3
Umi-OCR
特点:Umi-OCR是一款免费、开源的OCR软件,支持Windows和Linux平台。它具有离线运行的能力,无需网络连接,自带高效率的离线OCR引擎,支持多种语言识别库,并且支持命令行、HTTP接口等多种调用方式。功能包括截图OCR、批量OCR、PDF识别、二维码识别和公式识别。
体验链接:GitHub Releases
Zerox OCR
特点:Zerox OCR是一款功能强大的本地开源工具,基于GPT-4o-mini,能够高效处理复杂文档,并以Markdown格式输出,适合需要精确OCR处理的用户。
体验链接:在线体验
GOT-OCR2.0
特点:GOT-OCR2.0是一款通用OCR大模型,它将大模型引入到OCR中,使得多样化的文本识别成为可能,包括标准文本识别、格式化文本识别、细粒度OCR以及多页文档的OCR。模型轻量,端到端处理,输入多样性,输出灵活性。
体验链接:项目地址提供本地部署指导,项目地址
PaddleOCR
特点:PaddleOCR是百度开源的一套OCR工具库,旨在打造丰富、领先、且实用的OCR工具。它支持多种OCR相关前沿算法,并提供了产业级特色模型PP-OCR和PP-Structure,支持中英文识别,以及倾斜、竖排等多种方向的文字识别。
EasyOCR
特点:EasyOCR是一个用Python编写的OCR库,基于Tesseract,支持80多种语言。它使用支持CUDA的GPU来加速文本检测和OCR速度。
体验链接:DEMO地址
Tesseract OCR
特点:Tesseract是一款由HP实验室开发由Google维护的开源OCR引擎,支持多语言和多平台。
体验链接:Tesseract本身不提供在线体验,但可以通过其GitHub项目进行本地安装和体验。