15321537236

{label:logot1}

OCR技术

您当前位置>首页 >> OCR技术 >> 开源OCR

ocr识别开源项目汇总

发表时间:2024-10-31 14:29:25

文章来源:超级管理员

浏览次数:3


以下是一些流行的开源OCR项目,以及它们的特点和体验链接:

  1. Umi-OCR

    • 特点:Umi-OCR是一款免费、开源的OCR软件,支持Windows和Linux平台。它具有离线运行的能力,无需网络连接,自带高效率的离线OCR引擎,支持多种语言识别库,并且支持命令行、HTTP接口等多种调用方式。功能包括截图OCR、批量OCR、PDF识别、二维码识别和公式识别。

  2. Zerox OCR

    • 特点:Zerox OCR是一款功能强大的本地开源工具,基于GPT-4o-mini,能够高效处理复杂文档,并以Markdown格式输出,适合需要精确OCR处理的用户。

    • 体验链接在线体验

  3. GOT-OCR2.0

    • 特点:GOT-OCR2.0是一款通用OCR大模型,它将大模型引入到OCR中,使得多样化的文本识别成为可能,包括标准文本识别、格式化文本识别、细粒度OCR以及多页文档的OCR。模型轻量,端到端处理,输入多样性,输出灵活性。

    • 体验链接:项目地址提供本地部署指导,项目地址

  4. PaddleOCR

    • 特点:PaddleOCR是百度开源的一套OCR工具库,旨在打造丰富、领先、且实用的OCR工具。它支持多种OCR相关前沿算法,并提供了产业级特色模型PP-OCR和PP-Structure,支持中英文识别,以及倾斜、竖排等多种方向的文字识别。

    • 体验链接超轻量PP-OCR mobile模型体验地址

  5. EasyOCR

    • 特点:EasyOCR是一个用Python编写的OCR库,基于Tesseract,支持80多种语言。它使用支持CUDA的GPU来加速文本检测和OCR速度。

    • 体验链接DEMO地址

  6. Tesseract OCR

    • 特点:Tesseract是一款由HP实验室开发由Google维护的开源OCR引擎,支持多语言和多平台。

    • 体验链接:Tesseract本身不提供在线体验,但可以通过其GitHub项目进行本地安装和体验。

这些开源OCR项目各有特点,适用于不同的应用场景和需求,用户可以根据自己的具体需求选择合适的工具进行体验和使用。


相关行业趣文查看更多