# 公积金提取”零材料”:OCR 如何减少纸质证明

一、”我要提公积金,需要带什么?”

这是公积金管理中心被问得最多的问题。

答案取决于提取类型:

购房提取:

  • 身份证
  • 购房合同
  • 房产证(或不动产权证书)
  • 购房发票
  • 银行卡

租房提取:

  • 身份证
  • 租赁合同
  • 房租发票(或收据)
  • 无房证明
  • 银行卡

退休提取:

  • 身份证
  • 退休证(或退休审批表)
  • 银行卡

大病提取:

  • 身份证
  • 诊断证明
  • 医疗费用发票
  • 医保报销结算单
  • 银行卡

每一份材料,都代表着一个部门的证明、一个窗口的盖章、一次跑腿的奔波。

2024 年,某市公积金中心统计:

  • 年度提取业务:28 万笔
  • 平均每笔材料数量:4.2 份
  • 材料总份数:117.6 万份
  • 因材料问题退件:15.3 万份(占比 13%)
  • 群众跑腿次数:平均 2.3 次/笔

“能不能少带点材料?”

2025 年 2 月,该市启动”公积金提取零材料”改革。核心思路:能通过数据共享获取的材料,群众不再提交;能通过 OCR 自动识别的材料,不再手工录入。

目标:让 80% 的提取业务实现”零材料”(仅需身份证)。

二、技术方案:OCR+ 数据共享的双轮驱动

#### “零材料”的实现路径

“`

传统流程:

群众准备材料 → 窗口提交 → 人工审核 → 办理

零材料流程:

群众刷身份证 → 系统自动调取数据 → OCR 识别必要材料 → 自动审核 → 办理

“`

关键在于:哪些材料可以”免提交”?

可以免提交的材料:

  • 身份证信息 → 公安人口库调取
  • 婚姻信息 → 民政部婚姻库调取
  • 房产信息 → 自然资源部不动产库调取
  • 社保信息 → 人社部社保库调取
  • 退休信息 → 人社部退休库调取

仍需提交的材料:

  • 购房合同(非标准格式,需 OCR 识别)
  • 租赁合同(非标准格式,需 OCR 识别)
  • 医疗发票(版式多样,需 OCR 识别)
  • 诊断证明(医院自制,需 OCR 识别)

策略:能共享的共享,不能共享的 OCR 识别。

#### 购房提取 OCR 方案

购房提取是最高频的提取类型(占比 45%)。

材料 1:购房合同

“`

合同关键信息:

  • 合同编号
  • 买受人(姓名、身份证号)
  • 房屋坐落
  • 建筑面积
  • 成交金额
  • 签订日期

OCR 方案:

  • 合同是标准格式(住建部示范文本)
  • 使用模板匹配 + 关键字段定位
  • 识别准确率目标:>98%

“`

材料 2:房产证/不动产权证书

“`

证书关键信息:

  • 证书编号
  • 权利人
  • 共有情况
  • 房屋坐落
  • 建筑面积
  • 登记日期

OCR 方案:

  • 证书是标准格式(自然资源部统一版式)
  • 使用专用模板识别
  • 同时对接不动产数据库验真

“`

材料 3:购房发票

“`

发票关键信息:

  • 发票代码、号码
  • 购买方
  • 金额
  • 开票日期

OCR 方案:

  • 使用医疗票据识别的同一套引擎
  • 发票类型:增值税发票/不动产销售发票
  • 同时对接税务发票查验平台

“`

#### 租房提取 OCR 方案

租房提取的难点在于:租赁合同非标准格式。

租赁合同 OCR:

“`

合同关键信息:

  • 出租方、承租方(姓名、身份证号)
  • 房屋坐落
  • 租赁面积
  • 租赁期限
  • 租金金额

技术挑战:

  • 合同格式不统一(中介合同/个人合同)
  • 手写填写普遍
  • 印章遮挡文字

解决方案:

  • 通用合同 OCR 模型(非模板匹配)
  • NLP 实体识别提取关键字段
  • 手写体专用模型
  • 识别准确率目标:>90%

“`

无房证明免提交:

“`

传统:群众跑不动产登记中心开具无房证明

现在:公积金系统直接对接不动产数据库

  • 输入:申请人身份证号
  • 查询:本市范围内房产登记信息
  • 输出:有房/无房状态

“`

#### 退休提取 OCR 方案

退休证 OCR:

“`

证书关键信息:

  • 姓名、性别、身份证号
  • 工作单位
  • 退休日期
  • 证书编号

OCR 方案:

  • 退休证版式相对统一(人社部指导格式)
  • 各省略有差异,建立省级模板库
  • 识别准确率目标:>97%

“`

退休审批表 OCR:

“`

部分人员无退休证,只有退休审批表。

审批表特点:

  • 表格形式
  • 打印 + 手写混合
  • 有单位公章、人社部门公章

OCR 方案:

  • 表格结构化提取
  • 打印体/手写体混合识别
  • 印章检测 + 去除

“`

三、系统架构:如何打通 5 个部门的数据

#### 数据共享架构

“`

公积金提取系统

↓ 数据请求

政务数据共享平台(统一接口)

├→ 公安人口库(身份信息)

├→ 民政部婚姻库(婚姻状态)

├→ 自然资源部不动产库(房产信息)

├→ 人社部社保库(参保信息)

└→ 人社部退休库(退休信息)

“`

#### 接口设计要点

1. 统一身份认证

“`

问题:5 个部门,5 套接口,认证方式不同

解决:通过政务数据共享平台统一对接

  • 单点登录(SSO)
  • 统一授权(OAuth 2.0)
  • 审计日志(谁、何时、查了什么)

“`

2. 数据缓存

“`

问题:每次提取都调接口,响应慢、成本高

解决:建立数据缓存层

  • 身份信息缓存 24 小时
  • 房产信息缓存 7 天
  • 婚姻信息缓存 30 天
  • 命中率目标:>80%

“`

3. 隐私保护

“`

问题:跨部门数据共享涉及隐私

解决:

  • 最小化原则(只查必要字段)
  • 授权原则(需申请人授权)
  • 脱敏原则(日志中脱敏)
  • 审计原则(全程可追溯)

“`

四、实战效果:从 4 份材料到 0 份材料

#### 材料减少对比

| 提取类型 | 传统材料 | 零材料后 | 减少 |

|———-|———-|———-|——|

| 购房提取 | 5 份 | 0 份* | 100% |

| 租房提取 | 5 份 | 1 份(合同) | 80% |

| 退休提取 | 3 份 | 0 份 | 100% |

| 大病提取 | 5 份 | 2 份(医疗票据) | 60% |

*购房合同、房产证、发票全部通过 OCR+ 数据共享获取

#### 效率提升

| 环节 | 传统流程 | 零材料流程 | 提升 |

|——|———-|————|——|

| 材料准备 | 30 分钟 | 0 分钟 | – |

| 材料提交 | 10 分钟 | 2 分钟(仅身份证) | 5 倍 |

| 人工审核 | 15 分钟 | 2 分钟(自动审核) | 7.5 倍 |

| 办理时间 | 5 分钟 | 5 分钟 | 持平 |

| 合计 | 60 分钟 | 9 分钟 | 6.7 倍 |

#### 业务数据(上线后 6 个月)

  • 月均提取业务:23000 笔
  • 零材料办理比例:78.3%
  • 平均办理时间:从 60 分钟降至 9 分钟
  • 群众跑腿次数:从 2.3 次降至 0.3 次
  • 窗口人力释放:从 85 人降至 32 人(释放 53 人)
  • 群众满意度:从 74% 提升至 95%

#### 成本节约

  • 人力成本:53 人×12 万/年 = 636 万元/年
  • 群众办事成本:按每笔节约 51 分钟、每小时 50 元计算,年节约 1173 万元
  • 纸张成本:按每份材料 0.5 元计算,年节约 50 万元
  • 社会总成本节约:约 1859 万元/年

五、踩过的坑

坑 1:数据共享接口不稳定

房产部门接口偶尔宕机,导致无法查询房产信息。

解决:降级策略——接口不可用时,允许群众上传房产证照片(OCR 识别)。

坑 2:合同识别准确率低

租赁合同手写内容多,识别率仅 75%。

解决:增加人工校验环节;识别结果群众可在线修正。

坑 3:历史数据缺失

部分早期房产未录入不动产数据库,查询不到。

解决:老房产允许上传房产证照片(OCR 识别)。

坑 4:跨市数据不通

A 市公积金中心查不到 B 市房产信息。

解决:推动省级数据共享平台建设;暂未打通的允许上传材料。

六、下一步:从”零材料”到”零跑腿”

当前实现了”零材料”,下一步要实现”零跑腿”。

1. 全程网办

“`

群众通过 APP/网站申请

OCR 识别上传材料(如有)

数据共享自动核验

自动审核通过

资金打入银行卡

“`

2. 无感办理

“`

满足条件的提取(如退休),系统自动触发:

  • 检测到参保人退休
  • 自动计算可提取金额
  • 推送消息提醒
  • 群众确认(或默认同意)
  • 自动打款

“`

3. 信用办理

“`

建立公积金信用体系:

  • 信用良好的群众:承诺制办理(先提取后核验)
  • 信用一般的群众:标准流程办理
  • 信用较差的群众:加强审核

“`

七、结语

“零材料”改革,听起来是个口号,背后却是实实在在的流程再造。

当群众不再需要为”带什么材料”而困惑,不再需要为”复印材料”而奔波,不再需要为”材料不全”而白跑——政务服务的温度,就体现在这些细节里。

OCR 技术和数据共享,只是手段。真正的目的,是让数据多跑路,让群众少跑腿。

当 78% 的提取业务实现”零材料”,当群众办事时间从 60 分钟压缩到 9 分钟,当 53 名工作人员从重复劳动中解放出来去做更有价值的事——技术的价值,才真正得以体现。

这,就是数字化转型的意义。