# 购房提取自动化:OCR 识别房产证 + 合同双证

一、”我买了房,想提公积金,怎么弄?”

2024 年 8 月,小李在公积金窗口遇到了这样的对话:

“我要提公积金,买房了。”

“好的,请提供购房合同、房产证、购房发票、身份证、银行卡。”

“房产证还没办下来,只有合同,能提吗?”

“那不行,必须有房产证。”

“开发商说房产证要一年后才能办下来,我这一年都不能提?”

“按规定是这样。或者您等房产证办下来再来。”

小李很郁闷:首付掏空了积蓄,月供压力山大,公积金里有 15 万却提不出来,就因为”房产证还没办下来”。

这样的场景,每天都在公积金窗口上演。

问题出在哪里?出在”材料核验”的逻辑上。

传统逻辑:

  • 购房合同 → 可能虚假(无法验证)
  • 房产证 → 官方核发(可信)
  • 所以:必须房产证

但现实是:

  • 房产证办理周期长(6 个月 -2 年)
  • 群众购房后资金压力大
  • 公积金”看得见、用不着”

2025 年 1 月,某市公积金中心启动”购房提取自动化”改革。核心思路:

OCR+ 数据共享,替代”房产证”这个单一信任锚点。

二、技术方案:双证核验 + 数据交叉验证

#### 传统核验 vs 自动化核验

传统核验:

“`

群众提交:购房合同 + 房产证

窗口审核:

  • 肉眼看合同(无法验真)
  • 肉眼看房产证(无法验真)
  • 相信群众(赌不会造假)

风险:虚假材料难以发现

“`

自动化核验:

“`

群众提交:购房合同(拍照/上传)

系统处理:

  • OCR 识别合同关键信息
  • 对接网签系统验真(合同编号)
  • 对接不动产系统验真(房屋信息)
  • 对接税务系统验真(发票信息)
  • 多源数据交叉验证

风险:造假成本极高(需攻破多个系统)

“`

#### 购房合同 OCR 识别

购房合同是住建部示范文本,版式相对统一。

关键信息提取:

“`json

{

“contract_no”: “GF-2024-0012345”,

“buyer”: {

“name”: “张三”,

“id_no”: “110101199001011234”

},

“property”: {

“address”: “XX 市 XX 区 XX 路 XX 号 XX 小区 X 栋 X 单元 X 层 X 号”,

“area”: “89.5”,

“price”: “1580000.00”

},

“developer”: {

“name”: “XX 房地产开发有限公司”,

“unified_social_credit”: “91110000MA00XXXX”

},

“sign_date”: “2024-08-15”

}

“`

识别技术:

“`

1. 版式检测

  • 检测合同首页(有”商品房买卖合同”标题)
  • 检测合同页码(共 X 页第 Y 页)

2. 字段定位

  • 使用模板匹配(标准合同模板)
  • 关键字段坐标预定义

3. 文字识别

  • 打印体:标准 OCR(准确率>99%)
  • 手写体:手写 OCR 模型(准确率>92%)

4. 信息校验

  • 合同编号格式校验
  • 身份证号校验(校验码)
  • 金额大小写一致性校验

“`

#### 房产证 OCR 识别

部分群众已有房产证,可上传房产证加速办理。

关键信息提取:

“`json

{

“certificate_no”: “京(2024)XX 区不动产权第 1234567 号”,

“owner”: “张三”,

“co_owner”: “李四”,

“property_type”: “国有建设用地使用权/房屋所有权”,

“address”: “XX 市 XX 区 XX 路 XX 号 XX 小区 X 栋 X 单元 X 层 X 号”,

“area”: “89.50”,

“register_date”: “2024-09-20”

}

“`

识别技术:

“`

房产证是自然资源部统一版式,识别难度低。

  • 使用专用模板识别
  • 同时对接不动产数据库验真
  • 识别 + 验真双重保障

“`

#### 数据交叉验证

OCR 识别只是第一步,关键是通过数据共享交叉验证。

验证流程:

“`

OCR 识别合同信息

验证 1:网签系统

  • 输入:合同编号
  • 查询:合同备案信息
  • 校验:买受人、房屋坐落、金额是否一致

验证 2:不动产系统

  • 输入:房屋坐落 / 合同编号
  • 查询:房屋登记信息
  • 校验:开发商、面积是否一致

验证 3:税务系统

  • 输入:购房发票代码 + 号码
  • 查询:发票验真
  • 校验:金额、购买方是否一致

验证 4:公积金系统内部

  • 查询:申请人历史提取记录
  • 校验:是否已提取过(同一套房只能提一次)

“`

验证结果:

“`

全部通过 → 自动审核通过

部分不通过 → 转人工审核

全部不通过 → 拒绝,告知原因

“`

三、系统架构:如何对接 4 个外部系统

#### 对接架构

“`

公积金提取系统

政务数据共享平台

├→ 住建部门(网签系统)

├→ 自然资源部门(不动产系统)

├→ 税务部门(发票查验)

└→ 公安部门(身份信息)

“`

#### 接口设计

1. 网签系统接口

“`javascript

// 请求

POST /api/contract/verify

{

“contract_no”: “GF-2024-0012345”,

“city_code”: “110000”

}

// 响应

{

“status”: “success”,

“data”: {

“contract_no”: “GF-2024-0012345”,

“buyer”: “张三”,

“property_address”: “XX 市 XX 区…”,

“area”: “89.5”,

“price”: “1580000.00”,

“sign_date”: “2024-08-15”,

“status”: “已备案”

}

}

“`

2. 不动产系统接口

“`javascript

// 请求

POST /api/property/query

{

“id_no”: “110101199001011234”,

“city_code”: “110000”

}

// 响应

{

“status”: “success”,

“data”: {

“properties”: [

{

“certificate_no”: “京(2024)XX 区不动产权第 1234567 号”,

“owner”: “张三”,

“address”: “XX 市 XX 区…”,

“area”: “89.50”,

“register_date”: “2024-09-20”

}

]

}

}

“`

3. 税务发票接口

“`javascript

// 请求

POST /api/invoice/verify

{

“invoice_code”: “1100191130”,

“invoice_no”: “12345678”,

“amount”: “1580000.00”,

“date”: “2024-08-15”

}

// 响应

{

“status”: “success”,

“data”: {

“verified”: true,

“buyer”: “张三”,

“amount”: “1580000.00”,

“item”: “XX 小区 X 栋 X 单元 X 层 X 号”

}

}

“`

#### 异常处理

场景 1:网签系统查不到

“`

可能原因:

  • 合同尚未备案(开发商未办理)
  • 合同编号输入错误
  • 网签系统故障

处理策略:

  • 提示群众”合同尚未备案,请联系开发商”
  • 或转人工审核(上传合同照片)

“`

场景 2:不动产系统查不到

“`

可能原因:

  • 房产证尚未办理(正常)
  • 房屋尚未登记(正常)
  • 不动产系统故障

处理策略:

  • 允许无房产证提取(只要有网签)
  • 降低提取额度(如 50%,待房产证办理后补足)

“`

场景 3:发票验真失败

“`

可能原因:

  • 发票尚未开具
  • 发票信息输入错误
  • 税务系统故障

处理策略:

  • 允许后补发票(先提取,30 天内补传)
  • 或转人工审核

“`

四、实战效果:从 15 天到 1 天

#### 效率对比

| 环节 | 传统流程 | 自动化流程 | 提升 |

|——|———-|————|——|

| 材料准备 | 60 分钟 | 5 分钟(拍照上传) | 12 倍 |

| 窗口提交 | 15 分钟 | 0 分钟(全程网办) | – |

| 人工审核 | 15 分钟 | 2 分钟(自动审核) | 7.5 倍 |

| 等待房产证 | 6-24 个月 | 0 天(有网签即可) | – |

| 办理周期 | 15 工作日 | 1 工作日 | 15 倍 |

#### 业务数据(上线后 6 个月)

  • 月均购房提取:8500 笔
  • 全程网办比例:82.3%
  • 自动审核通过率:76.5%
  • 平均办理周期:从 15 天降至 1.2 天
  • 群众跑腿次数:从 2.5 次降至 0.2 次
  • 窗口人力释放:从 45 人降至 15 人(释放 30 人)
  • 群众满意度:从 71% 提升至 94%

#### 风险防控

上线前担心:放开房产证要求,会不会导致骗提?

上线后数据:

  • 疑似骗提案例:12 起/月(自动化识别)
  • 确认骗提:3 起/月(人工核实)
  • 骗提率:0.035%(极低)
  • 追回资金:18.5 万元

原因:多源数据交叉验证,造假成本极高。

五、踩过的坑

坑 1:合同 OCR 识别错误

部分合同扫描质量差,识别错误。

解决:图像质量检测;识别结果群众可在线修正。

坑 2:网签数据延迟

开发商网签后,数据同步到共享平台有延迟(1-3 天)。

解决:提示群众”网签数据同步中,请稍后重试”。

坑 3:历史合同无法核验

2020 年前的合同未录入网签系统。

解决:老合同允许上传照片(OCR 识别)+ 人工审核。

坑 4:异地购房核验难

A 市公积金中心查不到 B 市网签数据。

解决:推动省级/全国数据共享;暂未打通的允许上传材料。

六、结语

购房提取自动化,看似是个技术升级,实则是服务理念的改变。

从”必须房产证”到”网签即可”,从”群众跑腿”到”数据跑路”,从”人工审核”到”自动核验”——改变的不仅是流程,更是对群众的信任。

当小李不再需要等一年房产证,当 82% 的购房提取实现全程网办,当 30 名工作人员从重复劳动中解放出来——技术的温度,就体现在这些改变里。

OCR 识别房产证 + 合同双证,只是购房提取自动化的一小步。但当这一小步迈出去,群众的获得感、幸福感、安全感,就是实实在在的。

这,就是政务数字化转型的意义。