一、提前退休的”认定之难”
只要你接触过特殊工种提前退休业务,就知道这有多复杂:从事高空、高温、井下、有毒有害等特殊工种的职工,可以提前 5 年退休。但认定需要证明——原始工资表、工种变更记录、职业健康档案……2024 年某省人社厅统计,特殊工种认定业务中,因材料不全被退回的比例高达 55%,平均认定耗时从 30 个工作日变成 60 个工作日。
这就是我们今天要聊的:OCR 如何让特殊工种认定从”反复跑”变成”一次办”。
二、历史档案的”数据黑洞”
做过人社信息化的同行都懂:
- 档案年代久远:大部分证明材料是 1980-2000 年的,纸张发黄、字迹褪色
- 手写体难识别:工资表、工种记录全是手写的,OCR 识别率低
- 字段不规范:”工种”有的写”电工”、有的写”电气维修”、有的写代码
2023 年我们给某省人社厅做特殊工种 OCR 项目,第一批测试时,关键字段识别准确率只有 72%。后来我们上了手写体专用模型 + 业务规则校验,才把准确率拉到 96%。
三、技术方案
1. 档案数字化
用专业档案扫描仪,300 DPI 彩色扫描,自动纠偏、去噪。10 万份档案,2 个月完成数字化。
2. OCR 识别
用手写体专用 OCR 引擎:
- 姓名、身份证号:准确率 99%
- 工种名称:准确率 95%
- 工作年限:准确率 97%
- 单位公章:自动检测,准确率 98%
3. 规则校验
用业务规则引擎校验:
- 特殊工种目录匹配:识别的工种必须在国家特殊工种目录内
- 工作年限计算:累计从事特殊工种年限是否达到 8-10 年
- 时间连续性:工作年限是否有中断
四、落地效果
这套系统在省级人社厅落地后的数据:
- 特殊工种认定平均耗时:从 60 个工作日降到 20 个工作日
- 材料退回率:从 55% 降到 8%
- 人工审核工作量:减少 70%
- 群众满意度:从 58% 提升到 91%
五、信创适配
操作系统:麒麟 V10、数据库:达梦 DM8、CPU:鲲鹏 920。单份档案识别耗时 2.3 秒。
六、下一步
2026 年,特殊工种认定应该做到:档案自动数字化、材料自动识别、年限自动计算,职工一次都不用跑。
(完)