在 信贷风控 领域,有一句行话:“发票是‘权’,流水是‘钱’。” 销项发票 代表了企业拥有收取货款的权利(业务发生了),银行流水 代表了真金白银的到账(钱袋子鼓了)。
但在实际操作中,很多骗贷企业是“跛脚”的:
- 有些企业狂开 增值税发票 刷流水,但银行账户里根本没钱进来(虚构贸易)。
- 有些企业账户里有大额资金进出,但全是 资金回流(自己转给自己),根本没有对应的发票支持。
单看任何一份材料,银行都容易被蒙蔽。 只有将这两份核心数据进行 交叉验证,才能看清企业的 经营稳定性。
今天我们探讨:如何利用 银行流水识别 和 发票OCR识别 技术,打破数据孤岛,构建一套自动化的“票款一致性”校验模型。
1. 痛点:数据是“割裂”的
信贷员拿到企业提供的材料通常是:
- 一堆 PDF 格式的 银行流水(几十页,包含成千上万条交易)。
- 一堆 进项发票 和 销项发票 的图片。
靠人工去把流水里的“每一笔入账”和发票里的“每一张单据”对应起来,是不可能的任务。 结果往往是:信贷员只看总数。只要“发票总额 ≈ 流水总额”,就放款了。 这给 虚假交易 留下了巨大的操作空间。
2. 核心技术一:银行流水的结构化清洗
首先,必须把 PDF/图片格式的流水变成数据。 银行流水识别 OCR 引擎需要解决“版式多变”的问题(工行、建行、招行格式各异)。
关键字段提取:
交易日期交易金额(进/出)对方户名(Counterparty Name):这是连接发票的桥梁。摘要(用途):用于剔除“理财赎回”、“借款”等非经营性流入。
3. 核心技术二:票款匹配算法 (Matching Algorithm)
拿到 OCR 数据后,系统开始执行 交叉验证。
逻辑 A:总量匹配(宏观风控)
- 公式:
匹配度 = (有发票支撑的流水总额) / 银行流水总入账。 - 判定:
- 如果
流水 >> 发票:可能存在 少开发票(逃税风险)或非经营性收入(如借高利贷来充账)。 - 如果
发票 >> 流水:典型 虚假交易。开了票但收不到钱,或者全是应收账款(坏账风险高)。
- 如果
逻辑 B:交易对手匹配(微观风控)
- OCR 提取:发票
购买方= “上海XX贸易公司”。 - 流水搜索:在银行流水中搜索
对方户名包含 “上海XX” 的所有入账记录。 - 时间窗校验:发票开具后 30-90 天内(正常账期),是否有对应金额的钱进来?
- 价值:如果一家企业声称有 1000 万销售,发票也是 1000 万,但流水里只有“张三”、“李四”打进来的零散资金,信贷风控 系统直接预警“贸易背景存疑”。
4. 深度风控:识别 资金回流 与 虚假交易
骗子最常用的手段是“走账”:A 公司打钱给 B 公司(伪造采购),B 公司扣点手续费后,把钱打回给 A 公司的股东个人卡,或者 A 的关联公司 C。
技术策略:
- 发票流向监控: OCR 识别 销项发票,发现主要客户是 B 公司。
- 资金闭环检测: OCR 识别 银行流水,发现大额资金流向 B 公司(名义是采购),但几天后,有相似金额从 C 公司(关联方)流回。
- 预警触发: 虽然有发票,也有流水,但资金在空转。 系统标记为 资金回流 嫌疑,建议进行 贷后管理 核查或直接拒贷。
5. 价值总结:信贷审批的“测谎仪”
通过 银行流水识别 与 发票OCR识别 的双重校验,银行构建了最坚固的防线:
- 去伪存真:发票是“承诺”,流水是“兑现”。只有两者吻合,才是真实的经营。
- 精准授信:对于那些 票款一致性 高的优质小微企业,银行敢于给更低的利率、更高的额度。
- 贷后预警:在放款后,持续监控每月的发票和流水增量。一旦发现 经营稳定性 下滑(如回款率暴跌),立即启动催收。
对于 风险总监 而言,这套 双保险 机制是应对经济下行周期、降低不良贷款率(NPL)的最佳技术手段。