信贷风控 领域,有一句行话:“发票是‘权’,流水是‘钱’。” 销项发票 代表了企业拥有收取货款的权利(业务发生了),银行流水 代表了真金白银的到账(钱袋子鼓了)。

但在实际操作中,很多骗贷企业是“跛脚”的:

  • 有些企业狂开 增值税发票 刷流水,但银行账户里根本没钱进来(虚构贸易)。
  • 有些企业账户里有大额资金进出,但全是 资金回流(自己转给自己),根本没有对应的发票支持。

单看任何一份材料,银行都容易被蒙蔽。 只有将这两份核心数据进行 交叉验证,才能看清企业的 经营稳定性

今天我们探讨:如何利用 银行流水识别 和 发票OCR识别 技术,打破数据孤岛,构建一套自动化的“票款一致性”校验模型。

1. 痛点:数据是“割裂”的

信贷员拿到企业提供的材料通常是:

  1. 一堆 PDF 格式的 银行流水(几十页,包含成千上万条交易)。
  2. 一堆 进项发票销项发票 的图片。

靠人工去把流水里的“每一笔入账”和发票里的“每一张单据”对应起来,是不可能的任务。 结果往往是:信贷员只看总数。只要“发票总额 ≈ 流水总额”,就放款了。 这给 虚假交易 留下了巨大的操作空间。

2. 核心技术一:银行流水的结构化清洗

首先,必须把 PDF/图片格式的流水变成数据。 银行流水识别 OCR 引擎需要解决“版式多变”的问题(工行、建行、招行格式各异)。

关键字段提取

  • 交易日期
  • 交易金额(进/出)
  • 对方户名(Counterparty Name):这是连接发票的桥梁。
  • 摘要(用途):用于剔除“理财赎回”、“借款”等非经营性流入。

3. 核心技术二:票款匹配算法 (Matching Algorithm)

拿到 OCR 数据后,系统开始执行 交叉验证

逻辑 A:总量匹配(宏观风控)

  • 公式匹配度 = (有发票支撑的流水总额) / 银行流水总入账
  • 判定
    • 如果 流水 >> 发票:可能存在 少开发票(逃税风险)或非经营性收入(如借高利贷来充账)。
    • 如果 发票 >> 流水:典型 虚假交易。开了票但收不到钱,或者全是应收账款(坏账风险高)。

逻辑 B:交易对手匹配(微观风控)

  • OCR 提取:发票 购买方 = “上海XX贸易公司”。
  • 流水搜索:在银行流水中搜索 对方户名 包含 “上海XX” 的所有入账记录。
  • 时间窗校验:发票开具后 30-90 天内(正常账期),是否有对应金额的钱进来?
  • 价值:如果一家企业声称有 1000 万销售,发票也是 1000 万,但流水里只有“张三”、“李四”打进来的零散资金,信贷风控 系统直接预警“贸易背景存疑”。

4. 深度风控:识别 资金回流虚假交易

骗子最常用的手段是“走账”:A 公司打钱给 B 公司(伪造采购),B 公司扣点手续费后,把钱打回给 A 公司的股东个人卡,或者 A 的关联公司 C。

技术策略

  1. 发票流向监控: OCR 识别 销项发票,发现主要客户是 B 公司。
  2. 资金闭环检测: OCR 识别 银行流水,发现大额资金流向 B 公司(名义是采购),但几天后,有相似金额从 C 公司(关联方)流回。
  3. 预警触发: 虽然有发票,也有流水,但资金在空转。 系统标记为 资金回流 嫌疑,建议进行 贷后管理 核查或直接拒贷。

5. 价值总结:信贷审批的“测谎仪”

通过 银行流水识别发票OCR识别 的双重校验,银行构建了最坚固的防线:

  1. 去伪存真:发票是“承诺”,流水是“兑现”。只有两者吻合,才是真实的经营。
  2. 精准授信:对于那些 票款一致性 高的优质小微企业,银行敢于给更低的利率、更高的额度。
  3. 贷后预警:在放款后,持续监控每月的发票和流水增量。一旦发现 经营稳定性 下滑(如回款率暴跌),立即启动催收。

对于 风险总监 而言,这套 双保险 机制是应对经济下行周期、降低不良贷款率(NPL)的最佳技术手段。