做中国市场的 ToB(企业服务)软件有多难?很多做 SaaS 的同行大概都深有体会:客户不愿意为纯软件订阅持续掏钱、定制化需求深不见底、公有云产品的续费率(NDR)惨不忍睹。当海外的硅谷同行靠着标准化 API 赚得盆满钵满时,国内的 ToB 创业者往往陷在长周期的驻场交付里苦苦挣扎。

然而,在这样严苛的 ToB 环境下,OCR 与文档智能(IDP)赛道却跑出了好几家估值数十亿、甚至成功敲钟上市的头部企业(如合合信息、达观数据等)。

同样是做 ToB 软件,为什么这些文档智能公司不仅活下来了,还拿到了极高的市场溢价?剥开 AI 的技术外衣,我们从商业模式的底层来拆解:中国市场估值最高的这批 OCR 创业公司,到底掌握了哪些盈利密码?

一、 放弃“纯 SaaS 幻想”,拥抱高客单价的私有化交付

很多 ToB 创业者死磕“纯公有云 SaaS”,认为只有这样才能实现低成本的规模化复制。但这套海外市场的逻辑,在中国大型政企客户面前根本跑不通。

头部的 OCR 公司很早就认清了现实:中国最优质、最有支付能力的客户(银行、央企、政务部门),绝不可能把核心的财务凭证和商业合同传到公有云上。

他们做对了什么? 他们果断放下了“纯软件订阅”的执念,转向做极重的基础设施交付。尤其是随着 信创OCR 政策的落地,这些头部厂商顺势将原本部署在英伟达 GPU 上的庞大模型,硬生生塞进了基于鲲鹏、海光等国产芯片的物理隔离机房中。

通过交付包含底层国产算力适配、高可用架构和复杂版面分析能力的重型私有化平台,他们将原本几万块钱一年的 API 调用费,直接拉升成了几百万甚至上千万客单价的“企业级 IT 资产建设项目”。虽然交付重,但现金流极其健康,且一旦扎根,客户的替换成本极高,形成了坚固的商业壁垒。

二、 不卖“识别工具”,卖“数字化劳动力”(RPA+IDP 融合)

中国 ToB 市场的客户往往是“结果导向”的。如果你只提供一个 OCR API,告诉客户“我能把图片转成文字”,客户会觉得这只是个工具,不愿意付高价。客户真正愿意掏大钱的,是“你能帮我干掉几个审核员”。

他们做对了什么? 高估值的文档智能公司(如达观数据等)迅速完成了从“工具提供商”向“业务方案商”的跨越。他们不再单独售卖 OCR 引擎,而是将其与 RPA(机器人流程自动化)或规则引擎深度绑定。

交付给某大型银行的不再是“发票识别接口”,而是“自动化信贷录入机器人”。OCR 负责在前端把几百页的跨页财报、审计报告解析成结构化 Excel,后端的 RPA 自动将数据填入银行的信贷审批系统。这种按“数字员工”或“业务处理量”来计费的模式,直接对标了客户的人力成本节省,极大地提升了软件的溢价能力。

三、 把“定制化泥潭”变成“标准化平台”(授人以渔)

ToB 软件最大的利润杀手就是无休止的定制化。张家银行要识别特有对账单,李家医院要提取特殊病历卡。如果厂商每次都派算法工程师去驻场写规则、改代码,毛利率很快就会被交付成本吃光。

他们做对了什么? 头部 OCR 厂商利用机器学习的演进,巧妙地化解了“定制化”难题。他们在交付核心识别引擎的同时,给客户部署了一套零代码/低代码的小样本(Few-shot)训练平台

当业务线出现新的非标表单时,不再需要原厂排期开发。客户的业务员只需要在界面上圈注 20 到 50 张新表单,系统就能在局域网内自动微调出专属模型。这招“授人以渔”,不仅把沉重的模型定制工作转嫁给了客户侧,还让这套系统深度长在了客户的业务流里,彻底摆脱了靠堆人力做交付的死胡同。

四、 降维打击:从 C 端流量池向 B 端数据资产的变现

在所有 ToB 公司中,有一类(如合合信息旗下的扫描全能王/名片全能王)走出了极其罕见的“C2B”路线。

他们做对了什么? 他们先通过 C 端的免费或低价工具类 App,积累了海量的真实图像数据和文档版式,把底层的文字检测和图像预处理(如切边、去阴影)打磨到了极致。

更可怕的是,基于这些 C 端积累的庞大商业名片、企业多维图谱,他们成功地将自己从一家“做 OCR 软件的公司”转型为“做商业数据服务的公司”。他们在 B 端售卖的不再只是文字提取能力,而是基于文字提取背后的“企业尽调”、“防范欺诈”等高阶数据产品。软件有生命周期,但数据资产的壁垒是不可逾越的。

五、 “软硬一体”的终极防守策略

纯软件容易陷入价格战,而在公检法、政务大厅、海关等极度特殊的 ToB 场景里,最硬核的防守是“做厚”自己的交付边界。

他们做对了什么? 部分老牌的 OCR 巨头(如中安未来、文通科技等)死死咬住“软硬一体”的战略。他们深知,在政务专网里,脱离了前段的物理采集设备谈识别就是纸上谈兵。

他们将高度定制化的 信创OCR 算法,直接与国产护照阅读机、高拍仪、边缘计算盒子进行底层驱动级的深度融合。当竞争对手还在拿纯软件模型去竞标时,他们提供的是从柜台外设采集、端侧离线识别到后端数据上报的“一条龙硬件+软件方案”。这种重资产的打法,直接把只会写代码的互联网纯软玩家挡在了核心业务的大门外。

透过这 5 家头部 OCR 企业的盈利密码,我们可以看清中国 ToB SaaS 市场的残酷真相:

不要盲目崇拜硅谷那种轻量级的 PLG(产品驱动增长)和 API 计费模式。在中国做 ToB,真正的护城河往往藏在那些“脏活累活”里——去死磕纯国产底座的私有化适配,去把软件封装成能替代人力的解决方案,去用软硬一体的交付筑起物理高墙。

只有真正理解了大型政企的采购逻辑与安全底线,ToB 软件才能跳出价格战的泥潭,拿到属于自己的商业溢价。