I N V O I C E   E N G I N E
01 / 05
← → 键 / 滚轮 / 点击切换

工作流01

发票智能处理 · Invoice Intelligence Pipeline

3-5 分钟 → 约 30 秒 · 格式 100% 合规

处理管线 · 7 步全自动

STEP 1

文件上传

图片/PDF接入

STEP 2

格式判别

自动识别类型

STEP 3

OCR识别

rapidocr引擎

STEP 4

字段提取

语义解析

STEP 5

类别推断

消费类型匹配

STEP 6

命名归档

规范文件名

STEP 7

推送分发

飞书PDF返回

命名规范 · 自动匹配

购买方名称_销售方全名_消费类型_金额_发票号.pdf

购买方

OCR 提取购买方全名,自动取前两字(去"上海"前缀)

销售方

提取销售方全名,保留完整商户信息

消费类型

根据商户名称 + 金额,LLM 自动推断消费类别

技术细节

OCR引擎

rapidocr-onnxruntime 纯Python方案,无需tesseract。零系统依赖,自适应降级。

字段解析

发票文字→结构化字段。购买方、销售方、金额、发票号、税率逐字段提取。

数据安全

金额、个人信息本地脱敏后才入云端推理链路。Pdftotext → rapidocr 双级降级。

~30s
单张处理时间
100%
格式合规率
7步
全链路自动化

效果验证

人工处理:3-5 分钟/张,格式靠人工校对,易出错

系统处理:约 30 秒/张,格式 100% 合规,零人工介入

效率提升 6-10 倍,错误率归零