发票智能处理 · Invoice Intelligence Pipeline
3-5 分钟 → 约 30 秒 · 格式 100% 合规
图片/PDF接入
自动识别类型
rapidocr引擎
语义解析
消费类型匹配
规范文件名
飞书PDF返回
OCR 提取购买方全名,自动取前两字(去"上海"前缀)
提取销售方全名,保留完整商户信息
根据商户名称 + 金额,LLM 自动推断消费类别
rapidocr-onnxruntime 纯Python方案,无需tesseract。零系统依赖,自适应降级。
发票文字→结构化字段。购买方、销售方、金额、发票号、税率逐字段提取。
金额、个人信息本地脱敏后才入云端推理链路。Pdftotext → rapidocr 双级降级。