#GitHub #OCR #API📁 pdf-extract-api - 高精度文档解析和提取 API▎项目功能

#GitHub #OCR #API

📁

pdf-extract-api - 高精度文档解析和提取 API

▎项目功能：文档解析和提取

▎项目介绍：一个文档解析和提取 API，支持将 PDF 或图片文件转换为结构化的 JSON 或 Markdown 格式。

它利用了先进的 OCR 技术和 Ollama 支持的语言模型来实现高精度文本转换和去除敏感信息。

支持离线运行、分布式任务处理、Redis 缓存、CLI 操作工具以及对图片中的表格、数学公式的处理。

▎项目地址：点击打开