▎项目介绍:一个多模态 OCR 系统,专门用于从复杂的教育材料,如考试试卷中提取结构化数据,以优化机器学习训练。
支持多种语言,包括日语、韩语和英语,能够处理数学公式、表格、图表等元素,并生成适合 AI 的 JSON 或 Markdown 格式输出。
▎项目地址:点击打开
▎项目功能:文档解析和提取
▎项目介绍:一个文档解析和提取 API,支持将 PDF 或图片文件转换为结构化的 JSON 或 Markdown 格式。
它利用了先进的 OCR 技术和 Ollama 支持的语言模型来实现高精度文本转换和去除敏感信息。
支持离线运行、分布式任务处理、Redis 缓存、CLI 操作工具以及对图片中的表格、数学公式的处理。
▎项目地址:点击打开
🔎 Surya - 开源多功能文档 OCR 工具包
▎项目功能:OCR 文本识别
▎项目介绍:一个开源 OCR 工具,能够处理超过90种语言的文本识别,支持图像和 PDF 格式文档的文字提取、布局分析以及行检测。
支持批量处理,并针对 GPU 优化,能够提高处理效率,还提供了交互式界面让用户更方便地测试功能。
Surya 的主要功能包括识别文档中的文本行、标题、图像、页眉等元素,并通过 JSON 格式输出结果。
▎项目地址:点击打开
▎项目功能:OCR 文字识别
▎项目介绍:一款基于 PaddleOCR 重构,并且脱离 PaddlePaddle 深度学习训练框架的轻量级 OCR 模型,推理速度超快。
在算力有限,精度不变情况下使用 paddleOCR 转成 ONNX 模型,进行重新构建的一款可部署在 arm 架构和 x86 架构计算机上的 OCR 模型,在同样性能的计算机上推理速度加速了 4-5 倍。
▎项目地址:点击打开
▎软件功能:图像内容识别
▎软件平台:#Web #Windows #macOS #Linux
▎软件介绍:一款开源 Python3 工具,可以识别图片中的版面、表格、图片、文字、数学公式等内容,并整合所有内容后以 Markdown 格式输出。
它是 Mathpix 的免费替代品,可将视觉内容无缝转换为基于文本的表述,支持 80 多种语言。
P2T 也可以把一整个 PDF 文件(PDF 的内容可以是扫描图片或者其他任何格式)转换为 Markdown 格式。
网页版每人每天可以免费识别 10000 个字符,正常使用应该够用了。
▎在线体验:点击打开
▎网站版本:点击打开
▎相关推荐:
▎软件下载:点击下载
🔎 WeOCR - 一个极简无需安装的 OCR 工具
▎网站功能: 图片文字提取
▎网站介绍: 一个极简的 OCR 工具,无需安装,支持离线图片文字提取。
只需上传或直接粘贴,即可识别图片文字,无需网络,本地处理,目前支持Tesseract,支持多语言。
▎网站网址: 点击打开
✈️ 频道导航 —— 资源目录
频道主要分享免费资源,实用软件、开源项目、网站工具。
🗒 Telegram 中文语言包
💡 Telegram 新手教程
📁 标签分类
#网站 #软件 #插件 #脚本
#开源 #工具 #辅助 #导航
#教程 #科普 #编程 #翻墙
#音频 #图像 #镜像 #笔记
#网盘 #邮箱 #解析 #传输
#磁力 #接口 #规则 #备份
#外语 #翻译 #限免 #系统
#爬虫
#音乐 #影视 #动漫 #漫画
#小说 #游戏 #杂志 #期刊
#趣站 #书源 #字体 #素材
#设计 #艺术 #壁纸 #古籍
#字幕 #博客 #新闻
#合集
#电子书 #第三方 #浏览器 #播放器
#纪录片 #输入法 #虚拟机 #直播源
#白噪音 #博物馆 #搜索引擎
#AI #BT
#BOT #API #IPA #RSS
#OCR #TTS #PDF
#IPTV
#GitHub #TVBox #ChatGPT
#Web #Android #iOS
#Windows #macOS #Linux
#TV #tvOS
#Chrome #Firefox #Edge #Safari
#Tampermonkey
#Telegram
👤 联系方式
网站 软件 插件 脚本 开源 工具 辅助 导航 教程 科普 编程 翻墙 音频 图像 镜像 笔记 网盘 邮箱 解析 传输 磁力 接口 规则 备份 外语 翻译 限免 系统 爬虫 音乐 影视 动漫 漫画 小说 游戏 杂志 期刊 趣站 书源 字体 素材 设计 艺术 壁纸 古籍 字幕 博客 新闻 合集 电子书 第三方 浏览器 播放器 纪录片 输入法 虚拟机 直播源 白噪音 博物馆 搜索引擎 AI BT BOT API IPA RSS OCR TTS PDF IPTV GitHub TVBox ChatGPT Web Android iOS Windows macOS Linux TV tvOS Chrome Firefox Edge Safari Tampermonkey Telegram
🔍 OLOCR
▎网站功能: 在线 OCR 文字识别
▎网站介绍: OLOCR 提供免费无限制的在线图像 OCR 和 PDF OCR 服务,支持批量处理和多种语言。
▎网站链接: https://olocr.com/
📣 频道: @LCGFX