- 上云资讯 -
2025-05-22 10:32:40 277人关注
百度飞桨PaddleOCR 3.0开源发布 OCR精度跃升13%
2025年5月20日,百度飞桨团队正式发布了PaddleOCR3.0版本,并对外开源。这一新版本在文字识别精度、多语种支持、手写体识别以及高精度文档解析等方面取得了显著进展,进一步提升了PaddleOCR在OCR领域的技术实力和应用价值。
2025-05-10 10:24:38 119人关注
英伟达开源新一代OCR代码推理 AI 模型,超越 OpenAIo3-Mini表现
英伟达在技术界引起广泛关注,正式发布了其最新的 Open Code Reasoning(OCR)模型套装。这一模型的推出,不仅展示了英伟达在人工智能领域的创新能力,也为开发者提供了强有力的工具,助力他们在代码推理和生成任务中取得更好的成绩。
2025-04-19 16:29:20 89人关注
ABBYY 推出全新 OCR API,助力开发者轻松提取文档数据
为了应对开发者在从商业文档中提取可靠数据方面日益增长的压力,ABBYY 于近日推出了 ABB Document AI™,该工具通过自助应用程序接口(API)提供服务。ABBYY Document AI API 的设计旨在提升开发者的使用体验,用户只需通过几行代码即可轻松将非结构化的商业文档转换为结构化的高精度数据,从而简化尝试、集成、学习和购买行业领先的光学字符识别(OCR)及智能文档处理(IDP)解决方案的过程。
2025-01-17 21:30:37 142人关注
百度飞桨PaddleOCR发布v2.8.0新版本 引入表格识别算法等方案
PaddleOCR v2.8.0作为飞桨深度学习开源框架下的文字识别开发套件,发布了里程碑式的更新。这个版本引入了前沿的OCR技术,包括PaddleOCR算法模型挑战赛的冠军方案,如场景文本识别算法SVTRv2和表格识别算法SLANet-LCNetV2,为OCR领域树立了新的标准。
2024-12-28 10:28:28 213人关注
OCR 2.0模型来了!图表、几何图形、音乐符号均转换为可编辑文本
最近,研究人员开发了一种新的通用光学字符识别(OCR)模型,名为 GOT(通用 OCR 理论)。在他们的论文中,首次提出了 “OCR2.0” 的概念,这个新模型旨在将传统 OCR 系统的优点与大型语言模型的强大功能结合起来。