- 上云资讯 -
2025-01-19 17:27:44 85人关注
gptpdf:一款使用AI解析PDF的开源工具
该Github项目是使用GPT模型解析PDF文件,可以完美解析PDF中的排版、数学公式、表格、图片、图表等内容,平均每页成本为$0.013。 解析PDF文件的步骤如下: 1. 使用PyMuPDF库将PDF解析为非文本区域和文本区域。
2025-01-03 22:12:30 148人关注
Jina AI 发布革命性小模型,轻松将HTML转为优雅 Markdown!
Jina AI 推出了两款专门为将原始 HTML 内容转化为干净整洁的 Markdown 格式而设计的小型语言模型,让我们摆脱琐的网页数据处理。
2024-12-28 14:29:40 156人关注
OPPO 文档 AI新功能曝光!支持苹果 iWork 格式转换、文档翻译、扫描文档等!
OPPO2024开发者大会将于10月17日举行,届时将带来全新 ColorOS15。目前,OPPO Find N3、Find X7、一加12等机型已开启新系统内测招募,将在发布会当天开启推送。
2024-12-26 17:28:25 36人关注
表格、图表统统拿下!阿里达摩院开源DocOwl 1.5 无需OCR,高效“读懂”文档!
阿里巴巴达摩院与中国人民大学近日联合开源了一款名为 mPLUG-DocOwl1.5的文档处理模型,该模型主打无需 OCR 识别即可理解文档内容,并在多个视觉文档理解基准测试中取得了领先的性能。
2024-12-22 20:45:40 65人关注
Claude 3.5 Sonnet模型增加PDF 文件处理功能 可分析文档图像、图表和表格
近日,人工智能公司 Anthropic 宣布,在其 Claude 3.5 Sonnet 模型中增加了 PDF 文件处理的功能,目前该功能已进入公共测试阶段。用户现在可以使用该模型分析 PDF 文档中的文本和视觉元素,包括图像、图表和表格等,适用于金融报告、法律文件以及文档翻译等多种场景。