- 上云资讯 -



2025-01-20 06:14:42 69人关注

GPTPdf:使用类似GPT-4o的多模态LLM分析PDF文件

近日,一款名为gptpdf的开源项目名在github赞火了1.1k星星,它使用了类似 GPT-4o 的 VLLM 模型来解析 PDF 文件并将其转换为 Markdown 格式。

2025-01-19 00:15:13 50人关注

上海AI lab开源超强多模态LLM InternLM-XComposer-2.5

昨天,上海AI实验室给我们带来了一个巨大的惊喜——开源了一款名为InternLM-XComposer-2.5(简称IXC-2.5)的多模态大型语言模型。这不是一个普通的模型,它在多个方面展现出了超凡的能力,特别是在超高分辨率图像理解、细粒度视频理解和多轮图像对话上,它的表现让人印象深刻。