LetsClouds-Logo
AI对话 上云服务 上云资讯 解决方案 关于我们
售前咨询 021-50583875
微信二维码

微信扫码

添加专属顾问

- 上云资讯 -

阿里云云原生 阿里云开发者 腾讯云开发者 火山引擎开发者社区 魔搭ModelScope社区 微软科技 Azure云科技 Zilliz OpenAI Anthropic Gemini LangChain Hugging Face Mistral

2025-07-04 16:25:14 337人关注

开源革命!Kyutai TTS发布:超低延迟语音合成,AI语音新纪元来袭!

近日,法国AI实验室Kyutai宣布,其全新文本转语音模型 Kyutai TTS 正式开源,为全球开发者与研究者带来了一款高性能、低延迟的语音合成解决方案。这一突破性发布不仅推动了开源AI技术的发展,也为多语言语音交互应用开辟了新的可能性。AIbase为您独家解析这一技术亮点及其潜在影响。

Kyutai TTS 文本转语音模型 开源语音合成 AI语音交互 多语言语音合成 AI开源技术

2025-05-24 16:10:35 159人关注

微软开源Magentic-UI,重新定义人机协同网页自动化

Microsoft Build开发者大会上,微软正式推出了其开源项目Magentic-UI,一款以人为中心的人工智能网页代理系统。这款创新工具旨在通过智能自动化处理复杂网页任务,同时确保用户全程掌控操作流程。AIbase为您深入解析这一突破性技术的核心亮点及其潜在影响。

Microsoft 开源项目 Magnetic UI Web 自动化 微软开源技术 UI 自动化框架

2025-05-16 10:15:33 86人关注

DeepSeek 开源周首日:发布大模型加速利器FlashMLA 解码性能飙升至3000GB/s

DeepSeek 开源周首日正式开源其最新技术成果FlashMLA,这是一款专为英伟达Hopper架构GPU打造的高效多层注意力(Multi-Layer Attention)解码内核。该技术特别针对变长序列场景进行优化,可显著提升大模型推理性能。

DeepSeek开源周 FlashMLA 3000GBs 大模型开源技术 DeepSeek开源模型 高性能AI模型

2025-05-12 14:35:19 60人关注

超给力!DeepSeek 宣布下周开源五个项目

近日,DeepSeek 在其官网 X 账号上发布了重磅消息,宣布将在接下来的一个星期内陆续开源五个代码库。该公司表示,当前已经完成的在线服务模块经过严格的测试和部署,已具备投入生产环境的条件。

DeepSeek开源项目 DeepSeek开源技术 DeepSeek开源计划 DeepSeek开源新闻 DeepSeek开源动态

2025-05-10 10:24:38 120人关注

英伟达开源新一代OCR代码推理 AI 模型,超越 OpenAIo3-Mini表现

英伟达在技术界引起广泛关注,正式发布了其最新的 Open Code Reasoning(OCR)模型套装。这一模型的推出,不仅展示了英伟达在人工智能领域的创新能力,也为开发者提供了强有力的工具,助力他们在代码推理和生成任务中取得更好的成绩。

NVIDIA开源OCR模型 OCR模型性能对比 OpenAI模型对比 NVIDIA开源技术 OCR技术进展

2025-03-23 12:16:25 158人关注

豆包:视频生成模型 “VideoWorld” 已开源 实现纯视觉学习

据豆包大模型团队官方公众号消息,在北京交通大学和中国科学技术大学的联合研究下,由豆包大模型团队提出的 “VideoWorld” 视频生成实验模型近日正式开源。

豆包视频世界 开源视觉学习 视觉学习框架 视频AI开源项目 豆包开源技术

2025-02-16 16:36:46 168人关注

百度宣布文心大模型 4.5 系列即将上线,6月30日全面开源!

近日,百度在其官方渠道上宣布了令人瞩目的消息:文心大模型4.5系列将于未来几个月陆续推出,并定于6月30日正式开源。作为百度在人工智能领域的重要布局,文心大模型的不断升级和开源,意味着更多用户将能够体验到前沿的 AI 技术。

百度文心大模型4.5 文心大模型开源 百度大模型技术 文心4.5开源版本 大模型开源技术

2025-01-24 01:20:26 128人关注

​IBM发布更新版Granite 3.1开源语言模型,性能大幅提升

近日,IBM 宣布推出其开源语言模型 Granite 的3.1版本,此次更新带来了诸多重要改进。新版本的模型经过重新设计,采用了更加密集的架构,能够一次处理多达128,000个令牌。这一更新意味着 Granite 在处理复杂文本和任务时的能力得到了显著增强。

IBM Granite 3.1 开源大模型 IBM Granite模型 开源AI模型 IBM开源技术

2025-01-18 20:23:19 152人关注

苹果开源多模态视觉模型 4M-21 ,能执行数十种任务

苹果和瑞士洛桑联邦理工学院的研究人员联合开源了一款名为4M-21的大规模多模态视觉模型。与其他专门针对特定任务或数据类型进行优化的模型不同,4M-21具有广泛的通用性和灵活性。尽管只有30亿参数,但它可以提供图像分类、目标检测、语义分割、实例分割、深度估计、表面法线估计等数十种功能。

苹果开源模型 多模态视觉模型 苹果开源技术 开源AI模型 苹果视觉AI

2025-01-12 06:40:37 151人关注

书生·浦语2.5开源超轻量1.8B、高性能20B多种参数版本

上海人工智能实验室在2024年7月4日的WAIC科学前沿主论坛上推出了书生·浦语系列模型的新版本InternLM2.5。这个版本在复杂场景下的推理能力得到了全面增强,支持1M超长上下文,并能自主进行互联网搜索及整合上百个网页的信息。

书生·浦语2.5开源模型 书生·浦语2.5模型开源 大模型开源技术 书生·浦语2.5应用场景 书生·浦语2.5模型特点

2025-01-10 03:41:37 81人关注

英伟达开源新突破:新模型训练算力节省1.8倍!

全球人工智能的领军企业英伟达(Nvidia)最近开源了两款新型大模型:Nemotron-4-Minitron-4B和Nemotron-4-Minitron-8B。这两个模型的开源,不仅是技术上的一次飞跃,更在AI领域掀起了一场效率革命。

NVIDIA开源模型 模型训练效率 开源AI模型 AI模型训练优化 NVIDIA开源技术

2025-01-03 22:12:30 205人关注

Jina AI 发布革命性小模型,轻松将HTML转为优雅 Markdown!

Jina AI 推出了两款专门为将原始 HTML 内容转化为干净整洁的 Markdown 格式而设计的小型语言模型,让我们摆脱琐的网页数据处理。

Jina AI HTML转Markdown 文本格式转换工具 AI文档处理 开源技术应用

2024-12-29 18:45:19 160人关注

开源版NotebookLM来了!Podcastfy:输入PDF、文本、网址等即可转换成播客

在如今的数字时代,播客越来越受到大家的喜爱,尤其是随着多语言交流需求的增加,如何制作引人入胜的音频内容成了一个热门话题。

开源AI工具 NotebookLM应用场景 Podcastfy文本处理 PDF文本提取 URL内容分析 开源技术解析

2024-12-22 07:36:21 63人关注

上海AI Lab复刻OpenAI奥数神器,LLaMA版o1开源

近期,开源社区传来好消息:上海AI Lab团队发布了LLaMA版o1项目,旨在复刻OpenAI的奥数解题神器o1。该项目采用了多种先进技术,包括蒙特卡洛树搜索、Self-Play强化学习、PPO以及AlphaGo Zero的双重策略范式,引起了开发者社区的广泛关注。

上海AI实验室 LLaMA O1开源 大模型开源项目 AI开源技术 上海AI实验室新闻

2024-12-18 16:30:41 65人关注

阿里CEO吴泳铭:AI时代阿里巴巴将坚持开源开放

在2024年世界互联网大会乌镇峰会的主论坛上,阿里巴巴集团CEO吴泳铭发表了关于公司在人工智能时代战略的演讲。

AI大模型 阿里巴巴开源 AI时代 开源技术 大模型应用

推荐阅读

加载中...

上云服务

沪ICP备14033669号-10