- 上云资讯 -
2025-07-16 15:32:13 346人关注
Unsloth AI发布1.8bit量化Kimi K2模型,显著降低部署成本
7月14日,Unsloth AI宣布成功将Moonshot AI的Kimi K2模型量化为1.8bit版本,大幅压缩模型体积并降低部署成本。根据AIbase报道,这一技术突破使Kimi K2从原始的1.1TB缩减至245GB,体积减少约80%,同时保持了全部代码测试性能。此举被视为开源AI领域的重要进展,引发了业界广泛关注。
Kimi K2模型量化 1.8bit量化技术 模型体积压缩 开源AI技术进展 Unsloth AI技术突破 AI模型部署成本优化
2025-06-10 16:21:32 73人关注
谷歌重磅发布三大Gemma模型变体,AI医疗、手语翻译与海豚语言解锁新可能!
近日,谷歌在人工智能领域再掀波澜,宣布推出基于Gemma模型的三款全新变体:MedGemma、SignGemma和DolphinGemma。这些模型分别针对医疗、手语翻译和海豚语言研究领域,展现了AI技术在跨领域应用的巨大潜力。以下,AIbase为您详细解读这三款模型的亮点与应用前景。
2025-05-30 16:35:46 95人关注
Anthropic再放大招!Claude新功能解锁AI应用开发,AI Studio迎来新机遇
Anthropic近日宣布了一项令人振奋的更新:其旗舰模型Claude新增功能,支持开发者构建与Claude直接对话的AI应用程序。这一突破性进展被认为与AI Studio的应用程序开发理念高度契合,为开发者提供了更广阔的创新空间。AIbase编辑团队根据最新信息整理,为您深入解读这一技术动态及其潜在影响。
Anthropic Claude AI AI Studio新功能 Claude AI更新 AI模型新特性 Anthropic AI技术进展
2025-05-16 18:27:33 138人关注
Meta AI 发布新型视频学习模型V-JEPA :视频理解新突破
近日,Meta AI 团队推出了视频联合嵌入预测架构(V-JEPA)模型,这一创新举措旨在推动机器智能的发展。人类能够自然而然地处理来自视觉信号的信息,进而识别周围的物体和运动模式。机器学习的一个重要目标是揭示促使人类进行无监督学习的基本原理。研究人员提出了一个关键假设 —— 预测特征原则,认为连续感官输入的表示应该能够相互预测。
2025-05-12 16:39:19 81人关注
阿里通义千问成为日本AI发展的新基石
近日,日本经济新闻(NIKKEI)发表了一篇引人注目的报道,指出阿里巴巴的通义千问大模型正迅速成为日本人工智能开发的重要基础。随着全球 AI 技术的飞速发展,通义千问的表现已在国际舞台上崭露头角,尤其是在日经新闻对各大 AI 模型进行的综合评测中,通义千问 Qwen2.5-Max 一举夺得第六名,超越了许多国内外知名模型,包括 DeepSeek-V3和 OpenAI 的 o3-mini 等。
2025-04-10 16:35:30 94人关注
百度官宣:文心大模型4.5 Turbo将于4月25日发布
今日,百度官方正式对外宣布,其最新力作——文心大模型4.5Turbo,将于4月25日举办的Create大会上揭开神秘面纱。尽管目前官方对于这款新模型的详细参数与功能特性仍守口如瓶,但业界内外已对其充满期待,具体细节唯有待发布会当日方能揭晓。
2025-03-28 16:21:41 308人关注
Cline现已支持Gemini 2.5 Pro:AI开发迎来新助力
2025 年 3 月 28 日消息,随着人工智能技术的飞速发展,Google DeepMind推出的Gemini 2.5 Pro模型因其卓越的性能和多模态能力备受关注。今日,知名AI开发工具Cline宣布正式支持Gemini 2.5 Pro,为开发者提供了一个免费且强大的选择,进一步推动了AI驱动的编码和调试效率。这一消息在技术社区引发广泛讨论。
2025-03-22 10:21:31 134人关注
Anthropic CEO:AI将在未来3到6个月内完成90%编程工作
Anthropic 公司的首席执行官达里奥・阿莫代(Dario Amodei)在美国外 Relations 委员会的一场论坛上表示,他相信,人工智能将在未来3到6个月内完成90% 的编程工作。阿莫代提到,在12个月内,人工智能有可能实现几乎所有代码的编写,这一言论引发了广泛关注。
2025-02-23 16:33:25 213人关注
马斯克: Grok 3 语音模式早期测试版已上线
2月20日,马斯克通过社交平台X发布了一条重要消息,宣布Grok应用程序已成功上线了Grok3语音模式的早期测试版。这一动态立即引起了广泛关注。
2025-01-21 21:37:30 149人关注
阿里推新 AI 基准测试 “PROCESSBENCH”,评估数学推理中的错误识别能力
近日,阿里巴巴 Qwen 团队的研究人员推出了一个名为 “PROCESSBENCH” 的新基准测试,旨在衡量语言模型在数学推理中识别过程错误的能力。随着语言模型在复杂推理任务中取得显著进展,这一领域的研究者们发现,尽管模型表现出色,但在处理某些困难问题时依然面临挑战。因此,开发一种有效的监督方法显得尤为重要。