上云资讯 - 来上云吧，企业上云一站式服务

2025-09-04 18:43:11 671人关注

喜大普奔！谷歌nano banana官方Prompt模板发布，附完整代码示例

近日，谷歌发布了 nano banana 的官方 Prompt 模板，迅速在网上引发热议。作为一款基于 AI 技术的图像生成工具，nano banana 凭借其强大的效果吸引了众多用户的关注与尝试。各种创意使用方式层出不穷，让人感受到 AI 在图像生成和处理领域带来的巨大变革。

nano banana 官方 Prompt 模板 AI 图像生成工具 AI 图像处理技术 nano banana 创意使用方式 AI 图像生成变革

2025-08-16 15:19:31 661人关注

超越FLUX Kontext！新图像编辑模型nano-banana角色还原能力超强

近日，一款名为Nano-Banana的图像编辑AI模型在社交媒体平台上引发热议。据多位用户反馈，这款在lmarena平台上出现的新模型在图像处理能力方面表现突出，被认为在多个关键指标上超越了当前备受认可的FLUX Kontext模型。

Nano-Banana图像编辑AI AI图像处理模型 FLUX Kontext模型对比 lmarena平台新模型图像编辑AI性能评测

2025-07-23 13:21:28 404人关注

谷歌 Gemini2.5革新图像处理:不止识别物体，更能理解抽象概念与关系

谷歌近日为其 Gemini2.5AI 模型推出了一项创新功能——“对话式图像分割”，允许用户通过自然语言提示直接分析和突出显示图像内容。这项技术超越了传统的图像分割范畴，赋予 Gemini 理解并响应更复杂、更具语义的指令的能力。

Gemini2.5AI 对话式图像分割自然语言图像分析图像语义理解 AI模型创新功能谷歌Gemini技术突破

2025-07-11 15:45:40 474人关注

vivo 新多模态模型登场，AI 理解GUI界面能力再升级！

近日，vivo AI Lab 发布了其最新的端侧多模态模型 ——BlueLM-2.5-3B。这款模型不仅小巧高效，更具备了理解图形用户界面（GUI）的能力，标志着人工智能在处理文本和图像方面迈出了重要一步。

vivo AI Lab BlueLM-2.5-3B 端侧多模态模型 GUI理解能力人工智能文本图像处理

2025-06-27 10:27:24 403人关注

Black Forest震撼开源FLUX.1 Kontext [dev]：媲美GPT-4o的图像编辑

Black Forest Labs正式宣布，其全新图像编辑模型 FLUX.1Kontext [dev] 现已开源，引发了AI社区的广泛关注。

AI图像编辑模型 FLUX.1Kontext开源 Black Forest Labs新技术 AI社区热点图像处理AI模型

2025-06-03 16:16:29 273人关注

NUS 推出 OmniConsistency：低成本实现图像风格化一致性，挑战 GPT-4o！

近日，新加坡国立大学（NUS）团队发布了一个名为 “OmniConsistency” 的创新项目，旨在以极低的成本复现 OpenAI 的 GPT-4o 模型在图像风格化上的一致性。这项技术不仅解决了当前开源社区在图像风格化和一致性之间的矛盾，还为广大开发者提供了可行的解决方案。

NUS OmniConsistency 图像风格化 GPT-4o AI大模型图像处理技术

2025-06-01 10:27:44 520人关注

黑森林实验室推出 FLUX.1Kontext：可通过文本和参考图像对图像进行多次修改

黑森林实验室（Black Forest Labs，简称 BFL），由著名的 Stable Diffusion 模型创作者成立，近日推出了新一代图像生成模型 FLUX.1Kontext。该模型不仅可以生成和编辑照片，还支持用户通过文本和参考图像对图像进行多次修改，为企业的 AI 应用带来了全新可能。

黑森林实验室 Flux1Kontext 文本图像编辑 AI图像处理图像编辑技术

2025-05-22 16:31:19 379人关注

多模态大模型MMaDA：让AI学会「跨次元思考」，文本图像通吃的全能型选手来了！

最近，普林斯顿大学、字节跳动、清华大学和北京大学联手搞了个大事情，推出了一款名为 MMaDA 的多模态大模型! 这可不是普通的 AI，它号称能让 AI 拥有“深度思考”的能力，还能在文本、图像、甚至复杂的推理任务之间“七十二变”，表现力直接超越了你熟悉的 GPT-4、Gemini、甚至 SDXL!

多模态模型 MMADA AI 文本图像处理多模态AI技术 AI模型应用场景多模态模型技术解析

2025-05-21 10:35:23 241人关注

Google 发布最强 AI 全家桶音乐、电影、图像全套上线

在近期的 Google I/O 大会上，谷歌推出了一系列引人注目的 AI 新功能，旨在彻底改变用户的搜索和创作体验。此次发布会展示了 Google 有史以来最强大的 AI 工具，涵盖了从高级搜索到多媒体创作的广泛应用，令人期待。

Google AI Suite AI音乐生成 AI电影制作 AI图像处理 Google AI套件应用场景

2025-05-06 16:17:17 961人关注

Runway发布图像一致性参考功能 Gen-4 References 支持提取人物、场景或风格特征及多图混合

Runway于近日正式推出Gen-4References功能，为其AI视频生成模型Gen-4新增了图像一致性参考能力。这一功能允许用户通过上传参考图像，提取人物、场景或风格特征，并在生成内容中保持高度一致性，支持多张图像混合生成，为AI视频创作带来了前所未有的控制力与创意自由。

Runway Gen4 图像一致性功能 Runway Gen4新特性 AI视频编辑技术 Runway Gen4图像处理

2025-04-27 10:39:24 338人关注

Step1X-Edit：开源图像编辑新标杆媲美GPT-4o等闭源模型

2025年4月27日，AIbase报道：由Stepfun AI团队推出的Step1X-Edit图像编辑模型于近日正式开源，引发业界广泛关注。这一通用图像编辑框架以其卓越性能和实用的开源特性，展现了媲美GPT-4o和Gemini 2 Flash等闭源模型的潜力。

开源图像编辑 Step1x编辑工具图像编辑技术开源图像处理 Step1x开源项目

2025-04-24 16:32:33 327人关注

JSON Visuals for ChatGPT发布，解锁无限图像风格创作

JSON Visuals for ChatGPT正式发布，为ChatGPT的图像生成能力注入全新创意维度。据AIbase了解，这一工具提供超过50种独特的美学代码，结合属性随机化器，可生成无限风格组合，用户只需输入图像与JSON风格代码即可创作个性化视觉内容。发布消息在社交平台引发热烈反响，社区尤其推崇其荒诞科技风格。

JSON可视化 ChatGPT无限风格图像风格多样化 JSON数据可视化技巧 ChatGPT图像处理应用

2025-04-17 10:29:11 265人关注

OpenAI 推出全新推理模型 o3，实现图像思考能力

OpenAI 近期发布了其最新的推理模型 o3和 o4-mini，标志着人工智能领域的一次重大突破。这两款模型不仅在推理能力上超越了以往的版本，还首次实现了图像思考的能力，能够将视觉信息直接融入到思维过程中。o3被誉为 “天才级” 模型，尤其在编程和数学等任务中表现出色，准确率高达87.5%。

OpenAI新推理模型 O3图像思维 AI推理技术 OpenAI模型更新图像处理AI

2025-04-16 14:41:29 255人关注

Apple Intelligence 四月登陆 Vision Pro，加入写作、表情、图像功能

据彭博社记者马克·古尔曼报道，苹果计划最早于四月将 Apple Intelligence 集成至 Vision Pro 头戴设备。该 AI 套件最初于2024年6月发布，此次将通过 visionOS2.4软件更新引入，预计本周向开发者开放。

Apple Intelligence Vision Pro AI写作工具 AI表情生成 AI图像处理

2025-04-13 16:27:28 340人关注

Krea发布全新工具Krea Stage：从图片到3D场景：一键构建沉浸式世界

在人工智能技术持续突破的浪潮中，Krea再度以创新之姿引领行业。4月10日，Krea正式发布全新工具Krea Stage，为3D场景创作和视频生成带来革命性体验。

Krea AI AI 3D场景生成图像转3D技术 AI图像处理 3D场景建模 Krea Stage应用

2025-03-28 02:36:27 225人关注

图像效果转换技术LBM：一键移除路人甲，还可调整光照

科技界又迎来一位图像处理领域的重量级选手——LBM（Latent Bridge Matching，潜在桥梁匹配）。这款由 gojasper 团队倾力打造的神奇工具，正如其名，仿佛一座无形的桥梁，在图像的潜在空间中巧妙穿梭，实现了令人惊叹的图像效果转换。LBM 效率惊人，只需“一步到位”，便能达成诸多复杂的图像编辑任务。

图像效果转换 LBM技术图像处理技术视觉效果转换图像转换算法

2025-03-19 16:24:43 287人关注

谷歌Gemini 2.0 Flash放出原生图像生成功能：支持多轮对话式实时编辑编辑

继Gemma3之后，谷歌又给我们带来了一位“闪电侠”——Gemini2.0Flash，而且人家这次是带着独门绝技来的:原生图像生成!

Gemini 2.0 实时图像生成图像实时编辑 Gemini 2.0 新特性 AI图像处理技术

2025-03-09 16:36:24 321人关注

OpenAI扩展ChatGPT与WhatsApp集成：图片、语音全面支持

近日，OpenAI 宣布其人工智能聊天助手 ChatGPT 与 WhatsApp 的集成得到了进一步扩展，增加了多项新功能，使得用户在 WhatsApp 上的体验更加丰富。

OpenAI ChatGPT WhatsApp集成图像处理语音功能

2025-03-07 10:36:29 1458人关注

腾讯元宝功能上新：允许分享长图时是否展示AI思考过程

3月6日，腾讯元宝宣布推出一项新功能，允许用户在分享长图时自由选择是否展示AI的思考过程，进一步提升了用户在使用AI助手时的灵活性和体验。

腾讯元宝 AI长图处理 AI图片处理技术腾讯AI技术应用 AI图像处理流程

2025-03-05 10:18:37 482人关注

微软开源图片模型ART，可生成多图层透明图片

在图像生成领域，多层图像生成技术正逐渐改变用户与生成模型的互动方式，允许用户隔离、选择并编辑特定的图像层。近日，微软研究人员推出了一种名为 “Anonymous Region Transformer”（ART）的新型技术，它能够根据全球文本提示和匿名区域布局，直接生成可变多层透明图像。

Microsoft AI 模型透明图像生成技术 AI 图像处理微软 AI 技术透明图像生成应用

- 上云资讯 -

喜大普奔！谷歌nano banana官方Prompt模板发布，附完整代码示例

超越FLUX Kontext！新图像编辑模型nano-banana角色还原能力超强

谷歌 Gemini2.5革新图像处理:不止识别物体，更能理解抽象概念与关系

vivo 新多模态模型登场，AI 理解GUI界面能力再升级！

Black Forest震撼开源FLUX.1 Kontext [dev]：媲美GPT-4o的图像编辑

NUS 推出 OmniConsistency：低成本实现图像风格化一致性，挑战 GPT-4o！

黑森林实验室推出 FLUX.1Kontext：可通过文本和参考图像对图像进行多次修改

多模态大模型MMaDA：让AI学会「跨次元思考」，文本图像通吃的全能型选手来了！

Google 发布最强 AI 全家桶音乐、电影、图像全套上线

Runway发布图像一致性参考功能 Gen-4 References 支持提取人物、场景或风格特征及多图混合

Step1X-Edit：开源图像编辑新标杆媲美GPT-4o等闭源模型

JSON Visuals for ChatGPT发布，解锁无限图像风格创作

OpenAI 推出全新推理模型 o3，实现图像思考能力

Apple Intelligence 四月登陆 Vision Pro，加入写作、表情、图像功能

Krea发布全新工具Krea Stage：从图片到3D场景：一键构建沉浸式世界

图像效果转换技术LBM：一键移除路人甲，还可调整光照

谷歌Gemini 2.0 Flash放出原生图像生成功能：支持多轮对话式实时编辑编辑

OpenAI扩展ChatGPT与WhatsApp集成：图片、语音全面支持

腾讯元宝功能上新：允许分享长图时是否展示AI思考过程

微软开源图片模型ART，可生成多图层透明图片

推荐阅读

上云服务

- 上云资讯 -

喜大普奔！谷歌nano banana官方Prompt模板发布，附完整代码示例

超越FLUX Kontext！新图像编辑模型nano-banana角色还原能力超强

谷歌 Gemini2.5革新图像处理:不止识别物体，更能理解抽象概念与关系

vivo 新多模态模型登场，AI 理解GUI界面能力再升级！

Black Forest震撼开源FLUX.1 Kontext [dev]：媲美GPT-4o的图像编辑

NUS 推出 OmniConsistency：低成本实现图像风格化一致性，挑战 GPT-4o！

​黑森林实验室推出 FLUX.1Kontext：可通过文本和参考图像对图像进行多次修改

多模态大模型MMaDA：让AI学会「跨次元思考」，文本图像通吃的全能型选手来了！

Google 发布最强 AI 全家桶 音乐、电影、图像全套上线

Runway发布图像一致性参考功能 Gen-4 References 支持提取人物、场景或风格特征及多图混合

Step1X-Edit：开源图像编辑新标杆 媲美GPT-4o等闭源模型

JSON Visuals for ChatGPT发布，解锁无限图像风格创作

OpenAI 推出全新推理模型 o3，实现图像思考能力

Apple Intelligence 四月登陆 Vision Pro，加入写作、表情、图像功能

Krea发布全新工具Krea Stage：从图片到3D场景：一键构建沉浸式世界

图像效果转换技术LBM：一键移除路人甲，还可调整光照

谷歌Gemini 2.0 Flash放出原生图像生成功能：支持多轮对话式实时编辑编辑

OpenAI扩展ChatGPT与WhatsApp集成：图片、语音全面支持

腾讯元宝功能上新：允许分享长图时是否展示AI思考过程

微软开源图片模型ART，可生成多图层透明图片

推荐阅读

上云服务

黑森林实验室推出 FLUX.1Kontext：可通过文本和参考图像对图像进行多次修改

Google 发布最强 AI 全家桶音乐、电影、图像全套上线

Step1X-Edit：开源图像编辑新标杆媲美GPT-4o等闭源模型