- 上云资讯 -
2025-09-04 18:43:11 157人关注
喜大普奔!谷歌nano banana官方Prompt模板发布,附完整代码示例
近日,谷歌发布了 nano banana 的官方 Prompt 模板,迅速在网上引发热议。作为一款基于 AI 技术的图像生成工具,nano banana 凭借其强大的效果吸引了众多用户的关注与尝试。各种创意使用方式层出不穷,让人感受到 AI 在图像生成和处理领域带来的巨大变革。
nano banana 官方 Prompt 模板 AI 图像生成工具 AI 图像处理技术 nano banana 创意使用方式 AI 图像生成变革
2025-08-16 15:19:31 298人关注
超越FLUX Kontext!新图像编辑模型nano-banana角色还原能力超强
近日,一款名为Nano-Banana的图像编辑AI模型在社交媒体平台上引发热议。据多位用户反馈,这款在lmarena平台上出现的新模型在图像处理能力方面表现突出,被认为在多个关键指标上超越了当前备受认可的FLUX Kontext模型。
Nano-Banana图像编辑AI AI图像处理模型 FLUX Kontext模型对比 lmarena平台新模型 图像编辑AI性能评测
2025-07-23 13:21:28 135人关注
谷歌 Gemini2.5革新图像处理:不止识别物体,更能理解抽象概念与关系
谷歌近日为其 Gemini2.5AI 模型推出了一项创新功能——“对话式图像分割”,允许用户通过自然语言提示直接分析和突出显示图像内容。这项技术超越了传统的图像分割范畴,赋予 Gemini 理解并响应更复杂、更具语义的指令的能力。
2025-07-11 15:45:40 229人关注
vivo 新多模态模型登场,AI 理解GUI界面能力再升级!
近日,vivo AI Lab 发布了其最新的端侧多模态模型 ——BlueLM-2.5-3B。这款模型不仅小巧高效,更具备了理解图形用户界面(GUI)的能力,标志着人工智能在处理文本和图像方面迈出了重要一步。
2025-06-27 10:27:24 202人关注
Black Forest震撼开源FLUX.1 Kontext [dev]:媲美GPT-4o的图像编辑
Black Forest Labs正式宣布,其全新图像编辑模型 FLUX.1Kontext [dev] 现已开源,引发了AI社区的广泛关注。
AI图像编辑模型 FLUX.1Kontext开源 Black Forest Labs新技术 AI社区热点 图像处理AI模型
2025-06-01 10:27:44 356人关注
黑森林实验室推出 FLUX.1Kontext:可通过文本和参考图像对图像进行多次修改
黑森林实验室(Black Forest Labs,简称 BFL),由著名的 Stable Diffusion 模型创作者成立,近日推出了新一代图像生成模型 FLUX.1Kontext。该模型不仅可以生成和编辑照片,还支持用户通过文本和参考图像对图像进行多次修改,为企业的 AI 应用带来了全新可能。
2025-05-21 10:35:23 134人关注
Google 发布最强 AI 全家桶 音乐、电影、图像全套上线
在近期的 Google I/O 大会上,谷歌推出了一系列引人注目的 AI 新功能,旨在彻底改变用户的搜索和创作体验。此次发布会展示了 Google 有史以来最强大的 AI 工具,涵盖了从高级搜索到多媒体创作的广泛应用,令人期待。
2025-05-06 16:17:17 393人关注
Runway发布图像一致性参考功能 Gen-4 References 支持提取人物、场景或风格特征及多图混合
Runway于近日正式推出Gen-4References功能,为其AI视频生成模型Gen-4新增了图像一致性参考能力。这一功能允许用户通过上传参考图像,提取人物、场景或风格特征,并在生成内容中保持高度一致性,支持多张图像混合生成,为AI视频创作带来了前所未有的控制力与创意自由。
2025-04-27 10:39:24 173人关注
Step1X-Edit:开源图像编辑新标杆 媲美GPT-4o等闭源模型
2025年4月27日,AIbase报道:由Stepfun AI团队推出的Step1X-Edit图像编辑模型于近日正式开源,引发业界广泛关注。这一通用图像编辑框架以其卓越性能和实用的开源特性,展现了媲美GPT-4o和Gemini 2 Flash等闭源模型的潜力。
2025-04-24 16:32:33 152人关注
JSON Visuals for ChatGPT发布,解锁无限图像风格创作
JSON Visuals for ChatGPT正式发布,为ChatGPT的图像生成能力注入全新创意维度。据AIbase了解,这一工具提供超过50种独特的美学代码,结合属性随机化器,可生成无限风格组合,用户只需输入图像与JSON风格代码即可创作个性化视觉内容。发布消息在社交平台引发热烈反响,社区尤其推崇其荒诞科技风格。
2025-04-17 10:29:11 117人关注
OpenAI 推出全新推理模型 o3,实现图像思考能力
OpenAI 近期发布了其最新的推理模型 o3和 o4-mini,标志着人工智能领域的一次重大突破。这两款模型不仅在推理能力上超越了以往的版本,还首次实现了图像思考的能力,能够将视觉信息直接融入到思维过程中。o3被誉为 “天才级” 模型,尤其在编程和数学等任务中表现出色,准确率高达87.5%。
2025-04-16 14:41:29 92人关注
Apple Intelligence 四月登陆 Vision Pro,加入写作、表情、图像功能
据彭博社记者马克·古尔曼报道,苹果计划最早于四月将 Apple Intelligence 集成至 Vision Pro 头戴设备。该 AI 套件最初于2024年6月发布,此次将通过 visionOS2.4软件更新引入,预计本周向开发者开放。
2025-03-19 16:24:43 162人关注
谷歌Gemini 2.0 Flash放出原生图像生成功能:支持多轮对话式实时编辑编辑
继Gemma3之后,谷歌又给我们带来了一位“闪电侠”——Gemini2.0Flash,而且人家这次是带着独门绝技来的:原生图像生成!
2025-03-09 16:36:24 183人关注
OpenAI扩展ChatGPT与WhatsApp集成:图片、语音全面支持
近日,OpenAI 宣布其人工智能聊天助手 ChatGPT 与 WhatsApp 的集成得到了进一步扩展,增加了多项新功能,使得用户在 WhatsApp 上的体验更加丰富。
2025-03-05 10:18:37 222人关注
微软开源图片模型ART,可生成多图层透明图片
在图像生成领域,多层图像生成技术正逐渐改变用户与生成模型的互动方式,允许用户隔离、选择并编辑特定的图像层。近日,微软研究人员推出了一种名为 “Anonymous Region Transformer”(ART)的新型技术,它能够根据全球文本提示和匿名区域布局,直接生成可变多层透明图像。