2026-02-18 20:44:05来源: 网络作者:admin

OpenAI即将推出ChatGPT图像功能的新版本,该版本在指令遵循度上会有更好表现,图像编辑将更精准,且生成速度预计能达到原先的4倍。
这个新模型被命名为GPT-Image-1.5,自周二起向所有ChatGPT用户及API用户开放。这是OpenAI为与谷歌Gemini展开竞争推出的最新升级举措,而在此之前,其首席执行官Sam Altman曾在上月一份泄露的内部备忘录中发出“红色警戒”。该备忘录详细阐述了在谷歌开始抢占市场份额后,OpenAI计划重新稳固自身AI领导者地位的策略。谷歌此前发布了最新旗舰模型Gemini 3,以及其广受欢迎的图像生成器的最新版本Nano Banana Pro——这两款产品在LMArena排行榜的多项基准测试中均位居前列。
尽管OpenAI在上周推出了GPT-5.2作为应对举措,谷歌依旧占据领先位置,声称自家模型是目前最先进的,能够满足开发者与日常专业场景的需求。有消息显示,OpenAI原本打算在一月初推出一款新的图像生成工具,不过由于本周的相关公告,他们加快了这一计划的推进速度。该公司上一次发布图像模型是在四月份的GPT-Image-1。
随着图像与视频生成工具逐步脱离原型阶段、具备更成熟的生产级能力,GPT-Image-1.5正式推出。和Nano Banana Pro类似,ChatGPT图像功能配备了后期制作特性,可提供更精细的编辑操控,以此保障视觉层面的一致性,比如面部特征的相似度、光影效果、画面构图以及色彩基调的统一。

目前多数生成式AI图像工具在迭代优化上存在短板,所以若能解决这一问题无疑是重大突破。当用户提出“调整面部表情”“让光线更冷”这类具体修改需求时,模型往往会对图像整体进行重新生成,进而造成画面前后缺乏连贯性。
更新的意义不止于新增功能。ChatGPT图像如今还能通过ChatGPT侧边栏里的专属入口进入,这个入口“更像是一间创意工作室”,OpenAI的应用首席执行官Fidji Simo在周二发布的一篇博客文章中如此写道。
“新的图像查看与编辑界面让你能更轻松地创作出契合自身构想的图像,或是从热门提示词与预设滤镜里汲取灵感,”西莫如是写道。
除了推出新的图像生成器外,OpenAI还引入了一些新方法来优化ChatGPT的使用体验,增添更多视觉方面的元素。按照计划,搜索查询将呈现出更多带有明确来源的视觉内容,Simo指出,这或许会对转换测量单位、查看体育比分这类任务有所助益。
“在进行创作时,你应当能看见并塑造自己正在制作的事物。要是视觉效果比单纯的文字更能传递故事,ChatGPT就该把它们纳入其中,”Simo如是写道,“当你需要迅速得到答案,或是要在其他工具里开展下一步操作时,它得随时能派上用场。通过这样的方式,我们就能不断拉近你脑海中的想法和将其变为现实的能力之间的距离。”
免责声明:文章图片应用自网络,如有侵权请联系删除