• 正文
  • 相关推荐
申请入驻 产业图谱

GPT-Image 2 做 UI 界面原型设计,效率提升十倍

11小时前
341
加入交流群
扫码加入
获取工程师必备礼包
参与热点资讯讨论

近期在AI模型聚合平台库拉KULAAI(c.kulaai.cn)上实测了GPT-Image-2的UI界面原型设计能力。4月21日发布至今两天,产品经理社区已经炸了。这篇从实际工作流出发,聊聊它到底能替代哪些环节、不能替代哪些环节。

产品经理的痛点:等排期

产品经理出方案,经常需要一张高保真的界面图来跟团队对齐方向。以前要么自己用Figma画半天,要么排期等设计师,一来一回好几天。

从一个想法到可交互的原型,以前至少一周。现在只用两句话,等了不到10分钟。

这不是夸张。实测中让它生成一组AI健身运动App的界面——首页运动数据仪表盘、课程推荐页、运动记录详情页、社区动态页,四个屏幕一次生成,设计感、色彩、排版都在线。最关键的是中文几乎零错误。

高保真UI:跟之前不是一个级别

之前谷歌的Nano Banana Pro也测过,生UI界面的效果嘛——文字、图标还是会有瑕疵,只能看个大概的风格方向。

GPT-Image-2完全不同。实测生成AI健身App界面,四个屏幕一次出图,深色主题配荧光绿点缀,所有文字使用中文,字号间距对齐几乎零错误。跟之前Nano Banana Pro生的UI比,完全不是一个级别。

更狠的是它还能提取UI组件。一句话:"请提取这个App的所有UI组件图,平铺在图片上,方便我切图使用"——按钮、卡片、图标、导航栏、标签,整齐平铺出来。稍微调整下,这个App的UI设计规范就能用了。

从UI图到可运行的前端页面

这是最让人兴奋的发现。

Codex里也上线了这个模型。这意味着可以直接生成UI图,再利用代码能力把设计图复原成前端页面。

一句话出来的UI界面图已经很好了。再用一句话,直接根据UI开发前端页面。效果比想象的还好——截图已经是用代码实现的HTML页面,是可交互的。

从描述需求,到生成设计图,到直接变成可运行的前端页面——整个过程没画一笔原型,也没写一行代码。这不只是效率提升,是工作流在变。

世界知识:它"知道"网站该长什么样

GPT-Image-2最离谱的能力是世界知识。

从小红书随便找了一张小米SU7的图片,图上没有任何文字,只有一个侧面的汽车。让它"为这个汽车生成符合其气质和风格的官网UI设计稿"。

结果它居然脑补出了这是小米的车,配色都是一样的。它为这张图生成了一个汽车官网,所有的细节都是对的:内饰、剖面图、轮毂、大灯、尾翼、甚至价格。

再试B端广告投放平台的官网UI设计稿,它甚至知道这类型网站上应该有哪些卖点,以及UI上应该展示哪些信息。

这种"知道"的能力,是GPT-Image-2跟其他模型最本质的区别。它不是在画图,它是在"理解"一个产品应该长什么样。

游戏UI:复杂场景的极限测试

让它参考《无畏契约》的游戏风格,生成一个以三国为主题、神话风格的FPS游戏选人界面UI图片。模仿得非常像——界面的布局和交互采用了《无畏契约》的选人方式,但整个氛围、风格、背景以及角色都变成了三国的感觉。

更简单的提示词:"生成一个'黑神话武松'的游戏截图"。它真的能get到——UI设计、整个界面以及画面风格,都是《黑神话》的游戏风格。

设计师歸藏的评价:以前设计师值钱的地方有两层——能画出来、知道该画成什么样。第一层这两年早塌了,这次连第二层也开始松动。

为什么能做到?

GPT-Image-2不再基于GPT-4o的图像pipeline,研究负责人Boyuan Chen将其定义为"GPT for images"——一个从头设计的独立系统。核心变化是从两阶段生成转向单次推理。过去的模型是"先听懂你说什么,再动手画",中间有一次信息压缩;GPT-Image-2是"边理解边画",语言理解和图像生成在同一过程中完成。

Thinking模式开启后,模型在落笔前先规划构图,生成后检查输出,发现错误还会迭代修正。anti gamble创始人@damianplayer的拆解:"reasoning mid-generation——plans the composition, checks its own output"。

审美也升级了。不只是"画得真实",是真的"画得好看"——构图、配色、光影,明显上了一个台阶。中文终于不乱码了,几百个汉字排在一张图里,字号间距对齐几乎零错误。

实测中的真实问题

跑完二十多个场景,几个坑必须说清楚:

排版路数单一。设计师实测后发现,GPT-Image-2倾向于把所有海报做成模块化分割。调局部元素时不会做版式动态平衡,底部小字和上面的信息明显出现不平衡。

小字容易出错。大标题基本没问题,但底部的免责条款、小字说明等细小文字仍有出错风险。

复现稳定性不足。同样关键词同样的垫图无法做到稳定输出同样的结果。这对需要批量出图、保持视觉一致性的场景是个硬伤。

设计师实测后的判断:排版水平至少有初中级设计师左右的水平,能满足很多中低价格客户的需求。悲观者永远正确,乐观者永远前行。

趋势判断

2026年4月,国内生成式AI用户已突破6亿。StartupFortune在发布日给了一个定位:从"creative novelty"到"production infrastructure"。

但benchmark performance和production performance往往有差距。99%是实验室数字,真实场景能不能扛住,5月API开放后才会有定论。

对产品经理来说,GPT-Image-2把"等排期"这道墙直接拆了。但AI降低的是执行门槛,拉高的是决策门槛。AI给了你十张图,哪张能用?哪个更好?为什么?这些问题AI回答不了。

该担心的不是某个岗位,而是那些只做"执行"、不做"思考"的人。工具会越来越强,但方向永远由人把控。

相关推荐