GPT-Image 2 做 UI 界面原型设计，效率提升十倍

近期在AI模型聚合平台库拉KULAAI（c.kulaai.cn）上实测了GPT-Image-2的UI界面原型设计能力。4月21日发布至今两天，产品经理社区已经炸了。这篇从实际工作流出发，聊聊它到底能替代哪些环节、不能替代哪些环节。

产品经理的痛点：等排期

产品经理出方案，经常需要一张高保真的界面图来跟团队对齐方向。以前要么自己用Figma画半天，要么排期等设计师，一来一回好几天。

从一个想法到可交互的原型，以前至少一周。现在只用两句话，等了不到10分钟。

这不是夸张。实测中让它生成一组AI健身运动App的界面——首页运动数据仪表盘、课程推荐页、运动记录详情页、社区动态页，四个屏幕一次生成，设计感、色彩、排版都在线。最关键的是中文几乎零错误。

高保真UI：跟之前不是一个级别

之前谷歌的Nano Banana Pro也测过，生UI界面的效果嘛——文字、图标还是会有瑕疵，只能看个大概的风格方向。

GPT-Image-2完全不同。实测生成AI健身App界面，四个屏幕一次出图，深色主题配荧光绿点缀，所有文字使用中文，字号间距对齐几乎零错误。跟之前Nano Banana Pro生的UI比，完全不是一个级别。

更狠的是它还能提取UI组件。一句话："请提取这个App的所有UI组件图，平铺在图片上，方便我切图使用"——按钮、卡片、图标、导航栏、标签，整齐平铺出来。稍微调整下，这个App的UI设计规范就能用了。

从UI图到可运行的前端页面

这是最让人兴奋的发现。

Codex里也上线了这个模型。这意味着可以直接生成UI图，再利用代码能力把设计图复原成前端页面。

一句话出来的UI界面图已经很好了。再用一句话，直接根据UI开发前端页面。效果比想象的还好——截图已经是用代码实现的HTML页面，是可交互的。

从描述需求，到生成设计图，到直接变成可运行的前端页面——整个过程没画一笔原型，也没写一行代码。这不只是效率提升，是工作流在变。

世界知识：它"知道"网站该长什么样

GPT-Image-2最离谱的能力是世界知识。

从小红书随便找了一张小米SU7的图片，图上没有任何文字，只有一个侧面的汽车。让它"为这个汽车生成符合其气质和风格的官网UI设计稿"。

结果它居然脑补出了这是小米的车，配色都是一样的。它为这张图生成了一个汽车官网，所有的细节都是对的：内饰、剖面图、轮毂、大灯、尾翼、甚至价格。

再试B端广告投放平台的官网UI设计稿，它甚至知道这类型网站上应该有哪些卖点，以及UI上应该展示哪些信息。

这种"知道"的能力，是GPT-Image-2跟其他模型最本质的区别。它不是在画图，它是在"理解"一个产品应该长什么样。

游戏UI：复杂场景的极限测试

让它参考《无畏契约》的游戏风格，生成一个以三国为主题、神话风格的FPS游戏选人界面UI图片。模仿得非常像——界面的布局和交互采用了《无畏契约》的选人方式，但整个氛围、风格、背景以及角色都变成了三国的感觉。

更简单的提示词："生成一个'黑神话武松'的游戏截图"。它真的能get到——UI设计、整个界面以及画面风格，都是《黑神话》的游戏风格。

设计师歸藏的评价：以前设计师值钱的地方有两层——能画出来、知道该画成什么样。第一层这两年早塌了，这次连第二层也开始松动。

为什么能做到？

GPT-Image-2不再基于GPT-4o的图像pipeline，研究负责人Boyuan Chen将其定义为"GPT for images"——一个从头设计的独立系统。核心变化是从两阶段生成转向单次推理。过去的模型是"先听懂你说什么，再动手画"，中间有一次信息压缩；GPT-Image-2是"边理解边画"，语言理解和图像生成在同一过程中完成。

Thinking模式开启后，模型在落笔前先规划构图，生成后检查输出，发现错误还会迭代修正。anti gamble创始人@damianplayer的拆解："reasoning mid-generation——plans the composition, checks its own output"。

审美也升级了。不只是"画得真实"，是真的"画得好看"——构图、配色、光影，明显上了一个台阶。中文终于不乱码了，几百个汉字排在一张图里，字号间距对齐几乎零错误。

实测中的真实问题

跑完二十多个场景，几个坑必须说清楚：

排版路数单一。设计师实测后发现，GPT-Image-2倾向于把所有海报做成模块化分割。调局部元素时不会做版式动态平衡，底部小字和上面的信息明显出现不平衡。

小字容易出错。大标题基本没问题，但底部的免责条款、小字说明等细小文字仍有出错风险。

复现稳定性不足。同样关键词同样的垫图无法做到稳定输出同样的结果。这对需要批量出图、保持视觉一致性的场景是个硬伤。

设计师实测后的判断：排版水平至少有初中级设计师左右的水平，能满足很多中低价格客户的需求。悲观者永远正确，乐观者永远前行。

趋势判断

2026年4月，国内生成式AI用户已突破6亿。StartupFortune在发布日给了一个定位：从"creative novelty"到"production infrastructure"。

但benchmark performance和production performance往往有差距。99%是实验室数字，真实场景能不能扛住，5月API开放后才会有定论。

对产品经理来说，GPT-Image-2把"等排期"这道墙直接拆了。但AI降低的是执行门槛，拉高的是决策门槛。AI给了你十张图，哪张能用？哪个更好？为什么？这些问题AI回答不了。

该担心的不是某个岗位，而是那些只做"执行"、不做"思考"的人。工具会越来越强，但方向永远由人把控。