最近在库拉KULAAI(k.kulaai.cn)上看到一个挺有意思的讨论,有人说Gemini的提示词工程已经不需要人写了,模型自己就能生成最优提示词。评论区直接炸了,一半人觉得是吹牛,另一半人表示自己确实这么干了一段时间了。作为一个从GPT-3时代就开始折腾提示词的工程师,我决定把这件事掰开了说。
先纠正一个误解
"Gemini自动写提示词"这个说法其实不太准确。Gemini本身并没有一个"自动生成最优prompt"的按钮,但它有一个被很多人低估的能力——迭代式提示词优化。
具体来说,你可以给Gemini一个粗糙的需求,然后让它自己反过来问你十个问题,把你的需求拆解清楚,最后它根据你的回答生成一个结构化的高质量提示词。这个过程本质上是Gemini在帮你做"需求分析",只不过输出物恰好是一个提示词。
我实测下来,这种方式生成的提示词,比我自己从零写的准确率高了大概40%。不是因为Gemini比我聪明,而是因为我在写提示词的时候经常"以为自己说清楚了",但Gemini的追问会暴露我的表述漏洞。
实操演示:一个提示词是怎么被"优化"出来的
举个我最近的真实场景。我需要写一个提示词,让AI帮我分析一批芯片的datasheet,提取关键参数做横向对比。
如果我自己写,大概是这样的:"帮我分析这些芯片的datasheet,提取关键参数,做一个对比表格。"
看着没问题对吧?但实际跑起来,Gemini会问:哪些算"关键参数"?对比维度是什么?输出格式有要求吗?需不需要考虑成本因素?是面向方案选型还是学术研究?
这些问题我本来应该在提示词里写清楚,但写的时候就是会漏。于是我换了个策略:先把这个粗糙的需求丢给Gemini,让它反问我。
Gemini回了我八个问题,我逐一回答之后,它生成的提示词长这样:
"你是一名资深嵌入式工程师,请分析以下芯片的datasheet,按以下维度提取参数并输出对比表格:1.核心性能(主频、内核架构、Flash/RAM容量);2.外设接口(GPIO数量、通信协议支持、ADC精度与通道数);3.功耗指标(静态功耗、各模式下典型功耗);4.封装与温度范围;5.参考单价与供货周期。表格按维度分行,每款芯片占一列,最后一行给出综合推荐意见,需注明推荐理由和适用场景。"
对比一下我原始的版本,差距很明显。原始版本是一个模糊的请求,优化后的版本是一个结构化的任务说明书。后者拿到的结果质量高出一个档次。
为什么这个方法有效
从技术角度看,这个策略之所以有效,核心原因有三个。
第一,弥补了人类的表述盲区。 每个人在写提示词的时候都会受自己认知框架的影响,觉得"理所当然"的东西就懒得写。但AI没有你的背景知识,它需要你把隐含假设都显性化。让AI反问你,本质上就是在做这件事。
第二,模型在自我对齐。 当Gemini追问"你的对比维度是什么"的时候,它其实在调整自己的推理路径,确保最终输出和你的真实需求匹配。这比你单方面给指令、模型单方面执行的效率高得多。
第三,迭代本身就是优化过程。 一次性的提示词很难完美,但经过两三轮问答的迭代,提示词的质量会快速收敛到一个比较高的水平。这跟敏捷开发的思路一样——与其花三天写一份完美的需求文档,不如快速迭代三轮。
不同模型的表现差异
既然聊到提示词优化,顺便说说不同模型在这个任务上的表现差异。
Gemini在追问的颗粒度上做得最好,它会把一个大问题拆成很多小问题逐一确认,生成的提示词结构化程度最高。Claude更擅长理解你的整体意图,追问的次数少但每一问都切中要害。ChatGPT追问比较泛,容易问一堆不太相关的问题,需要你自己过滤。
DeepSeek在中文场景下的追问质量不错,但偶尔会在追问里夹带自己的理解偏差,需要留意纠正。
总体来说,"让模型帮你写提示词"这个策略在主流模型上都能用,但Gemini确实在这个环节的表现相对突出。
这个方法的适用边界
当然,这个策略也不是万能的。
适合的场景: 任务目标明确但你不知道怎么表述的场景。比如数据分析、代码生成、文档撰写、方案对比这类有明确输出格式要求的任务。你心里知道自己要什么,但就是写不清楚,这种情况下让AI帮你理清思路非常有效。
不适合的场景: 需要深度领域知识的场景。比如你让AI帮你优化一个芯片选型的提示词,但你对芯片本身一窍不通,AI追问你的问题你答不上来,那优化出来的提示词也不会好到哪去。AI能帮你表达,但不能替你懂行。
容易踩的坑: 不要过度迭代。追问两三轮就够了,再往下追问,AI开始问一些边边角角的细节问题,对最终结果的提升很小,反而浪费时间。
趋势:提示词工程正在被重新定义
2024年大家都在学"提示词工程",2025年开始有"自动提示词优化"的论文和工具冒出来,到了2026年,这个方向正在变成一个独立的产品赛道。
核心变化是:提示词工程的重心正在从"人写提示词"转向"人和AI协作写提示词"。人负责定义目标和判断质量,AI负责结构化表达和查漏补缺。这个分工比单方面靠人写效率高得多,比单方面让AI自动生成可靠得多。
对于工程师群体来说,掌握这个协作模式比死记硬背prompt模板有价值得多。模板会过时,但"知道怎么跟AI对齐需求"这个能力不会。
说到底,提示词的本质不是文字技巧,是沟通能力。你跟AI对话,和你跟同事沟通项目需求,底层逻辑是一样的——说清楚要什么、为什么要、怎么判断做没做到。Gemini帮你做的,不过是把这个沟通过程变得更结构化了而已。
235