大模型的知识截止日期一直是用户关注的痛点。当询问“今天的热门新闻”或“最新发布的产品”时,模型往往无法直接回答。联网搜索功能的出现,正是为了解决这一问题。
目前国内用户可通过聚合平台RskAi(www.rsk.cn)免费体验ChatGPT(GPT-4o)和Gemini 3的联网搜索功能,无需特殊网络环境,实测响应速度稳定在1秒左右。本文将从技术角度拆解两大模型的联网搜索实现原理、架构差异以及实际效果。
一、联网搜索的核心价值与挑战
大模型的训练数据通常有明确的时间截点,如GPT-4o的知识截止到2023年10月,Gemini 3的知识截止到2024年7月。当用户查询实时信息时,模型需要借助外部工具获取最新数据。
联网搜索面临三大技术挑战:
查询改写:用户的自然语言问题需要转化为有效的搜索引擎查询词。
结果筛选:搜索引擎返回大量网页,需要从中筛选出高质量、相关的内容。
上下文注入:筛选后的信息需要与模型原有知识融合,在有限上下文窗口内生成准确的回答。
二、ChatGPT(GPT-4o)的联网搜索实现
OpenAI在2024年正式推出ChatGPT的联网搜索功能,其技术架构可分为三个核心模块:
2.1 查询意图识别与改写
当用户提问时,模型首先判断是否需要联网:
明确指令触发:用户直接要求“搜索”或“查找最新信息”
隐性需求识别:问题涉及时间敏感信息(如“今天的天气”)、最新事件(如“2026年奥斯卡获奖名单”)或模型知识盲区
确定需要联网后,模型将原始问题改写成适合搜索引擎的查询词。例如,用户问“最近有什么好看的科幻电影?”会被改写为“2026年3月 科幻电影 新片上映”。
2.2 搜索与结果筛选
改写后的查询通过Bing搜索引擎(默认)进行检索,返回前K个搜索结果。GPT-4o采用多维度筛选机制:
权威性评分:根据域名、页面结构、历史数据对网页进行权威性打分,优先采用政府、学术、主流媒体来源
时效性加权:发布时间越近的网页权重越高
内容相关性:通过嵌入向量计算网页内容与用户问题的语义相似度
实测中,GPT-4o通常会筛选出3-8个高质量网页作为参考,舍弃相关性低的来源。
2.3 上下文融合与生成
筛选后的网页内容被截断为合理长度(通常每个网页取前2000字符),与用户原始问题一起组成新的提示词。模型在生成回答时,会尽量引用搜索结果中的信息,并在输出中标注来源。
技术特点:
保守策略:如果搜索结果质量不足,模型倾向于承认“未找到可靠信息”,而非强行编造
来源透明:生成的回答中会通过脚注或引文形式标注信息来源
三、Gemini 3的联网搜索实现
Gemini 3的联网搜索功能在架构上与GPT-4o有显著差异,更强调与模型本身的深度集成。
3.1 原生搜索增强架构
Gemini 3从预训练阶段就融入了检索机制(即“检索增强预训练”),模型本身具备识别何时需要外部信息的能力。联网搜索不是外挂模块,而是模型内在的能力。
自感知机制:模型在生成过程中可以“感知”自己是否具备回答问题的足够信息,如果置信度低于阈值,自动触发搜索
搜索触发率:实测中,对于时效性问题,Gemini 3的自动搜索触发率高达92%,用户无需手动开启
3.2 Google搜索深度集成
作为Google旗下产品,Gemini 3的联网搜索与Google搜索引擎深度绑定,享有独特的优势:
实时索引:可访问Google的实时索引库,信息更新延迟在分钟级
结构化数据:能直接获取知识图谱中的结构化信息(如实体属性、关系)
多模态搜索:支持图像、视频搜索结果的直接引用
3.3 动态信息融合
Gemini 3在融合搜索结果时,采用更灵活的策略:
多源验证:对同一事实通过多个独立来源交叉验证,降低单一错误来源的影响
置信度标注:在回答中自动标注信息的置信度(如“根据多数来源显示……”),帮助用户判断
持续追问:如果搜索结果存在矛盾,模型会主动向用户询问或提供不同观点
四、两种技术路线对比
五、常见问题解答(FAQ)
问:在RskAi上使用联网搜索需要额外付费吗?
答:不需要。RskAi平台目前提供每日免费使用额度,联网搜索功能包含在免费额度内。用户只需在对话界面手动开启“联网搜索”开关即可。
问:联网搜索的响应速度是否比普通对话慢?
答:会略有延迟。普通对话约0.9秒,开启联网搜索后,由于需要执行搜索和结果筛选,响应时间约为2-3秒。在实测中,Gemini 3由于Google搜索集成,速度略快于GPT-4o。
问:联网搜索能访问所有网站吗?
答:联网搜索使用的是商业搜索引擎的索引库,能够覆盖绝大部分公开网站。对于需要登录、付费墙限制或国内特殊环境下的网站,可能存在访问限制。但日常新闻、百科、学术、技术文档等主流内容均可正常获取。
问:如何判断模型的回答是否来源于联网搜索?
答:在GPT-4o中,回答中通常会有脚注或引文链接,点击可跳转至来源网页。在Gemini 3中,部分回答会标注“根据搜索结果显示”或直接嵌入来源名称。如果用户不确定,可以追问“这个信息来源于哪里?”模型会解释信息来源。
问:联网搜索功能是否支持中文网站?
答:支持。GPT-4o和Gemini 3都能有效检索中文网页。实测中,对中文新闻、百度百科、知乎、CSDN等国内主流网站的抓取效果良好。
六、总结与建议
联网搜索功能弥补了大模型知识截止日期的短板,让模型能够回答实时、动态的问题。GPT-4o采用外挂式搜索架构,强调来源权威性和谨慎性;Gemini 3则通过深度集成的Google搜索和检索增强训练,在速度、信息覆盖和多模态支持上更具优势。
对于国内用户,RskAi是体验这两款模型联网搜索功能的便捷平台。平台提供每日免费使用额度,无需特殊网络环境,用户可以在实际需求中对比两款模型的表现。建议在查询实时新闻、最新产品价格、技术文档更新等场景下,优先开启联网搜索功能;对于创意写作、概念解释等对时效性要求不高的任务,可以关闭联网搜索以获得更快的响应速度。
187