我家里有几个智能插座、一个温湿度传感器、还有一个常年吃灰的网络摄像头。买的时候想着“万物互联”,用起来才发现——它们之间的对话,基本靠我手动转述。
这大概就是物联网目前的真实状态:设备能联网,但不太“智能”。
物联网的老问题:数据多,懂的人少
先捋一下逻辑。物联网设备最不缺的就是数据。温度、湿度、开关状态、运动检测、用电量……这些传感器每秒钟都在产生数字。问题是,这些数据长什么样?往往是冷冰冰的时间戳和数值。
比如你打开智能插座的后台,看到一条记录:“2026-05-13 14:23:17,功率87.3W”。然后呢?你只能自己判断——哦,这时候洗衣机在甩干。
设备不会告诉你“洗衣机快洗结束了”,也不会提醒你“根据过去一周的用电模式,这个设备的电源线可能接触不良”。它只管上报数据,分析的事情,还是得人来干。
传统做法是设阈值:温度超过30度就报警,功率低于5瓦就判断为待机。但这种规则式的方法有两个问题:第一,规则写多了维护起来很麻烦;第二,很多规律不是简单阈值能描述的,比如“每天傍晚用电量会有一个小高峰,但周末会推迟一小时”——这种模式写规则能把人写疯。
AI模型进来之后,有什么不一样?
这两年大家开始尝试把AI模型,尤其是轻量级的机器学习模型,放到物联网系统里。不是说一定要用大模型,很多场景下一个小型分类器或者时序预测模型就够了。
举个例子。
还是那个智能插座。如果接入一个简单的模型,它可以通过学习功率曲线来识别设备类型。冰箱的功率曲线是周期性的,大约每几十分钟启动一次;电热水壶是瞬间冲到高峰然后骤降;电脑的功率则波动频繁但幅度不大。模型不用很复杂,几百KB就够了,跑在网关或者路由器上,甚至可以用TensorFlow Lite Micro直接部署在部分性能稍好的传感器节点上。
识别出设备类型之后,能做什么呢?
-
异常检测:冰箱某天的功率曲线突然变得平滑了,压缩机启动间隔异常,模型可以判断制冷系统可能出问题了。
-
行为预测:通过学习用户习惯,模型知道每天晚上9点到10点之间电热水器会被开启,可以提前提醒用户“要不要现在预热,刚好你洗完澡自动关?”
-
设备联动:摄像头检测到人走开超过30分钟,模型判断“该区域无人”,自动关灯、关空调。
不是多科幻的事情,就是把以前需要人盯着、人判断的事情,交给模型去处理。
大语言模型在物联网里的角色
再说说大语言模型,像GPT、Claude、Gemini这类。它们跟物联网结合,目前有一个很实际的应用方向:作为人跟设备之间的自然语言接口。
什么意思呢?以前你控制智能家居,要么是点App,要么是喊固定的语音指令——“打开客厅灯”“温度调到24度”。其实挺僵硬的。你很难说:“帮我看一下过去一周哪个房间的空调开得最久,然后按耗电量排个序。”
如果能接一个大语言模型,把用户的问题转成对设备数据的查询,再把查询结果用自然语言总结出来,体验就好很多。比如你说:“我最近电费有点高,帮我看看哪个设备有问题。”模型去调取各设备的功耗数据,分析之后回你:“你客厅那台老式取暖器过去三天平均每天开9小时,建议换成变频式或者定时使用。”
当然,这中间需要一套中间件来做几件事:
目前有不少开源方案在做这个方向,比如结合OpenAPI规范和LangChain之类的框架,给大模型一份设备接口说明书,让它自己学会怎么调用。
说起来容易,做起来有哪些坑?
实事求是地讲,AI+物联网目前还不完美,主要有几个现实问题。
第一个是算力问题。 很多物联网设备本身就是单片机级别的资源,内存以KB计,跑不了什么模型。大部分推理任务只能放在网关、边缘服务器或者云端。这样一来,又绕回了网络延迟和成本问题。你总不能为了判断一个灯泡坏了,每次都把数据传到云端跑一遍模型再传回来。
第二个是数据质量。 物联网设备的数据一致性是个老大难。同一个温度传感器,放窗台和放床头,读数能差好几度;有的设备断连重连后时间戳就不准了;还有的设备上报频率忽快忽慢。这些脏数据对模型来说非常不友好。很多做AIoT的人头几个月的精力不是调模型,而是在洗数据。
第三个是误判的成本。 如果AI模型判断错了,后果是什么?比如一个安防摄像头的人形检测模型,把飘动的窗帘识别成入侵者,那顶多发一条假告警。但如果是一个医疗监护设备,错误地把正常心律判为异常,可能就会触发不必要的急救响应。模型越跟执行层靠近,误判的代价就越大。
第四个是大模型的“幻觉”问题。 前面说的自然语言控制,万一模型理解错了怎么办?你说“关掉主卧的灯”,它给你把客厅灯关了——虽然概率不高,但一旦发生,用户信任度会直线下降。目前的解决办法是让模型在输出命令之前先做一次确认,或者限制它只能调用预定义好的功能集,不开放自由度太大的解释空间。
什么样的场景比较适合现在落地?
说了这么多坑,那有没有已经跑得不错的场景?有的。我个人观察下来,以下几类相对成熟:
能耗管理。 工厂、商场、写字楼的各种电表、水表、气表,数据规整,模式相对稳定,而且节能的经济收益很直接。模型在这里做负荷预测、异常耗能检测、设备健康度评估,准确率能做到比较高的水平。
设备预测性维护。 工业设备上有大量的振动、温度、电流传感器。通过模型学习正常运行的信号特征,提前几周甚至几个月发现异常趋势,提醒更换零件。这种场景容错空间大(早告警总比不告警好),而且误判成本可控。
农业大棚环境控制。 温湿度、光照、土壤湿度、CO₂浓度……这些变量之间有明确的物理关系,模型学习起来不费劲。而且即使模型偶尔控制失误(比如多浇了一次水),也基本不会造成重大损失。
智能楼宇的 occupancy detection(占用检测)。 判断房间里有没有人,用不用开灯开空调。结合红外传感器、门磁、CO₂传感器多元数据,模型的判断准确率已经很高。而且这个场景下,宁可误判有人(多开一会儿空调)也不要误判无人(当场关空调让人热着),策略很好调整。
未来会怎么走?
一个比较清晰的趋势是:模型越跑越靠近设备端。也就是常说的TinyML或边缘AI。Google的TensorFlow Lite Micro、ARM的Ethos NPU、还有各种针对MCU的推理框架,都在把这个事情往前推。未来几年,你花几十块钱买的一个传感器节点,可能里面就集成了一个能跑简单模型的芯片,不需要网关、不需要云端,自己在本地就能做异常检测和模式识别。
另一个趋势是:统一的数据抽象层会变得重要。现在每个物联网平台都有自己的数据格式,想要换一个模型或者换一个AI服务商,整个数据管道要重写。如果能有一套标准化的“设备-模型”接口,模型只需要关心输入输出格式,不关心底层是Zigbee还是Wi-Fi还是LoRa,那AIoT的迭代速度会快很多。
至于大语言模型,它短期内不太可能跑到设备端上(太大了)。比较合理的定位是:在网关或云端做一个“意图理解”的角色,把人的自然语言请求转化成设备能执行的指令或查询,再把结果翻译给人。中间的数据处理、实时响应部分,还是交给轻量级模型和传统逻辑。
一点实在的建议
如果你现在手上正好有一个物联网项目,想试着加一点AI能力,我的建议是:
-
先别想着上大模型。从一个分类或回归任务开始,比如“判断设备状态”、“预测下一个小时的温度”,用传统机器学习方法(随机森林、XGBoost)或者一个极小的神经网络就够了。数据量不大的情况下,这些方法往往比大模型更稳、更快、更容易调试。
-
把数据质量摆在第一位。花时间梳理传感器的校准情况、数据的缺失模式、时间戳的对齐方式。这一步做好了,后面模型训练会顺利很多。
-
想清楚误判的后果。如果模型输出只是展示给用户看,那可以大胆点;如果模型输出要直接控制设备,就要加冗余和多层验证。
-
别被“智能”两个字忽悠。很多时候,一个简单的规则引擎配合良好的用户界面,比一个黑盒模型更实用。AI不是万能药,它有它的适用边界。
AI和物联网的结合,本质上不是要把每个设备都变得“聪明”,而是让数据流动的过程中少一些需要人手动干预的环节。温度高了就开空调,人走了就关灯,设备坏了就提前报修——这些事情本来就应该自动化,AI只是让自动化的规则不再那么死板而已。
你说它革命性吗?不至于。但确实,会让那些原本“能联网但不好用”的设备,慢慢地变得稍微好用了那么一点。对于每天跟这些东西打交道的工程师和普通用户来说,这一点点进步,也值得期待。
155