• 正文
  • 相关推荐
申请入驻 产业图谱

LOFIC技术如何攻克纯视觉自动驾驶复杂光照下的感知瓶颈?

5小时前
332
加入交流群
扫码加入
获取工程师必备礼包
参与热点资讯讨论

 

自动驾驶的技术路线之争中,纯视觉方案凭借其更接近人类驾驶逻辑、更低的成本以及更具扩展性等优势,成为很多主机厂的主要选择。但纯视觉系统在隧道进出的明暗剧变、夜晚逆光下的强光直射、以及城市街道随处可见的LED信号灯频闪等极端光照条件下表现有时不尽人意,这也成为很多人推崇激光雷达方向的原因。

最近在讨论极端光照条件对摄像头影响时(相关阅读:极端光照条件如何影响自动驾驶摄像头?),就有小伙伴提出了横向溢出积分电容(Lateral Overflow Integration Capacitor,简称LOFIC)技术,今天就带大家来聊一聊。

光电转换的物理边界与传统HDR的短板

在聊LOFIC技术之前,我们必须先了解摄像头传感器捕捉光线的原理。图像传感器的每一个像素,实际上都可以被看作是一个用来收集光子并将其转化为电荷的“蓄水桶”。在理想状态下,光线越强,桶里的电荷就越多,转化出的图像信号也就越明亮。

然而,这种物理结构存在一个天然的限制,即“满阱容量”(Full Well Capacity,FWC)。当光线极其强烈时,像素桶中的电荷会迅速填满并溢出,导致图像出现大面积的过曝和细节丢失。在自动驾驶的场景中,有一个场景可以很好地体现这一特征,那就是车辆从黑暗的隧道驶向阳光刺眼的出口时,摄像头会经历短暂的“失明”,无法识别前方的路况或障碍物。

为了应对这种极端的光照场景,行业内普遍采用高动态范围(High Dynamic Range,HDR)技术。最常见的做法是“多重曝光合成”,即让传感器在极短的时间内连续拍摄几张曝光时间长短不一的照片,然后再通过后期算法将它们拼接在一起。通过这种方式,曝光时间短的照片保留了高光细节,曝光时间长的照片则看清了暗部阴影。

但在自动驾驶这种高速运动场景中,这种合成方式带来了一个致命的缺陷,即运动伪影(Ghosting)。由于多张照片的拍摄存在时间差,即使只是几毫秒,对于时速百公里的车辆来说,画面中的物体已经发生了显著的位移。合成后的图像边缘会出现重影、虚影,这会严重干扰自动驾驶神经网络模型对物体边缘、深度和运动轨迹的判断,甚至可能导致算法对前方障碍物识别失误。

除了运动伪影,自动驾驶还面临着另一个由于曝光逻辑产生的难题,那就是LED信号灯的频闪。现如今,交通信号灯、路牌以及汽车尾灯几乎全部采用LED光源。由于LED是通过脉冲宽度调制PWM)来控制亮度的,它们实际上是在极高频率下不断闪烁,只是人眼无法察觉。如果摄像头的曝光时间太短,恰好抓拍到了LED灯熄灭的那个瞬间,那么在系统输出的画面里,信号灯看起来就是灭的,或者在持续跳动。这种不稳定的视觉输入,对于依赖视觉信号进行红绿灯识别和车距保持的感知算法而言,无疑是巨大的干扰源。

下表展示了不同动态范围技术在处理高速自动驾驶场景时的表现差异,从中可以清晰地看到传统方案的局限性。

技术方案 实现逻辑 运动物体表现 LED频闪消除(LFM) 硬件成本与复杂度
标准动态范围(SDR) 单次固定曝光 无重影,但高光/暗部易丢失 差,高光下曝光太短
多重曝光HDR 多帧合成 产生严重重影(Motion Artifacts) 极差,受限于短曝光周期
双增益(DCG)HDR 单次曝光,高低增益读取 无重影,提升了暗部细节 较差,无法从物理上解决高光溢出
分块像素(Split-Pixel) 大小像素分别采样 较好,但可能降低分辨率和信噪比 较好
LOFIC单次曝光 物理电容收集溢出电荷 完美(无重影) 优秀(支持长曝光) 高(高性能硬件集成)

LOFIC技术的物理机制

LOFIC技术,其实是对图像传感器像素结构进行了一次重组。它的全称是“横向溢出积分电容”,顾名思义,就是在每个像素的光电二极管(PD)旁边,额外增加了一个用来承接“溢出电荷”的高密度电容。

如果把传统的像素桶比作一个容易装满的水箱,那么LOFIC技术就是在主水箱的侧面开了一个溢流口,并连接了一个容量大得多的备用蓄水桶。当外界光线变强、主水箱的电荷快要满溢时,多出来的电子会通过一个受控的晶体管开关,流进这个侧向的积分电容中,而不会导致信号丢失白或信号饱和。

电路层面上看,这种设计允许传感器在单次曝光的过程中,同时利用两种不同的模式来采集光信号。在光线较暗的区域,传感器关闭溢流开关,利用高转换增益(HCG)模式捕捉极其微弱的光信号,确保暗部图像纯净、噪声降低。而在光线极强的区域,传感器开启溢流路径,让电容介入工作,进入低转换增益(LCG)模式,从而大幅度扩充像素能够容纳的电子总数。这种“单次曝光、双路并行”的处理逻辑,使得单个像素的满阱容量(FWC)可以从传统的3万个电子,跃升至27万个甚至更多。

这种物理电荷收集方式带来的最直接好处就是,传感器在极强光下不再需要缩短曝光时间。既然有了“副蓄水池”来承载溢出的电子,完全可以延长快门时间,让摄像头在每一帧中都能捕捉到一个完整的LED闪烁周期。这意味着,LOFIC从物理层面上完美解决了LED频闪的问题(LFM),让交通信号灯在视频流中始终保持稳定的常亮状态。

由于所有亮部和暗部的信息都是在同一次快门开合的过程中完成收集的,图像中就不存在任何的时间错位,从而彻底消除了运动重影。对于时速超过100公里的自动驾驶车辆而言,这种“时空一致”的高清画面是感知算法进行精确决策的前提。

在实际应用中,这种动态范围的扩展是极其惊人的。衡量动态范围的单位是分贝(dB),传统车载传感器的动态范围通常在60dB到90dB之间。而采用LOFIC技术的传感器,单次曝光下的动态范围可以轻松突破120dB,甚至达到140dB。从视觉效果上看,意味着在同一个画面里,既能看清隧道内黑暗处的墙壁纹理,也能看清隧道外阳光下远方车辆的牌照。这种对真实世界的极致还原,为纯视觉系统在复杂光影环境下的安全驾驶提供了坚实的保障。

我们可以通过动态范围的数学定义来更直观地理解这种提升。动态范围DR通常定义为最大可测信号(即饱和信号N_{sat})与最小可测信号(即暗噪声N_{dark})的比值:

在LOFIC结构下,N_{sat}因为电容的引入而增加了近一个数量级,同时配合双转换增益技术(DCG)降低了N_{dark},双管齐下可以让结果实现了指数级的跨越。这种硬件层面的进化,让原本依赖后期复杂算法修补的视觉方案,回归到了“获取高质量原始信号”的初心上。

LOFIC对自动驾驶算法的深度优化

高质量的硬件数据输入是算法模型的营养来源。在自动驾驶感知的架构中,基于Transformer的BEV(Bird's Eye View,鸟瞰图)模型已成为主流。这类算法的核心逻辑是将安装在车身周围的多个摄像头捕获的2D图像特征提取出来,然后通过一个复杂的空间变换网络,把它们“缝补”到一个统一的、俯视角的3D空间中。如果把这个过程比作拼图,那么摄像头提供的每一张照片就是拼图的碎块。如果碎块本身是模糊的、过曝的或带有频闪干扰的,那么最后拼出来的3D感知结果就会出现各种逻辑漏洞。

LOFIC技术对感知算法的赋能,首先体现在特征提取的稳定性上。在进入神经网络的骨干网络(Backbone)之前,图像数据需要经过预处理。如果传感器输出的数据在明暗交替处有明显的“底噪”,或者在高光区域细节全无,那么神经网络在提取车道线、路沿或者行人轮廓等特征时,置信度就会大幅下降。

特别是在BEV架构下,系统需要对不同视角的画面进行融合,LOFIC提供的高线性度、无运动伪影的图像,使得各视角之间在特征对齐时变得异常平滑。这显著提升了系统对远距离物体的检测精度,使车辆能够在更远的地方提前预判前方光照异常区域的潜在危险。

对于3D占位网络(Occupancy Network)这种前沿算法,LOFIC的重要性更是不言而喻。占位网络的目标是判断空间中每一个体积单位(Voxel)是否被占据。这需要模型对场景的深度信息有极强的感知力。深度感知在很大程度上依赖于图像中的纹理和对比度细节。当视觉传感器在强光下发生饱和时,图像中的纹理会消失,变成一团白色,导致算法无法推算出那块区域的深度。LOFIC保留了高光区域的精细纹理,使得算法在处理诸如“正午阳光直射下的雪地”或“湿滑路面的强光反射”等场景时,依然能准确识别出路面的起伏和障碍物的形状,避免感知系统出现“真空区”。

此外,自动驾驶系统的实时性要求极其严苛。多重曝光合成HDR不仅会增加传感器的功耗,还会给后端图像信号处理器ISP)带来巨大的计算负荷。每一帧图像的合成都需要消耗宝贵的计算资源,并产生一定的处理延迟。对于每秒钟需要处理数十帧画面、车速极快的自动驾驶系统来说,毫秒级的延迟就可能导致危险。LOFIC技术通过硬件电路一次性完成了高动态范围信息的收集,极大地简化了后端的处理逻辑,降低了系统整体的功耗和延迟,让算力能够更多地分配给更高级的规划和控制任务。

产业趋势与未来展望

随着自动驾驶技术向L3、L4级别演进,行业对视觉感知的容错率正在趋近于零。在这一背景下,传感器厂商的技术竞赛已经从单纯的“比拼像素多少”转变为“比拼像素质量”。LOFIC技术在提升像素动态范围和消除频闪中有明显的优势,正迅速从实验室走向大规模量产。

从市场发展来看,LOFIC技术的应用正在重塑车载摄像头的标准参数。未来的主流车载摄像头将不再只是简单的成像单元,而是集成多种增益模式、自带电荷管理电容、具备硬件级LFM能力的精密智能感知节点。虽然这种技术的引入会带来单个传感器硬件成本的提升,但它为整车带来的价值是巨大的。它减少了对冗余传感器的依赖,降低了算法训练中由于处理噪声数据而产生的研发成本,更重要的是,它为纯视觉方案补齐了一块“光学短板”,让视觉方案能够在更多极端环境下挑战激光雷达的地位。

最后的话

展望未来,随着传感器技术的进一步微缩化和3D堆叠工艺的成熟,LOFIC技术有望与片上AI处理单元更紧密地结合。未来的传感器可能在电荷离开像素的那一刻,就已经完成了初步的语义筛选和特征增强。在这个演进过程中,横向溢出积分电容作为底层的物理创新,将持续发挥其“副水箱”的作用,让自动驾驶无论在何种光影变幻中,都能始终如一地看清前方的道路。对于纯视觉自动驾驶而言,LOFIC不仅仅是一项硬件改良,更是通往全天候自动驾驶时代的入场券。

相关推荐