近日,吴恩达创立的 AI 公司 Landing AI 发布了一款社交距离检测工具,帮助疫情期间不得不工作的人,确保他们在工作场所的社交距离,该工具可以通过分析摄像头拍摄的实时视频流来检测人们是否保持安全距离。例如,在一家生产防护设备的工厂,技术人员可以将该软件集成到他们的安全摄像系统中,通过简单的校准步骤来监视工作环境。如下面的演示所示,探测器可以用红色高亮显示距离低于最小可接受距离的人,并在两者之间画一条线进行强调。该系统还能发出警报,提醒人们在违反协议时保持安全距离。Landing AI 对此次开发软件的技术方法进行了详细的介绍,搭配摄像机的软件技术包含三个主要步骤:校准、检测和测量。

 

校准

由于输入的视频由任意的透视角度拍摄,因此视频输入的第一步是利用计算将透视视图转变为鸟瞰视图,即将自上而下视图转为单应性矩阵视图(计算机视觉中意思是从同一个源发出的光而得到的变化图,即射影变换),这个过程被称为校准。由于输入帧是从单个摄像机获取的单眼图像,因此最简单的校准方法是在透视图中选择四个点,并将它们映射到鸟瞰视图中的矩形角,这是假设每个人都站在同一平面上。这个原理可以应用于整个透视图的转换。这种方法虽然广为人知,但能在现实中正确地应用却并不容易。因此,Landing AI 开发人员构建了一个轻量级工具,即使是非技术用户也可以实时校准系统。在校正步骤中,他们还考虑了鸟瞰图的比例系数,例如现实生活中 6 英尺对应多少像素。

 

图片来自 Landing AI 官网

 

左边是原始的透视图,上面覆盖了一个校准网格。右边是由此产生的鸟瞰图。街道的两边完全平行于绿色网格。

 

检测

视频输入的第二步涉及到将行人检测器应用到透视图上,以便在每个行人周围绘制边界框。为了简单起见,开发者使用了一个基 Faster 于 R-CNN 架构的开源行人检测网络。为了清除输出边界框,采用最小的后置处理,如非极大值抑制(NMS)和各种基于规则的启发式算法; Landing AI 方认为,开发者应该选择基于现实生活假设来选择规则(例如,识别人类的身高而非宽度),以最大程度降低过度拟合的风险。

 

测量

第三步,给定每个人边界框,预估他们的在鸟瞰图中的坐标位置(x 轴, y 轴)。由于校准步骤输出一个平面图的变换,因此开发者将该变换应用到每个人的边界框的底部中心点,从而得到他们在鸟瞰视图中的位置。最后一步是计算出每两人之间的鸟瞰图距离,并根据标定得到的比例系数对距离进行缩放处理。用红色突出那些距离低于最小可接受距离的人,并在两者之间划一条线进行强调。考虑到计算机视觉的兴起带来了隐私和个人权利问题, Landing AI 表示,他们目前的系统不会识别个人,也将敦促任何使用此系统的人必须做到公开透明且仅在当事人知情同意的情况下使用。Landing AI 总部位于美国硅谷,由前百度首席科学家、前谷歌大脑创始人之一吴恩达于 2017 年底创办,专注于为传统企业提供人工智能转型方案及服务。截至目前,Landing AI 已获得包括三星、阿里巴巴、联想、英特尔、AIFund 等多家机构的投资。据悉,国际权威咨询机构 Gartner 发布了《2020 人工智能核心技术最酷供应商报告》,Landing AI 凭借其助力企业实现人工智能落地与规模化应用方面的成绩成功入选。