预测未来发展趋势其实是一件很困难的事情,从个人的理解来看, 笔者希望2019年视频监控市场能在以下方面取得突破:
一、ReID
事实上,遍布城市的摄像机里面,扣除卡口摄像机、电子警察用的抓拍摄像机之外,符合人脸采集标准的摄像机相对而言凤毛麟角,占比极少。而要最大限度挖掘传统平安城市、天网工程的治安摄像机的潜力,无疑ReID是不二之选。
ReID(Person Re-identification),也称为行人重识别、行人再识别、跨镜追踪,是利用计算机视觉技术判断图像或者视频序列中是否存在特定行人的技术,广泛被认为是一个图像检索的子问题,目前主要应用于安防领域,未来与人脸识别相结合能够应用于更多更丰富的场景。
ReID本身是一个非常难的问题,它是要从不同的视频之中,把同一个人识别出来。视频光照条件的不同、感兴趣区域的分辨率和角度的不同、目标被遮挡的情况普遍、穿着相近衣服的人等等,都会造成识别的困难。对于监控领域来说,ReID引申出来在实际应用上就是希望把不同视频内的物体关联起来,并可以透过有效的方法把物体找出来,能做到这样整个监控操作才完整,才能看到大局。
图片来源:图虫创意
二、LoRa技术
LoRa是Semtech公司推出的超远距离通信的无线标准。LoRa是低功耗广域网的一种,源于Long Range这两个单词。其具有超远距离、低功耗等特点,并且只需要一个网关就可以管理非常多的设备,这也从一方面降低了LoRa的部署成本。这对IoT技术在城市中的应用很重要,远距离、低功耗、大规模这三点具有足够的杀伤力。LoRa技术是可以实现和AI、视频监控进行深度融合的,尤其是在视频监控触发联动报警应用方面。
三、智慧城市建设新模式
最近两年随着AI技术的发展,AI赋能城市的能力逐渐显现,不仅在视频监控,在社区、医疗、教育、金融行业都催生了很多全新的应用。以华为公司为例,在2018华为全联接大会上,华为云推出EI城市智能体,用AI提供更优秀的城市交通、水务、环保、燃气等方案。这场大会标志着华为云开启了芯片+框架+平台+服务全栈协同的组合拳打法,开始全面对标国际AI巨头。
我们相信在2019年,将会出现多类型、多样本的全新的智慧城市建设新模式,而这都是AI所带来的,AI将在城市中无所不在。
四、大脑工程
AI说到底还是模拟人的大脑,如果我们将AI赋能的应用能力放在城市就是建设城市大脑。城市大脑的提法要比智慧城市更精炼,是城市管理的中枢神经系统,概念可能比智慧城市再小一点。如果把城市大脑分解得小一点,就会有城市警务大脑、城市交通大脑。
过去一年内,我们看到落地比较好的包括了阿里的城市大脑模式、方纬(佳都科技旗下企业)的城市大脑模式和百度的城市大脑模式,不过以实际落地来看,交通大脑是最先落地的,这是因为交通的基础设施比较好,遍布城市的红绿灯、信号灯、电子警察和卡口摄像机,这都和视频监控紧密相关。
在2019年应该会有不少于10个大中型城市会启动城市大脑的相关建设工作。
五、视频大数据和视频云的DT时代
数据时代(DT)已经被提了一些年,但对视频监控行业而言,真正的DT时代启于2018年,在2019年开始大面积落地。
非结构化的视频图像数据被结构化之后就能够形成视频图像大数据,这些数据可以分为四类:
一是全景数据。包含空间维度内的人、车、物、手机、门禁、WIFI、物联感知、地图、地址、门牌号、网格、人口、房屋、单位、城市部件等数据。全景数据体现的是多场景内的全数据、多维度的数据解析。
二是全量数据。在全景数据的基础之上包括时间维度,全时空数据,包含轨迹、活动、事件等数据。
三是全域数据。在全景数据之上构建数据之间的关联,属于多维关联信息,多渠道、多视角、多侧面收集而成。包含了系统所有信息的模型,实现数据的关联、碰撞和多维感知。
四是全息数据。将全域数据和视频图像进行融合,产生立体化空间、多维度、相互关联的全时空数据。典型应用包括3D全息投影、虚拟显示VR、增强显示AR。全息数据体现的是社会属性,体现的是数据价值。
笔者判断,数据时代视频监控的特点就是能够全面看、自动看、关联看。全面看,即视频图像一体汇聚、全网共享。大范围内多维数据的跨系统、跨区域共享。自动看,是高密度、高算力、多算法框架、千亿级图片秒级检索,算得快、比得准。关联看,视频大数据与社会、网络、政务、警务大数据等资源的碰撞分析。实现“图事件关联”、“人脸、车辆、手机等多轨合一”等应用。
六、3D、AR、VR深度融合应用
2018年北京安博会作为视频监控行业发展的风向标,我们能够看到的视频应用系统已经逐渐过渡到三维的深度融合,就是将3D地图、AR、VR三度技术和视频、数据进行深度融合,然后开发出全新的应用。
这种深度融合应用的基础将是视频监控联网平台、视频解析平台、视频图像信息数据库,还有一种城市管理基础信息数据平台(也被称为一标三实网格化系统),而这些数据都能够和3D、AR、VR相结合。比方说我们可以将多维数据直接内嵌到三维的地图里面来,通过AR增强显示的方法将视频直接内嵌到地图中来,实现可视化实时城市画面呈现,通过VR技术将各类数据直接投视在人的眼中,实现信息数据的及时获取。
七、声纹+CV技术
音视频系统中的声音笔者认为一直没有得到充分挖掘,我们已经看到众多的CV头部企业对语音都进行了大手笔的投入,市面上也出现了众多的语音识别公司,虽然在2018年我们并没有看到特别好的声纹+CV技术结合的应用,但笔者相信二者相结合将产生巨大的潜力。以门禁系统为例,我们可以采用人脸+声纹的双模式,输入一个人脸然后调取一个人的声纹进行二次确认,或者输入一个人的声纹然后再调取一个人的人脸进行二次确认,就能够实现1:1的精确匹配,可大大提高人脸识别的准确率和误报率。希望2019年在这方面能够看到行业的新应用、新热点。