项目概述
一、项目背景
本文是讲述本公司独立自主研发产品三维声敏智能全景声音复核系统的应用。(如图)


据推测,我国现在有近一半人口居住在城市,2050年将有75%的人口居住在城市。快速的城市化进程一方面给中国经济发展做出了重要贡献,另一方面城市在环境、基础设施建设、生活质量、人口、公共服务等方面也产生了相应的问题。我国提倡智慧城市发展,智慧城市是通过新一代信息化技术,提升城市管理者对城市方方面面信息的感知能力、信息的分析和处理能力,从而进一步提供有针对性的新服务和新模式。
平安城市是智慧城市不可或缺的组成部分,是一个综合性非常强的管理系统,不仅需要满足治安管理、城市管理、交通管理、应急指挥等需求,而且还要兼顾灾难事故预警、安全生产监控等方面对图像声音监控的需求。我国“天网工程”多年来已在全国各大城市实施建设,摄像机安装了成千上万,像素从200万到400万甚至800万,但是,只有图像,没有声音,对于反恐,案情侦破,嫌疑人锁定等,实时的声音复核是多么的宝贵!
二、项目需求
需安装一套智能声音复核系统,能清晰的听到现场的声音,对于嘈杂环境声音采集分类。传统拾音器,无法避免风雨嘈杂声所受到的干扰,所以要求整体性能更稳定、更可靠,即在保证对声音目标准确有效的采集提取基础上,又能够减少自然环境和其它干扰源的影响,尽可能的减少故障率。
三、 建设目标
智能全景声音复核系统建设的总体目标是:可靠的语音智能分析和声音复核为一体的智能声音复核系统,实现全天24小时声音监控功能。
技术介绍
一、智能声音复核技术现状
目前我国城市室外摄像机没有配套声音复核系统,只有图像没有声音,普遍市面上的拾音器都只能室内使用,到室外遇到风雨就没有声音。
二、三维声敏智能全景声音复核系统
三维声敏声音复核系统新一代声音监控系统,不同于普通的拾音器,只限于室内使用,该系统以地下声敏传感器为主要声音采集手段,运用现代信号处理技术,信号分析技术,实现了空间、地面及地下声音分析判断,形成三维立体球型360°全景声音监控功能。
本系统可实时监控半径40米内的地下地面范围内的人耳可听到的“现场真实的声音信号”进行智能分析。
本系统创新提出地下拾音、集群监听、和声音复核的理念,借助系统内置的AI深度学习算法模型,构建声音特征库,对前端采集到的声音信号进行AI声音识别,屏蔽现场不需要的声音:如动物叫声、打雷声、鸣笛、下雨、汽车火车,等等。实现目标定位及跟踪。并可在多种复杂环境下安装,不受温度、湿度影响符合智慧城市特征。
1. 产品性能和技术优势
▲技术先进性
三维声敏智能全景声音复核系统是本公司独立自主研发创新在安防行业的一款声音监控技术产品,获多项我国发明专利,已通过公安部的检测。目前,在清东陵、清西陵、元上都等世界文化遗产及上百个我国重点文物保护单位已成功应用。
该系统可广泛应用于文博、要地边境、军营园区、石油化工、平安城市以及其他有声音监控需求的重要场所。非常适合长距离、大范围的应用。
该系统具有智能化行为模式判别,模仿人耳识别能力,可根据客户需求定制不同声音分类,系统可排除飞鸟、小动物、打雷、下雨等各种干扰只对真实有效的声音进行提取,实时获取目标声源点的方向和距离,实现对目标的定位及跟踪。在各种气候条件下均能稳定良好运行。
▲专业灵敏度高
传统室外拾音器,弊端就是刮风天风声会让放大器饱和,无信号输出。地下声敏采用独有的固体传声技术(包含多项专利),有效的杜绝了风声等环境因素干扰,本产品前端传感器采用固体传声、腔体谐振技术,先将声音信号通过腔体结构进行一次物理放大,通过压电转换后将电信号进行二次放大,以数字信号方式传输。不仅能够探测到空间和地面半径40米的声音信号,而且能探测到地下40米或更远的微弱信号,该技术使得地上、空间、地下立体三维全景360°监听得以实现。产品灵敏度高,在室外不受风雨干扰而影响拾音效果。
△ 语音可懂度探测范围:语音声源的声强60-70dB(A),语音可懂度(80%左右),探测范围半径20米。
△ 语音可拾取边界范围:语音声源的声强60-70dB(A),语音可拾取(隐约听到)边界范围半径30米。
△ 地上挖掘探测范围:挖掘声源的声强55-65dB(A),地上挖掘探测范围半径20米。
△ 地下挖掘探测范围:挖掘声源的声强55-65dB(A),地下挖掘探测范围半径40米。
△ 爆破探测范围:爆破探测范围半径500米.

▲AI声音智能分析
声音监控明显的技术难题是噪音处理,特别是野外自然界的噪音抑制。
本系统的噪音信号处理与分析是依靠目前国际前沿技术,小波分析和神经网络技术对声音信号(需要的信号)和自然声音(噪声)进行特征提取及识别。
由于需要的声音信号是复杂而多变的,系统很难学习与判断,而自然界噪音信号特征基本是固定的,用AI智能分析技术将其滤除后,系统采集到的需要的声音就会提高清晰度。当环境噪音较大时,系统自动衰减输入信号以避免采集噪音。当出现环境共模噪音时(如雷、雨、爆竹)系统通过分析、处理以后自动抑制,可以显著降低噪声。
产品采集都是真实还原声音,该项技术的发明在行业中初次实现。
▲隐蔽、能耗低、美观
传感器隐蔽埋于地下,并可进行水下敷设,不受地形、环境限制。自然环境的声音不受干扰,可以长距离敷设,地面无痕迹与周围环境融为一体。整套系统为被动声音拾取技术能耗低使用寿命可长达十年。
▲目标定位和移动跟踪
利用声达时间差算法,并结合已知传感器阵列的空间位置,实现目标的定位。实时获取目标声源点的方向和距离,得到目标移动路线,实现目标的移动跟踪。
▲综合管理平台
系统根据用户实际功能需求,硬软件结合,由世纪之星的软件综合管理平台进行统一管理,可实现三维声敏智能声音复核系统的音视频联动、一键管理、实时回放、实时存储和实时点播等功能。
三、国内外相关技术发展现状及趋势对比
1. 国内外现状及未来趋势
音视频监控是安全防范系统的重要组成部分,它是一种防范能力较强的综合系统,直观、准确、及时和信息丰富是其突出的特点。传统的监控系统在很多场合都没有声音,人们只能看到无声的图像,音频监控并未能得到很好的推广。音频监控作为安防行业迅速发展的一个分支,近年应用点在不断扩大。
2. 国内外水平对比
音频监控系统由拾音器、播放器、录音设备等构成,而核心是拾音器。
目前安防拾音器头部品牌,如国外的博世、霍尼韦尔,国内的海康、大华、快鱼、世邦等厂商的拾音器均是空间型拾音器,它通过接收在空气中传播的声音信号拾取声音。在室内应用效果好,但在室外应用时,空间拾音器受风干扰,产生强大的风噪,使得拾音器无法获取有效声音信号,具有很大的局限性。
地下声敏传感器采用了国内外原创的地下拾音技术,利用固体传声、腔体谐振的原理,将传感器浅埋于地下50-2500px,拾取到现场真实的声音信号,适用于任何环境。声音信号被采集后传回三维声敏系统后端,通过AI声音分析,建立声音特征库不断适应现场新的声音,识别出需要的声音并进行分类、复核,是目前国内外唯一通过地下拾音技术,实现声音跟踪定位、声音监控的音频复核系统。
设计方案
一、系统构架
以全长4公里的城市街道为例,每个地下声敏传感器防护半径40米,需要50个。配备1台音频分析服务器,信号通过光缆传回监控中心。
系统图:

2. 系统组成
三维声敏预警报警复核系统由以下几部分组成:地下声敏传感器、八通道音频网络传输终端(音频网络编解码器)、音频分析服务器、AI控制主机。
2.2.1 地下声敏传感器
地下声敏传感器(型号DSG-2)采集地上、地下、空中音频范围的全方位信号,并将模拟音频信号经数字化处理调制后,转换为光信号,由光端机发送(发射光端机内置),发送的光信号通过光口 (FC)与光纤(单模)连接传输。
特点:适用于隐蔽安防工程的入侵探测。
主要技术参数
l 电源电压:AC15V±10% 工作电流:≤90mA
l 频率:谐振频率1KHz±0.2KHz;调制频率200KHz±2KHz
l 接口:光端机接口(内置,波长1310nm FC 口,通过单模跳线连接)
l 光输出功率:≥-10dbm
l 输出幅值:接收声强为 60dB(A)时,输出幅值应>1. Vp_p.
l 噪声输出 :当环境噪音为 30 dB(A)时,噪音输出应 <100mVp_p.
l 电磁兼容:符合GB/T 17626中 2-2006、3-2006、4-2008中的相关规定
l 埋设深度:顶端距离地面20-1250px
l 传输距离:20km
l 环境温度:-40℃~ +85℃ 相对湿度:100% 防水、防腐蚀。
l 外壳防护等级:IP68等级。
2.2.2 八通道音频网络传输终端(编码)
八通道音频网络传输终端(编码),可通过局域网/互联网实时传输音频数据,包含8路光纤接口,1路互联网接口。
主要技术参数
l 电压:DC12V
l 网络接口:RJ45接口
l 传输协议:RTMP
l 采样率:48K
l 带宽:20hz~6.5Khz(-3db)
l 输入信号≤3.8V(增益设置最小)
l 输入信号≥1mv
l 失真度:0.1%
l 信噪比:70db
l 温度:-25~85℃
l 湿度:≤95%RH(无凝结)
2.2.3 音频分析服务器
音频分析服务器内置深度学习算法模型,建立声音特征库,将经常引起误报的声音(如过车、火车、飞机、狗叫、打雷、鸣笛)等等入库,同时也可采集现场声音训练入库。报警方式为噪音过滤模式,用户可根据现场需求将声音特征库里的一个或多个声音类型设定为不报警的声音类型。如设定过车、打雷、鸣笛声音不触发报警,则识别出以上声音时不触发报警,其他声音进行报警。分析结果上传至AI控制主机。
主要技术参数(标准版)
l 音频分析能力:16/64/128路
l 处理器:64位多核处理器*2
l 内存:32G/64G
l 硬盘容量:4T/6T/8T/10T
l 网口:千兆
l 网络协议:TCP/IP
l 额定功耗≤550W
l 工作温度5℃~40℃
l 尺寸(宽X高X深)443(宽)*87.6(高)*670mm(深)
2.2.4 AI控制主机

分析服务器分析出声音类型后,将信息上传至AI控制主机,报警主机进行报警显示,同时报警主机可实现实时点播、声音回放、报警提示、电子地图显示、记录查询、断线提示、系统管理、系统设置等功能。
2.2.5 世纪之星综合管理平台
1)主界面
包含树形分区展示设备列表、采用不同颜色显示设备状态(在线:绿色、离线:灰色、报警:红色)、以及在地图显示设备的位置和状态等。
2)电平显示(默认关闭)
单击主页面右侧“电平详情”按钮,可弹出电平显示框,查看所有设备的实时电平状态信息。

3)设备详情
右键点击设备列表中的设备名称或电子地图中的设备图标,单击设备详 情,可查看设备详情。

4)声音点播
右键点击设备列表中的设备名称并点击开始播放,可实时播放该设备现场拾取的声音(实时点播声音可基于所预置的降噪模型进行实时降噪)。

5)录音回放
右键点击设备列表中的设备名称并点击录音回放,可选择时间段进行播放或者暂停该设备在所选时间段的录音文件,并且基于所构建的预警学习模型对所触发预警录音段进行智能截取和分类,以便准确及时的掌握现场详情。

6)报表分析
报表分析具有报警数量统计(超过达到一定报警数量会以不同颜色展 示)、设备信息统计功能,支持导出及打印,不可删除及修改。

7)系统日志
对系统的所有操作进行自动记录,并生成系统日志,支持导出及打印, 不可删除及修改。
3. 系统连接图
