河北自主可控麦克风阵列特征

时间:2022年06月19日 来源:

    麦克风阵列波束形成,是对各阵元的输出进行时延或相位补偿、幅度加权处理,以形成指向特定方向的波束。在远场模型中,假设输入是一个平面波。设传播方向为θ,时域频率(弧度)为ω,声音在介质中的传播速度为c,对于在一个局部均匀的介质里传播的平面波,定义波束k为k=ωsinθ/c=2sinθ/λ,其中λ是对应于频率ω的波长。由于信号到达不同的传感器的时间不同,则阵列接收到的信号可表示为f(t)=[f(t-τ0)f(t-τ1)…f(t-τN-1)]T=[exp(jω(t-kτ0))exp(jω(t-kτ1))…exp(jω(t-kτN-1))]T其中τn为第n个阵元接收到的信号相对于参考点的时延,N为阵元个数,T表示转置。定义v(k)=[e-jωkτ0e-jωkτ1…e-jωkτN-1]T矢量v包含了阵列的空间特征,称为阵列流行矢量。则f(t)可表示为f(t)=ejωtv(k)。阵列处理器对一个平面波的响应为y(t,k)=HT(ω)v(k)ejωt其中H(ω)是滤波器系数向量的傅里叶变换。符号y(t,k)强调了输出和输入波数k的关系。时域上的相关性体现在输出是一个复指数,和输入平面波有相同的频率。在频域上式可表示为Y(ω,k)=HT(ω)v(k)。注意此处ω对应单一的输入频率,所以是窄带的。阵列的空时处理关系完全可以由上式的右端描述,称为阵列的频率-波数响应函数。阵列的维度、阵元的个数、阵元间距都会影响麦克风阵列定位算法的定位精度与运算速度。河北自主可控麦克风阵列特征

    翻译后的文字数据、声音数据通过文字或者音频的方式传递给用户;其特征在于:所述声音采集模块包括麦克风阵列、信号放大电路、带通滤波器、电源管理电路;所述麦克风阵列包括两个麦克风,两个麦克风之间的间隔设置为15mm;所述信号放大电路包括两级放大电路,其中一级放大电路设置在所述麦克风阵列与所述带通滤波器之间,二级放大电路设置在所述带通滤波器之后;所述带通滤波器包括由二阶低通电路、二阶高通电路组成,所述一级放大电路传入的声信号,经过所述带通滤波器滤波后,声信号通过所述二级放大电路进行放大,使滤波后的信号达到预设的电压范围;由所述麦克风阵列采集的声信号通过所述一级放大电路、所述带通滤波器、所述二级放大电路进行放大、工频滤波处理、放大升压处理后送入所述音频转换模块中进行数模转换;所述电压管理电路同时为所述声音采集模块、所述音频转换模块、所述语音增强模块供电;所述语音增强模块中通过预先植入的语音增强算法对所述音频转换模块传入的声信号进行增强处理;所述语音增强算法包括以下步骤:s1:定义所述麦克风阵列中与目标声源s1接近的麦克风为前向麦克风mic1,其采集到的声信号为m1(n),另一个麦克风mic2采集到的声信号为m2(n)。河北自主可控麦克风阵列特征立体阵列麦克风(3-DMicrophoneArray)真正实现全空间360度无损拾音解决了平面阵高俯仰角信号响应差的问题。

    麦克风阵列,是一组位于空间不同位置的全向麦克风按一定的形状规则布置形成的阵列,是对空间传播声音信号进行空间采样的一种装置,采集到的信号包含了其空间位置信息。根据声源和麦克风阵列之间距离的远近,可将阵列分为近场模型和远场模型。根据麦克风阵列的拓扑结构,则可分为线性阵列、平面阵列、体阵列等。(1)近场模型和远场模型声波是纵波,即媒质中质点沿传播方向运动的波。声波是一种振动波,声源发声振动后,声源四周的媒质跟着振动,声波随着媒质向四周扩散,所以是球面波。根据声源和麦克风阵列距离的远近,可将声场模型分为两种:近场模型和远场模型。近场模型将声波看成球面波,它考虑麦克风阵元接收信号间的幅度差;远场模型则将声波看成平面波,它忽略各阵元接收信号间的幅度差,近似认为各接收信号之间是简单的时延关系。显然远场模型是对实际模型的简化,极大地简化了处理难度。一般语音增强方法就是基于远场模型。近场模型和远场模型的划分没有的标准,一般认为声源离麦克风阵列中心参考点的距离远大于信号波长时为远场;反之,则为近场。设均匀线性阵列相邻阵元之间的距离(又称阵列孔径)为d,声源高频率语音的波长(即声源的小波长)为λmin。

    还有个重要的虚警率指标,稍微有点声音就乱识别也不行,另外还要考虑阈值的影响,这都是麦克风阵列技术中的陷阱。麦克风阵列的关键技术消费级的麦克风阵列主要面临环境噪声、房间混响、人声叠加、模型噪声、阵列结构等问题,若使用到语音识别场景,还要考虑针对语音识别的优化和匹配等问题。为了解决上述问题,特别是在消费领域的垂直场景应用环境中,关键技术就显得尤为重要。噪声抑制:语音识别倒不需要完全去除噪声,相对来说通话系统中需要的技术则是噪声去除。这里说的噪声一般指环境噪声,比如空调噪声,这类噪声通常不具有空间指向性,能量也不是特别大,不会掩盖正常的语音,只是影响了语音的清晰度和可懂度。这种方法不适合强噪声环境下的处理,但是应付日常场景的语音交互足够了。混响消除:混响在语音识别中是个蛮讨厌的因素,混响去除的效果很大程度影响了语音识别的效果。我们知道,当声源停止发声后,声波在房间内要经过多次反射和吸收,似乎若干个声波混合持续一段时间,这种现象叫做混响。混响会严重影响语音信号处理,比如互相关函数或者波束主瓣,降低测向精度。回声抵消:严格来说,这里不应该叫回声,应该叫“自噪声”。回声是混响的延伸概念。目前主流采用麦克风阵列+深度学习的方式来进行去混响。

    本实用新型涉及声学技术领域,具体而言,涉及一种便携式可视化麦克风阵列装置。背景技术:在某些隐蔽要求高的安保、安防等领域,对于中远距离声音获取途径的保密性要求很高。目前中远距离声音的获取主要依靠规模较大的麦克风阵列装置来获取,诸如申请公布号的发明专利,该设备的尺寸厚度较厚,携带不便,操作困难,很容易在安保安防中暴露设备的使用。技术实现要素:发明目的:本实用新型提供了一种便携式可视化麦克风阵列,旨在解决现有技术中麦克风阵列操作复杂,携带不便,容易暴露,隐蔽性差等问题。技术方案:为实现上述发明目的,本实用新型采用以下技术方案:一种便携式可视化麦克风阵列装置,包括包体,设置在包体内的印刷电路板、音频采集装置、视频采集装置、无线模块和供电装置,以及便携式操作终端;包体的正面设有一图像出孔,视频采集装置安装在印刷电路板上,且其镜头正对图像出孔,音频采集装置阵列式排布在印刷电路板上,无线模块分别与视频采集装置和音频采集装置电连接,供电装置为音频采集装置、视频采集装置和无线模块供电,便携式操作终端和无线模块无线电连接。可选的,印刷电路板上设有图像采集装置安装孔和声音出孔阵列。麦克风阵列发展趋势多传感器的融合。河北自主可控麦克风阵列特征

平面麦克风阵列实现平面360度等效拾音麦克风越多,语音增强和降噪效果越好用于智能音箱和交互机器人上。河北自主可控麦克风阵列特征

    实现噪声抑制、混响去除、人声干扰抑制、声源测向、声源、阵列增益等功能,进而提高语音信号处理质量,以提高真实环境下的语音识别率。事实上,靠麦克风阵列也很难保证语音识别率的指标。麦克风阵列还是物理入口,只是完成了物理世界的声音信号处理,得到了语音识别想要的声音,但是语音识别率却是在云端测试得到的结果,因此这两个系统必须匹配在一起才能得到好的效果。不如此,麦克风阵列处理信号的质量还无法定义标准。因为当前的语音识别基本都是深度学习训练的结果,而深度学习有个局限就是严重依赖于输入训练的样本库,若处理后的声音与样本库不匹配则识别效果也不会太好。从这个角度应该非常容易理解,物理世界的信号处理也并非越是纯净越好,而是越接近于训练样本库的特征越好,即便这个样本库的训练信号很差。显然,这是一个非常难于实现的过程,至少要声学处理和深度学习的两个团队配合才能做好这个事情,另外声学信号处理这个层次输出的信号特征对语义理解也非常重要。看来,小小的麦克风阵列还真的不是那么简单,为了更好地显示这种差别,我们测试了某语音识别引擎在单麦克风和四麦克风环形阵列的识别率对比。另外也要提醒,语音识别率并非只有一个WER指标。河北自主可控麦克风阵列特征

信息来源于互联网 本站不为信息真实性负责