北京自主可控语音关键事件检测介绍

时间:2024年01月08日 来源:

    基于光流图检测模型输出的检测结果,确定关于目标防护舱的事件检测结果,可以包括以下步骤g21-g23:步骤g21:将至少包含当前帧图像的类图像确定为辅助图像;步骤g22:将辅助图像输入到预设的场景检测模型中,得到场景检测模型输出的检测结果;步骤g23:将场景图像检测模型输出的检测结果和光流图检测模型输出的检测结果进行融合计算,基于融合计算的结果,确定当前时刻,关于目标防护舱的事件检测结果。其中,关于类图像的相关描述内容、场景检测模型的相关描述内容、场景图像检测模型输出的检测结果和光流图检测模型输出的检测结果进行融合的融合过程等,可以参见上述的以第二类图像作为辅助图像时的相关描述内容。相对应上述本发明实施例提供的一种事件检测方法,本发明实施例还提供了一种事件检测装置。图6为本发明实施例提供的一种事件检测装置的结构示意图,如图6所示,该装置可以包括如下模块:图像获取模块610,用于实时获取关于目标防护舱的图像,并将当前时刻所采集到的图像作为当前帧图像;图像检测模块620,用于检测当前帧图像是否包含目标对象,其中,目标对象为:能够表征用户进入目标防护舱的用户身体部位;如果是,触发图像确定模块;图像确定模块630。智能语音质检都有什么功能?北京自主可控语音关键事件检测介绍

    通信接口用于上述电子设备与其他设备之间的通信。存储器可以包括随机存取存储器(randomaccessmemory,ram),也可以包括非易失性存储器(non-volatilememory,nvm),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。上述的处理器可以是通用处理器,包括处理器(centralprocessingunit,cpu)、网络处理器(networkprocessor,np)等;还可以是数字信号处理器(digitalsignalprocessing,dsp)、集成电路(applicationspecificintegratedcircuit,asic)、现场可编程门阵列(field-programmablegatearray,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。本发明实施例还提供了一种计算机可读存储介质,该计算机可读存储介质内存储有计算机程序,该计算机程序被处理器执行时实现上述本发明实施例提供的一种事件检测方法中的任一方法步骤。需要说明的是,在本文中,诸如和第二等之类的关系术语用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含。重庆新一代语音关键事件检测特征语音关键事件检测和摄像头有联系吗?欢迎来电咨询!

    300]的向量d,其中对于索引id从0至19999,每个id对应一个不同的汉字。那么对于一句话(长度为s)中的每一个字符,都可以在d中找到对应的id,从而获取对应的向量,因此可以得到一个维度为[s,300]的向量。然后可以使用双向lstm神经网络得到句子的语义表示向量w1。在本申请的示例性实施例中,通过bert模型获得语句的向量化语义表示w1可以包括:将语句直接输入所述bert模型,将所述bert模型的输出作为语句的向量化语义表示w1。在本申请的示例性实施例中,使用bert模型时,可以将句子直接输入至bert模型,bert模型的输出即可以作为句子的向量化语义表示w1。在本申请的示例性实施例中,所述向量化语义表示w1的维度可以为[s,d1];其中,当通过双向lstm网络获得语句的向量化语义表示w1时,d1为2*lstm隐层节点数;当通过bert模型获得语句的向量化语义表示w1时,d1=768。在本申请的示例性实施例中,设以上两种方法得到的语义表示为w1,则,1的维度为[s,d1],其中s为句子长度;如果使用双向lstm网络获得语句的向量化语义表示w1,则d1为2*lstm隐层节点数,如果使用bert模型获得语句的向量化语义表示w1,则d1=768。s102、对所述向量化语义表示w1进行span划分,得到多个语义片段。

    在本申请的示例性实施例中,所述对所述向量化语义表示w1进行span划分,得到多个语义片段可以包括:获取设定的span的大宽度max_span_width;根据span的宽度从1到max_span_width依次在所述向量化语义表示w1上进行选取,获得多个span的语义表示span_embedding。在本申请的示例性实施例中,可以根据设定的span的大宽度max_span_width=8对步骤s101得到的语义表示w1进行划分。划分方法可以包括:span的宽度从1至max_span_width依次在向量w1上进行选取,得到n个span的语义表示,即span_embedding。s103、对多个语义片段进行平均池化,得到每个span的表示w2。在本申请的示例性实施例中,因每个span的宽度不一样(span_embedding的维度可以为[sw,d1],其中sw取值为1~max_span_width),因此可以对这n个span的语义表示进行平均池化处理,从而得到这n个span的表示w2,w2的维度可以为[n,d1]。s104、使用自注意力机制对获得的每个span的表示w2进行计算,得到每个span的新的语义表示w3。在本申请的示例性实施例中,该自注意力机制可以为自注意力加权计算。在本申请的示例性实施例中,可以将步骤s103所得的span的表示w2通过自注意力机制(自注意力加权计算)计算得到新的表示w4。语音关键事件检测就找鱼亮科技,服务体系完善!

    本发明涉及语音关键事件检测技术,特别是涉及一种事件语音关键事件检测。背景技术:当前,很多银行通过设置语音关键事件检测防护舱来为用户提供更便捷的金融服务。所谓防护舱,是一种离行式或在行式的智能化金融服务设施,其具有完善的结构设计,可以实现智能化控制和远程监控,保障内部atm(automatictellermachine,自动柜员机)及其它金融服务设备全天候安全、以及可靠地运行。其中,离行式是指设置在银行营业网点之外的地方,例如,住宅小区、校园、地铁站等公共场所;在行式是指设置在银行营业网点中。可以理解的,当用户进入语音关键事件检测防护舱进行金融活动时,有些时候会出现倒地、剧烈运动、破坏设备等异常事件,例如,老人突然身体不适晕倒、有人抢夺用户的银行卡、有人恶意破坏设备等情况。为了保障用户的人身和财产安全,需要对用户在防护舱中出现的异常事件进行检测,以便于可以及时救治或报警。相关方案中,检测用户在语音关键事件检测防护舱内出现倒地事件的方案是:在防护舱的两侧面板上距离地面1米。这样,用户在进入到防护舱时,便进入到红外线发射器的感测范围内,进而,由于用户身体的遮挡。语音关键事件检测在哪些地区被大力推广?欢迎咨询!江西电子类语音关键事件检测介绍

智能语音质检都有什么功能?欢迎来电咨询!北京自主可控语音关键事件检测介绍

    用于将场景图像检测模型输出的检测结果和光流图检测模型输出的检测结果进行融合计算,基于融合计算的结果,确定关于目标防护舱的事件检测结果。可选的,一种具体实现方式中,上述结果确定单元包括:乘积计算子单元,用于根据场景图像检测模型和光流图检测模型的权重,计算场景图像检测模型输出的检测结果和场景图像检测模型的权重的乘积,并计算光流图检测模型输出的检测结果与光流图检测模型的权重的第二乘积;结果确定子单元,用于计算乘积和第二乘积的和值,基于和值,确定关于目标防护舱的事件监测结果。可选的,一种具体实现方式中,事件检测结果为:关于未发生异常事件的结果,或者,关于发生异常事件且所发生异常事件类型的结果。可选的,一种具体实现方式中,上述装置还包括:事件判断模块,用于当事件检测结果为关于发生异常事件且所发生异常事件类型的结果时,判断目标防护舱当前时刻发生的事件类型是否包括预设类型的事件;如果是,触发报警模块;报警模块,用于生成并发出与预设类型对应的报警信号。可选的,一种具体实现方式中,上述装置还包括:图像截取模块,用于当事件检测结果为关于发生异常事件且所发生异常事件类型的结果时,对当前帧图像进行截图。北京自主可控语音关键事件检测介绍

信息来源于互联网 本站不为信息真实性负责