开望杭州取得一种基于视频音频多模态

发布时间:2025/3/10 20:19:14   点击数:
白癜风治疗医院 http://ask.bdfyy999.com/

金融界年9月5日消息,天眼查知识产权信息显示,开望(杭州)科技有限公司取得一项名为“一种基于视频-音频多模态深度学习的多人跳绳分析方法“,授权公告号CNB,申请日期为年1月。

专利摘要显示,本发明公开了一种基于视频?音频多模态深度学习的多人跳绳分析方法,包括:获取跳绳过程的音像文件,并分离视频和音频,针对视频图像信号进行人像检测和提取,并对目标人像进行跟踪,提取目标人像的骨骼特征点坐标并进行预处理,获取单通道音频信号,将单通道音频信号进行切片和截取,并进行时频变换获得频谱信号和预处理,对预处理后的视频信号和音频信号融合得视频?音频融合信号,将视频?音频融合信号通过双向长短时记忆循环卷积神经网络和级联的全连接网络后,获得输出信号流并转化成方波信号,滤波后,对上升沿或下降沿进行统计分析。本发明能有效过滤非跳绳测试人员的干扰,做到更精确的跳绳统计分析。

本文源自:金融界

作者:情报员



欢迎转载,转载请注明原文网址:http://www.uvipmall.com/tsjj/145212.html
------分隔线----------------------------