声音处理核心技术

降噪处理

基于机器学习的实时降噪算法,通过数据驱动,训练神经网络进行降噪,可以针对特定物种声音进行语音增强,从嘈杂的自然背景声音中尽可能提取纯净的原始物种声音。

降噪前
播放
降噪后
播放

语音分离

基于深度学习的语音分离和识别技术,从声音的输入端到输出端的过程分离出多段语音,将分离出来的不同语音信号分别进行处理,识别,分析。

语音分离前
播放
分离语音1
播放
分离语音2
播放

声源定位

基于深度学习的语音分离和识别技术,从声音的输入端到输出端的过程分离出多段语音,将分离出来的不同语音信号分别进行处理,识别,分析。

视频处理核心技术

图像扫描

通过自研智能化扫描策略以及多模态物种识别算法,完成观测区域内全域的高精度物种识别以及实时数量统计。助力保护区实现自动化,常规化以及标准化的鸟类监测。

图像拼接

根据用户设定观测区域,自主完成网格划分、扫描路径规划、扫描时间计算以及能耗计算。轻量级实时拼接算法,扫描完成即可呈现扫描全景图以及鸟类分布热力图。

小目标检测

当我们查看采集素材时,仍旧存在很多由于距离原因导致的目标成像太小,进而导致漏检多的问题,对目标检测提出了更高的要求。百鸟在传统算法框架的基础上进行了优化,实现了对25*25dpi甚至更小目标的目标的检测。

处理前
处理后

生态算法

理论框架与关键任务
以《自然保护地适应性管理框架》,以生态特征为关键变量,打造基于多模态数据的生态分析算法,可以实现:

生态特征状态与变化趋势监测

威胁因子影响评估

管理活动执行进展管理与有效性评价与关键任务

百鸟数据库

音频数据库
1376
标记物种数(个)
2086 +
声音标记时长(小时)
246 万+
声音标记条数(条)
棕背伯劳
东方大苇莺
厚嘴苇莺
灰头麦鸡
视频数据库
针对视频的鸟类细粒度级联网络算法

行为模式自主学习技术可实现监测区域自动网格化轮巡

训练素材针对同种鸟类在换羽、迁徙过程体型变化等多种情况下的特征进行标注

可根据应用场景和实采数据循环优化

很大、很全的标准数据集

超过240万张特征标记帧

目标检测和细粒度识别数据集融合为一体

包含目标种全部可能的体型与外观

包括中国境内分布的700余种

融合物种的动作和视频信息