【大学毕设全纪录】鸟类的声音识别·一

简介与目的

我的毕设项目主要是关于用鸟的声音来判断鸟的种类。研究鸟类鸣声有利于人们掌握其繁殖行为和生活习性等生命活动规律,从而更好地开发和利用经济鸟类,更有效保护濒危珍稀类。同时,鸟鸣声在野生动物监测、农林渔业驱赶害鸟、航空鸟撞以及旅游等方面也具有十分广阔的前景。此外,鸣声的研究还能用来解决鸟类的分类学问题,如对同一种的不同类群及不同种的亲缘关系进行分析和比较,并探讨新种形成的种系发生历史。(鸟类鸣声初探_吕琳娜)
鸟声识别的难点主要在于:一,音频中干扰过多,比如风雨声和其他鸟类的声音等;二,鸟与鸟种类之间的鸣声差别极其微小,人耳尚不能分别,对于计算机来说就更加困难了。
我做这个项目主要是想要比较神经网络的各种参数对鸟声识别准确度的影响,并不仅仅着眼于提高准确度,而在于分析为什么准确度会随着参数而改变,试图发觉神经网络的“潜力”。

项目计划

我将课题分为两部分,音频处理和神经网络。音频处理主要负责1.统一数据格式,2.降噪,尽可能的将音频中的无关信息剔除,如设备产生的噪音和背景噪音等,将无鸟声的部分从音频中减掉,并分片,统计从网站上下载下来的音频时长,确定初步训练集的大小, 3.提取音频特征,将音频转换为最大程度保留鸟声特征的图像,如频谱图(spectrogram)等,人工分析估计图像的效果。

一.音频处理

  1. 收集数据
    这里是我的数据来源: Xeno-canto.这是一个收集全球各地的鸟鸣声的网站,因为有提供api所以不需要爬虫。(数据是可以免费使用的)当然我还是写了一个菜的一批的脚本来下载文件,但太菜了我就不打在这儿了。
    因为Xeno是外网,国外的鸟鸣声比较多,所以我选择全英国的鸟类作为研究范围。(如果有时间我来看看中国的)全英国的鸟鸣声大概三万多条。我首先下载了一千多条做实验,最后拿准确率最高的神经网络来对三万条做测试。
    这里是音频较多且清晰度较高的20种鸟类:
评论 13
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值